文章列表

站点导航

本站资源的综合导航,包含我正在开发的活跃项目如OpenJudger 算法竞赛信息接口,文章分类归档,以及已不再是开发重点的项目存档。把资源聚合在一起方便大家查找,免除翻文章的烦恼。

Blossom Data – 面向大模型的数据处理框架

BlossomData 是面向大模型训练数据的一体化数据处理框架,通过 Schema 显式建模数据结构,用 Dataset + Operator 搭建可组合、可复用的数据流水线,内置翻译、合成、蒸馏、验证等常用算子,并支持 Local / Ray / Spark 多种执行后端。

工程师如何用好Coding Agent

Coding Agent 越来越能端到端推进工程任务,但结果质量仍取决于人的任务设计、上下文管理、边界设定和验收能力。本文总结工程师如何从写提示词转向设计任务,并通过 Harness、验证、复盘和 skill 管理,让 Agent 真正成为可靠的工程杠杆。

Blossom5 – 高性能开源大语言模型

介绍 Blossom是一个开源的对话式大型语言模型,旨在提供高质量的自然语言理解和生成能力,实现通用人工智能,以支持各种应用。除了模型权重之外,还发布了SFT数据,以便开发人员基于此进行进一步的研究和开发。自2023年7月推出第一代以来,B...

大白话的ChatGPT Prompt编写指南

我想写一篇尽可能通俗易懂的大语言模型调教指南,让即使第一次接触LLM的非技术人员也能学会如何恰当的使用它。 然而,在写这句话的时候我就犯愁了,因为我遇到的第一个问题就是:应该如何介绍”什么是大语言模型?什么是prompt?&#8...

手动为WSL2安装Ubuntu实例

前言 WSL(Windows Subsystem for Linux)是Windows推出的Linux子系统环境,旨在让开发人员直接在 Windows 上按原样运行 GNU/Linux 环境,且不会产生传统虚拟机或双启动设置开销。 WSL1...