当前位置: 首页 > news >正文

【项目复现上新】Karpathy大神开源GitHub高分项目NanoChat!仅用100美元+8000行代码手搓ChatGPT

The best ChatGPT that $100 can buy.

10 月 13 日,AI 领域大神 AndrejKarpathy 发布了自己的最新开源项目。截至当前,​GitHub 项目上已经达到 29.1KStar​。
image.png

nanochat 是什么

nanochat 是 AI 领域专家 AndrejKarpathy 发布的开源项目,该项目包含从数据准备、预训练、中期训练、监督微调(SFT)、强化学习(RL)到推理部署的完整流程,约​8000 行代码​,其以极低成本和高效流程训练小型语言模型,​实现类似ChatGPT 的对话功能​。

AndrejKarpathy 表示,像 nanochat 这样的模型训练成本大概在 100 到 1000 美元之间,而 100 美元级别的模型的参数量只有GPT-3 的千分之一,只需使用 8​​张H100GPU 训练不到 4 小时​,就可以训练出一个能够写故事/诗歌、回答简单问题的模型。

如果将预算增加到​1000 美元​,只需要训练约41.6 小时就能使模型性显著提升,能解决简单数学/代码问题并参与多项选择题测试。
image.png
GitHub 链接​:

https://github.com/karpathy/nanochat

Lab4AI 链接​:

https://www.lab4ai.cn/project/detail?utm_source=jssq_&id=f19f6e05f51a454d82383cc1ba250dde&type=project
| nanochat 的主要功能

虽然代码量只有8000 行,但是它也实现了以下功能:

全新Rust 分词器(Tokenizer)训练​:使用Rust 语言实现训练分词器;

在FineWeb 数据集上预训练​:在FineWeb 数据集上对 Transformer 架构的大语言模型进行预训练,并在多个指标上评估 CORE 分数;

中期训练​:在SmolTalk 用户-助手对话数据集、多项选择题数据集、工具使用数据集上进行中期训练;

监督微调(SFT)​:在世界知识多项选择题数据集(ARC-E/C、MMLU)、数学数据集(GSM8K)、代码数据集(HumanEval)上进行监督微调;

强化学习(RL)优化​:使用“GRPO”算法在 GSM8K 数据集上对模型进行强化学习微调;

高效推理引擎​:实现高效模型推理,支持KV 缓存、简易预填充/解码流程、工具使用(轻量级沙箱环境中的 Python 解释器),并通过 CLI 或类 ChatGPT 的 WebUI 与模型交互;
自动训练总结​:生成单一的Markdown 格式报告卡,总结整个训练推理流程,并以“游戏化”形式展示结果。

一键复现

过去提到LLM 训练,人们脑海里浮现的是动辄上百万美元的算力成本、庞大的研发团队和海量的数据储备,这让个人开发者和中小型团队望而却步;

而nanochat 不仅将​成本压缩至100 美元​,大模型实验室Lab4AI 更通过​“一键体验”模式​,让这个几乎人人可承担的价格真正转化为“人人可操作”的尝试,不再需要纠结环境配置、流程调试,普通人跟着指引就能亲手搭建属于自己的简易版 ChatGPT,这种“​低门槛​+ 易操作”的组合,也恰好解决了学习者“纸上谈兵”的痛点——以往看过无数教程却仍不知全流程如何落地,

如今大模型实验室Lab4AI 推出的 nanochat 体验项目“100 美元实现自己的 ChatGPT”。

提供从数据准备到推理服务的“​一键式”全流程工具链​,学习者​不用再为环境搭建、代码调试耗费精力​,只需跟着引导逐步操作,就能直观感受模型训练的每一个环节,让“无从下手”变成“步步有迹可循”。
image.png
Step1:登录 Lab4AI.cn。

在“项目复现”中找到“​AI 大神 Karpathy 开源 GitHub 高分项目 NanoChat-100 美元手搓 ChatGPT​”。

项目内已经提供完整的复现NanoChat 的全流程代码和环境,您只需配置 8 卡,即可手搓 ChatGPT。
image.png
Step2:环境激活。

系统内已经预置可用的conda 虚拟环境,此环境可满足后续步骤的需要。您只需执行下列脚本安装 Rust/Cargo。
image.png
Step3:模型训练

本次复现中,我们将训练分为pretrain、midtrain 和 SFT 三个阶段。pretrain 阶段约需要 2.5-3 小时,midtrain 阶段约耗时 30 分钟内。

下方为训练时各卡的工作状态。从图中看,8 块 NVIDIAH10080GB 显卡已经全部运行中,几乎吃满了所有的 GPU 算力。

您可以通过监控这些指标,亲眼看到模型是如何被“训练”出来的。
image.png
Step4:模型评估。

每个训练阶段有相应的评估程序输出结构化评估结果。

以下是本次实践的pretrain 后的评估结果,从结果得知:​模型初步掌握了世界运作的基本逻辑​。PIQA(物理互动问答):61.26%,表明模型已经初步掌握了世界运作的基本逻辑。COPA(因果推理):54.00%,表明模型开始具备初步的因果判断能力。Winograd(指代消解):56.04%,表明模型能处理一些简单的句法歧义。

当​面对复杂推理的阅读理解任务能力很弱​。ARCEasy(基础科学问答):45.50%,表明模型掌握了一些基础的科学知识,但还不够牢固。ARCChallenge(挑战科学问答):26.79%,表明模型缺乏深度的、学科性的知识。

面对知识密集型与复杂逻辑任务时,模型表现出了短板​。
Jeopardy!(知识问答):0.90%,

SQuAD(阅读理解):1.59%,

CoQA(对话式问答):4.31%,

OpenBookQA(开卷问答):26.40%。
image.png
Step5:部署推理。

训练完成的模型支持如下两种推理方式:通过命令行的方式进行推理;通过WebUI 的方式进行推理。

(1)通过命令行对话,执行后即可在下方看到推理内容。

image.png
(2)通过WebUI 执行对话。执行代码后,鼠标滑过右上角的【对外服务】,将链接复制到浏览器,打开后即可对话。
image.png

Lab4AI 支撑从研究到落地

Lab4AI 提供除了一键复现之外,还提供更多的价值:

1. 如果你是科研党

每日更新Arxiv 上的论文,支持翻译、导读、分析,帮你快速跟进前沿研究;还能一键复现其他大模型;若你有自己的数据集,能直接在平台上进行代码微调,平台还支持使用 LLaMA-Factory 进行 WebUI 微调大模型,甚至对接投资孵化资源,把科研创意变成落地成果。
image.png
image.png
image.png
2.如果你是学习者

如果你想掌握大模型相关技能,Lab4AI 的优势更明显:​Lab4AI 提供多种在线课程​,更有LLaMA Factory 官方合作课程,让您理论学习和代码实战同时进行。LLaMA Factory 官方合作课程课程聚焦于当下最受欢迎的LLaMA Factory 框架,带您从理论到实践,一站式掌握大模型定制化的核心技能,课程还送 300 元算力、完课证书。
image.png

http://www.hskmm.com/?act=detail&tid=36505

相关文章:

  • CF2159E
  • 2025年10月景区钢丝绳护栏厂家全景解析报告,基于专业测评的技术、性能及市场优势深度分析
  • 技术 | 在单台电脑上管理多个 GitHub 账户并解决推送问题(测试中)
  • Stable Diffusion启动提示端口错误处理
  • 阿里云API网关日志问题
  • 2025年10月半封闭滑轨丝杆模组厂家全景解析报告,基于专业测评的技术、性能及市场优势深度分析
  • ipad协议对个人微信机器人进行二次开发
  • 西安交通大学国家级医学公关交叉平台实验室建设实拍图
  • 小程序-定义头部导航
  • 2025年10月简易丝杆模组定制厂家全景解析报告,基于专业测评的技术、性能及市场优势深度分析
  • 2025年10月智能门窗代理厂家全景解析报告,基于专业测评的技术、性能及市场优势深度分析
  • Android插件化框架
  • 2025 年烧结砖厂家最新推荐榜单权威发布:四川蜀陶领衔企业,全方位解决采购难题,为建筑项目保驾护航铺地砖/劈开砖/陶土窗花/古建筑砖瓦厂家推荐
  • Java使用Graphics2D绘图在图片插入中文字符放到Linux上面运行时图片中的中文会变成方框或乱码的问题
  • 2025年最新喷码机厂家推荐榜:激光/UV/手持喷码机十大品牌全解析
  • Golang的 cron 库
  • 实用指南:Linux 如何创建和计数套接字
  • 中小企业如何低成本部署电话呼叫软件网页版?一步步教你做
  • 别再手写过滤器!SpringCloud Gateway 内置30 个,少写 80% 重复代码
  • 记一次 .NET 某药品缺陷高速检测系统 卡慢分析
  • 0254-CLAP-参数默认值
  • 得物火山引擎:Data Agent驱动财务管理智能升级
  • WPF/C#:使用Stylet中的IWindowManager用于显示等待窗体、对话框与消息框
  • Flask笔记
  • 0253-CLAP-统计参数出现次数
  • 《Vuejs设计与实现》第 18 章(同构渲染)(上) - 详解
  • 配置git
  • 01-C程序设计语言-第2版-第1章导言笔记
  • 0252-CLAP-标记类型的参数
  • 记录我适配iOS26遇到的一些问题