当前位置: 首页 > news >正文

rk3588的ai功能和deepseek

rk3588的ai功能

该型号cpu支持 6TOPS NPU、Mali-G610 MP4 GPU。

支持针对rk系列开发的RKNN框架,能够完成模型转换,量化,推理,性能评估,内存评估和量化分析功能。

 

TOPS是Tera Operations Per Second的缩写,1TOPS代表处理器每秒钟可进行一万亿次(10^12)操作。

GOPS(Giga Operations Per Second),MOPS(Million Operation Per Second)算力单位。1GOPS代表处理器每秒钟可进行十亿次(109)操作,1MOPS代表处理器每秒钟可进行一百万次(106)操作。

 

目前在其上面已有模型能够完成的工作有:图像分类(clip),图片语义分割(deeplabv3),文字转换语音(mms_tts),人像分割(ppseg),语音识别(whisper),人脸检测(retinaface),实时目标识别等(ppyoloe)等。

 

并支持 其他框架,如Caffe、TensorFlow、TensorFlow Lite、ONNX、DarkNet、PyTorch产生的模型转换为rknn模型。

 

 

deepseek R1

R1采用三阶段训练策略

  1. 基础阶段:1.2T tokens的多语言文本(中英为主)基于冷启动数据,进行有监督微调
  2. 强化阶段:加入300B tokens的代码/数学专项数据
  3. 对齐阶段:使用RLHF优化10B条人类反馈数据

R1引入多目标奖励模型,同时优化:

  • 事实准确性(0.85权重)
  • 逻辑一致性(0.75权重)
  • 有害内容抑制(0.9权重)

混合专家系统(MoE)通过动态路由机制将输入分配值不同专家子网络。包含128个专家模块,每个模块参数量为2.3B,总参数量达294B(激活参数量37B

通过量化压缩技术(如4bit量化)保持较高精度。

 

R1引入滑动窗口注意力(SWA),将全局注意力分解为局部窗口(512 tokens)和稀疏全局连接,使长文本处理效率提升3倍。

R1微调要点

  • 仅需更新路由网络和领域专家(约12B参数)
  • 使用LoRA技术可将显存占用从120GB降至32GB

 

deepseekV3

V3训练策略

V3则通过连续预训练在2.8T tokens的单一语料上完成训练,数据分布更均匀但缺乏领域强化。

 

V3仅使用单一准确性奖励函数,导致在复杂推理场景下表现较弱。

 

DeepSeek-V3采用稠密Transformer架构,参数量固定为67B,通过深度扩展(128层)提升模型容量。

V3则沿用传统多头注意力,通过扩大上下文窗口(32K tokens)提升长文本能力。

V3微调要点

  • 必须全参数微调(67B参数)
  • 建议使用ZeRO-3优化器分阶段训练



http://www.hskmm.com/?act=detail&tid=13138

相关文章:

  • EPSON L1300打印机清零教程
  • 「线性代数」矩阵运算与初等变换
  • 移动号码线上复机
  • Uni-App 使用android studio打包最新教程
  • tomcat CPU数量和线程数的关系
  • NASA运货飞船天鹅座再次推迟,航天任务为什么总是“彩排”不断
  • Centos系统切换为光盘本地源
  • 基于Hilbert-Huang变换(HHT)的模态分解与瞬时频率计算
  • NIO
  • python处理Excel单机小程序:匹数据,增强版VLookup
  • var sql 的不同用法
  • CF623B Array GCD
  • Python爬虫实现双色球历史数据抓取
  • 酵母细胞工厂全球调控策略研究进展:从遗传编辑到智能响应
  • Avalonia 根据绑定的数据类型动态选择模板
  • PyTorch图神经网络(一)
  • Python版Sigstore稳定版发布:软件供应链签名新标准
  • 网速带宽概念
  • 跨网传输软件:打通数据孤岛,保障安全流通!
  • 「KDOI-07」能量场
  • 基于LQR控制器的柔性机械臂抑振
  • 202507_QQ_caidundun
  • 国内企业邓白氏编码免费申请流程
  • 在CodeBolcks下wxSmith的C++编程教程——wxSmith教程目录(序言)
  • 生命周期
  • CF1893D Colorful Constructive 题解
  • C#通过15位或者18位身份证判断性别年龄
  • 深入解析:​​XMedia Recode 全能视频音频转换与编辑工具
  • MySQL同步ES的 5 种方案
  • 如何支持高并发高吞吐量编程