据了解,DeepSeek-V3首个版本于2024年上线并同步开源,为自研MoE模型,671B 参数,激活37B,在14.8T token上进行了预训练。
据DeepSeek介绍,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
以下以Deepseek-V3为例,演示在昇腾社区如何高效获取模型及使用

一、硬件要求
部署DeepSeek-V3模型需配置4台Atlas 800I A2(8*64G)服务器资源
二、模型调用实践
1、权重转换
GPU:

NPU:

2、加载镜像
在昇腾社区/开发资源下载适配DeepSeek-V3的镜像包:
mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64
完成之后,请使用docker images命令确认查找具体镜像名称与标签。

3、容器启动
提供的MindIE镜像预置了DeepSeek-V3模型推理脚本,从您信任的来源自行获取权重后,放置在从上述下载的模型代码的主目录下,修改模型文件夹属组为1001,执行权限为750,启动容器。


4、服务化测试
配置服务化环境变量,expandable_segments-使能内存池扩展段功能,即虚拟内存特性。

修改服务化参数

拉起服务化
出现“Daemon start success!”,则认为服务成功启动。

微星幻影RTX 5080主机开售!自带13寸触控屏:到手29499元
日本Rapidus 4月开始试产2nm:预计将有200台以上设备搬入,确保4月1日按时开始试产
DeepSeek爆火的最大赢家
大摩为美国科技巨头打气:尽管DeepSeek的突破意义重大,但不会导致AI等领域资本崩溃
摩尔线程快速部署DeepSeek:全面支持DeepSeek V3、R1模型,以及新一代蒸馏模型的分布式部署
微软PowerToys新增神技能:包含多种实用功能,如窗口布局调整、快速截图等
GPU-Z升级正式支持RTX 50:包括对Hot Spot热点温度的调整
RTX 5090D、RTX 5080的首发评测大量高负荷测试,两个12VHPWR 16针电源线接口都被烧毁
曝NVIDIA GeForce RTX 5090显卡可使用3x8针电源线供电,性能会下降约5%



