DeepSeek系列模型正式上线昇腾社区：为自研MoE模型，671B 参数，激活37B

发布时间：2025-02-06 15:03:07 来源：快科技 游览：次

　　2月6日，今日，华为宣布，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区，支持一键获取DeepSeek系列模型，支持昇腾硬件平台上开箱即用。

　　据了解，DeepSeek-V3首个版本于2024年上线并同步开源，为自研MoE模型，671B 参数，激活37B，在14.8T token上进行了预训练。

　　据DeepSeek介绍，DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B 等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

　　以下以Deepseek-V3为例，演示在昇腾社区如何高效获取模型及使用

华为官宣！DeepSeek系列模型正式上线昇腾社区

　　一、硬件要求

　　部署DeepSeek-V3模型需配置4台Atlas 800I A2（8*64G）服务器资源

　　二、模型调用实践

　　1、权重转换

　　GPU：

华为官宣！DeepSeek系列模型正式上线昇腾社区

NPU：

华为官宣！DeepSeek系列模型正式上线昇腾社区

2、加载镜像

　　在昇腾社区/开发资源下载适配DeepSeek-V3的镜像包：

　　mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64

　　完成之后，请使用docker images命令确认查找具体镜像名称与标签。

华为官宣！DeepSeek系列模型正式上线昇腾社区

3、容器启动

　　提供的MindIE镜像预置了DeepSeek-V3模型推理脚本，从您信任的来源自行获取权重后，放置在从上述下载的模型代码的主目录下，修改模型文件夹属组为1001，执行权限为750，启动容器。

华为官宣！DeepSeek系列模型正式上线昇腾社区

4、服务化测试

　　配置服务化环境变量，expandable_segments-使能内存池扩展段功能，即虚拟内存特性。

华为官宣！DeepSeek系列模型正式上线昇腾社区

修改服务化参数

华为官宣！DeepSeek系列模型正式上线昇腾社区

拉起服务化

　　出现“Daemon start success!”，则认为服务成功启动。

华为官宣！DeepSeek系列模型正式上线昇腾社区

上一篇：微星幻影RTX 5080主机开售！自带13寸触控屏：到手29499元
下一篇：最后一页

猜您喜欢

微星幻影RTX 5080主机开售！自带13寸触控屏：到手29499元

日本Rapidus 4月开始试产2nm：预计将有200台以上设备搬入，确保4月1日按时开始试产

DeepSeek爆火的最大赢家

大摩为美国科技巨头打气：尽管DeepSeek的突破意义重大，但不会导致AI等领域资本崩溃

摩尔线程快速部署DeepSeek：全面支持DeepSeek V3、R1模型，以及新一代蒸馏模型的分布式部署

微软PowerToys新增神技能：包含多种实用功能，如窗口布局调整、快速截图等

GPU-Z升级正式支持RTX 50：包括对Hot Spot热点温度的调整

RTX 5090D、RTX 5080的首发评测大量高负荷测试，两个12VHPWR 16针电源线接口都被烧毁

曝NVIDIA GeForce RTX 5090显卡可使用3x8针电源线供电，性能会下降约5%

热点图片/ Hot picture

排行搒/ The total ranking

· 宽洋ThinkPower：20V超高速充电的移动电源

· ThinkPad绝配小红点快充移动电源99元抱走

· 骁龙8 Gen3这下稳了：全球首款“5.5G”基带产品，不仅仅用于手机

· 果粉福音，倍充移动电源充电速度提升6倍

· 华为智能视频存储1TB当3TB用最大可节省70%的存储空间

· 混搭大众高尔夫电动版与宽洋ThinkPower倍充移动电源

· 曾经播放器起家的联发科战胜了高通和苹果成为手端SoC性能的王者

· 樱桃XTRFY K5V2机械键盘上架开售：MX2A红轴和五面热升华PBT键帽，带有RGB背光

· 外媒称英伟达特供中国市场RTX 4090 即将推出符合规定的版本

· 索尼研发出HDD硬盘容量翻倍技术，3.5英寸HDD的容量可达到30TB

热点推荐/ Hot recommendation