快讯网首页 |资讯 |财经 |娱乐 |汽车 |时尚 |房产 |健康 |数码 |社会 |图片 |消费 |大盘 |互联网金融 |新车 |试驾 |化妆品 |奢侈品 |二手房 |两性 |曝光台

您现在的位置: 首页 > 数码 > 硬件 >

DeepSeek-R1，正在接受全球网友真金白银的检验

发布时间：2025-01-23 16:47:51 来源：快科技 游览：次

　　1月23日，DeepSeek-R1，正在接受全球网友真金白银的检验。

　　花30秒用manim代码制作解释勾股定理的动画，一次完成无错误。

最壕的DeepSeek玩家：10多万元8台Mac、显存达496GB

　　为了玩上这样的模型，有人花上10多万元，组7台M4 Pro Mac mini+1台M4 Max Macbook Pro的家用超算。

最壕的DeepSeek玩家：10多万元8台Mac、显存达496GB

　　总计496G显存（64*7+48），才能跑起个4bit量化版，但属实算得上“家用AGI”配置了。

最壕的DeepSeek玩家：10多万元8台Mac、显存达496GB

　　另一个极端是选择R1数据蒸馏版Qwen 1.5B小模型，小到浏览器就能跑，每秒能输出60个tokens。

最壕的DeepSeek玩家：10多万元8台Mac、显存达496GB

　　与此同时，各种榜单也在抓紧测试，纷纷跑出了结果。

　　R1正横扫各大榜单。

　　首先是LiveBench，与LiveCodeBench一样，题目是随时间更新的，所以相对受认可。

　　R1的表现在o1-preview到o1之间，其中只有数据一项超过o1。

最壕的DeepSeek玩家：10多万元8台Mac、显存达496GB

　　不过再带上成本成本约1/30这个条件看，又是不一样的感觉，给老哥整无语了。

　　唯一的抱怨是上下文窗口太短。

最壕的DeepSeek玩家：10多万元8台Mac、显存达496GB

　　o1系列一战成名的ARC-AGI，测试结果分为公开数据和私有数据两部分。

　　DeepSeek R1在私有数据上解决了15.8%的问题，与DeepSeek-V3相比翻倍还多。

　　公开数据上更是解决了20.5%的问题，与DeepSeek-V3相比上涨约46%。

最壕的DeepSeek玩家：10多万元8台Mac、显存达496GB

　　总的来看，DeepSeek-R1表现与o1-preview相近，但稍低。

最壕的DeepSeek玩家：10多万元8台Mac、显存达496GB

　　但同样，带上几毛钱就能解决一道题，o1系列至少要10块钱这个背景来看，又是不一样的感觉。

最壕的DeepSeek玩家：10多万元8台Mac、显存达496GB

　　考验任务规划能力的PlanBench，同样的剧本再次上演。

最壕的DeepSeek玩家：10多万元8台Mac、显存达496GB

　　在开发者Xeophon自己的个人测试上，甚至超过了o1-preview。

最壕的DeepSeek玩家：10多万元8台Mac、显存达496GB

　　同一个测试上，R1数据蒸馏的Qwen 32B，与DeepSeek-V3，GPT-4o和Gemini Flash处于同一水平。

最壕的DeepSeek玩家：10多万元8台Mac、显存达496GB

　　最后，还有人从中看到新的创业机会。

　　谁来构建一个平台，能轻松地在DeepSeek R1上进行OpenAI风格的强化微调。

　　至少在短期内，是一个巨大的机会。

　　R1在正确数据和微调方法下，可能在特定任务上大幅提升。

最壕的DeepSeek玩家：10多万元8台Mac、显存达496GB

参考链接：

　　[1]https://x.com/alexocheema/status/1881561143736664180

　　[2]https://x.com/reach_vb/status/1881809400995934640

　　[3]https://livebench.ai/#/[2]https://x.com/arcprize/status/1881761987090325517

　　[4]https://x.com/TheXeophon/status/1881443117787984265

上一篇：三星计划在2025年大幅削减其晶圆代工部门的投资规模，设备投资预算削减幅度达到50%
下一篇：最后一页

猜您喜欢

三星计划在2025年大幅削减其晶圆代工部门的投资规模，设备投资预算削减幅度达到50%

三星计划在2025年大幅削减其晶圆代工部门的投资规模，设备投资预算削减幅度达到50%

5.6Tbps DDoS攻击刷新世界记录！被成功防下来了

5.6Tbps DDoS攻击刷新世界记录！被成功防下来了

华硕与AdGuard达成合作：支持Wi-Fi 7的路由器中内置AdGuard DNS服务

华硕与AdGuard达成合作：支持Wi-Fi 7的路由器中内置AdGuard DNS服务

高通骁龙8 Elite 2将继续由台积电代工：将支持ARM的SME指令集

高通骁龙8 Elite 2将继续由台积电代工：将支持ARM的SME指令集

希捷推出Exos M 36TB：Exos M 3+平台，实现每TB功耗减少60%的卓越能效

希捷推出Exos M 36TB：Exos M 3+平台，实现每TB功耗减少60%的卓越能效

三星电子的第六代10纳米级1c DRAM制程开发进度出现延迟

三星电子的第六代10纳米级1c DRAM制程开发进度出现延迟

玄派P2系列鼠标发布：全系内置500mAh电池，支持有线、2.4G无线和蓝牙三模连接

玄派P2系列鼠标发布：全系内置500mAh电池，支持有线、2.4G无线和蓝牙三模连接

华硕推出TX GAMING B860M WIFI天选主板，首发到手价为1419元

华硕推出TX GAMING B860M WIFI天选主板，首发到手价为1419元

量产卷轴屏笔电登场，英特尔、AMD、英伟达以及高通等厂商相继公布全新的产品

量产卷轴屏笔电登场，英特尔、AMD、英伟达以及高通等厂商相继公布全新的产品

热点图片/ Hot picture

排行搒/ The total ranking

· 宽洋ThinkPower：20V超高速充电的移动电源

· ThinkPad绝配小红点快充移动电源99元抱走

· 骁龙8 Gen3这下稳了：全球首款“5.5G”基带产品，不仅仅用于手机

· 果粉福音，倍充移动电源充电速度提升6倍

· 华为智能视频存储1TB当3TB用最大可节省70%的存储空间

· 混搭大众高尔夫电动版与宽洋ThinkPower倍充移动电源

· 曾经播放器起家的联发科战胜了高通和苹果成为手端SoC性能的王者

· 樱桃XTRFY K5V2机械键盘上架开售：MX2A红轴和五面热升华PBT键帽，带有RGB背光

· 外媒称英伟达特供中国市场RTX 4090 即将推出符合规定的版本

· 索尼研发出HDD硬盘容量翻倍技术，3.5英寸HDD的容量可达到30TB

热点推荐/ Hot recommendation

Copyright © 2012-2025 www.kxnews.cn, All Rights Reserved 版权所有：快讯网冀ICP备08108040号冀公网安备 13108202000311号
欢迎广大网友来本网站投稿，网站内容来自于互联网或网友提供邮箱：jU6RR2GMQ1@outlook.com