“蒸馏模型”超越原创?美国要对“DeepSeek”下手

银柿财经 小柿 2025-01-31 04:12:47

DeepSeek尚未予以回应。

1月29日,OpenAI最新称,它发现有证据表明中国人工智能初创公司DeepSeek使用其专有模型来训练自己的开源模型,并暗示这可能违反了OpenAI的服务条款。但OpenAI没有进一步列举哪些证据。OpenAI的服务条款规定,用户不能“复制”其任何服务或“使用其输出来开发与OpenAI竞争的模型”。

与Meta的Llama开源模型可免费使用不同,OpenAI的模型系统是封闭的,但个人用户仍可付费接入其编程接口(API)获取数据。DeepSeek尚未予以回应。

此前,美国政府称正在组织专家紧急评估DeepSeek的技术及影响。美国白宫AI和加密货币事务负责人大卫·萨克斯(DavidSacks)表示,未来几个月,美国领先的人工智能公司将采取措施,试图防止其他公司对“蒸馏技术”的获取。

DeepSeek模型取得的技术突破已经引起美国总统特朗普的关注。特朗普周一表示,DeepSeek这款中国AI应用程序应该成为美国公司的“激励因素”,他表示:“如果中国业界能够开发出更便宜的人工智能技术,美国公司也会效仿。你不必花费数十亿美元,而是花更少的钱,希望找到相同的解决方案。”

数据蒸馏是一种业内常见的技术做法,是指通过一系列算法和策略,将原始的、复杂的数据进行去噪、降维、提炼等操作,从而得到更为精炼、有用的数据。数据蒸馏的目的是将复杂模型的知识提炼到简单模型。

据DeepSeek-V3的技术文档,该模型使用数据蒸馏技术生成的高质量数据提升了训练效率。通过已有的高质量模型来合成少量高质量数据,作为新模型的训练数据,从而达到接近于在原始数据上训练的效果。

“以前的大模型训练相当于使用题海战术,在大量的数据中训练。而蒸馏就相当于让在题海战术里磨练过的优秀大模型充当新模型的老师,筛选出有效题目,再让新的大模型训练。”一位计算机研究人员这样解释。

不过此前有学者认为,蒸馏技术存在“隐性天花板”,它虽然可以提高模型训练效率,但借此开发的模型无法超越基础模型的能力,当考虑到需要将能力扩展到新领域或应对以前从未见过的挑战时,这种限制就愈发成为问题;而且这种技术在多模态数据方面效果不好。

实时要闻
更多
2025-01-30 19:47
特斯拉去年净利润下降53%
2025-01-30 19:41
美国两机相撞坠河事故 超过30具遇难者遗体被找到
2025-01-30 13:14
美国客机和军机相撞事故已致至少18人死亡
2025-01-30 12:29
两部门:加强和规范村级会计委托代理服务工作
2025-01-30 12:16
与军机相撞,美国一架载有约60人的客机坠毁
2025-01-30 11:21
台湾嘉义县发生5.2级地震,福建多地有震感
2025-01-30 11:08
破26亿!2025春节档电影总票房再创新高
2025-01-30 10:50
2024年我国票据市场承兑贴现规模稳步增长
2025-01-30 10:46
出现飞机相关紧急事件,美国首都里根国家机场暂时关闭
2025-01-30 09:39
痛心!2名中国公民在南苏丹坠机事故中遇难
2025-01-30 09:37
特朗普就“封口费”案判决提起上诉
2025-01-30 09:36
美联储维持联邦基金利率目标区间不变
2025-01-29 17:06
B站公布春晚直播数据:观看人数超1亿,直播弹幕数超过1.2亿
2025-01-29 12:46
小红书公布春晚“成绩单”:总互动量超14亿
2025-01-29 12:45
360宣布无偿为DeepSeek提供安全服务 开通“DeepSeek高速专线”
2025-01-29 10:55
蛇年春晚收视创纪录 新媒体端直点播收视次数28.17亿次
2025-01-29 10:53
我国首个超深水气田“深海一号”累计生产天然气超100亿立方米
2025-01-29 10:52
Intel将至强6处理器降价30%
2025-01-29 10:51
FF第二轮3000万美元融资全部到账
2025-01-28 14:14
虎扑同意作价5亿被迅雷收购
2025-01-30 19:47
特斯拉去年净利润下降53%
2025-01-30 19:41
美国两机相撞坠河事故 超过30具遇难者遗体被找到
2025-01-30 13:14
美国客机和军机相撞事故已致至少18人死亡
2025-01-30 12:29
两部门:加强和规范村级会计委托代理服务工作
2025-01-30 12:16
与军机相撞,美国一架载有约60人的客机坠毁
2025-01-30 11:21
台湾嘉义县发生5.2级地震,福建多地有震感
2025-01-30 11:08
破26亿!2025春节档电影总票房再创新高
2025-01-30 10:50
2024年我国票据市场承兑贴现规模稳步增长
2025-01-30 10:46
出现飞机相关紧急事件,美国首都里根国家机场暂时关闭
2025-01-30 09:39
痛心!2名中国公民在南苏丹坠机事故中遇难
2025-01-30 09:37
特朗普就“封口费”案判决提起上诉
2025-01-30 09:36
美联储维持联邦基金利率目标区间不变
2025-01-29 17:06
B站公布春晚直播数据:观看人数超1亿,直播弹幕数超过1.2亿
2025-01-29 12:46
小红书公布春晚“成绩单”:总互动量超14亿
2025-01-29 12:45
360宣布无偿为DeepSeek提供安全服务 开通“DeepSeek高速专线”
2025-01-29 10:55
蛇年春晚收视创纪录 新媒体端直点播收视次数28.17亿次
2025-01-29 10:53
我国首个超深水气田“深海一号”累计生产天然气超100亿立方米
2025-01-29 10:52
Intel将至强6处理器降价30%
2025-01-29 10:51
FF第二轮3000万美元融资全部到账
2025-01-28 14:14
虎扑同意作价5亿被迅雷收购
热门文章
日排行 周排行
360宣布无偿为DeepSeek提供安全服务 开通“DeepSeek高速专线”
银柿财经 01-29
1
被国产大模型DeepSeek超越,ChatGPT表示:排名变化也许是暂时的
银柿财经 01-27
2
DeepSeek回应再次“宕机”原因:可能和服务维护、请求限制等因素有关
银柿财经 01-27
3
周鸿祎免费送100辆新能源车,活动预计持续一年
银柿财经 01-26
4
新基速递 |鹏华添和30天持有期债券:固定收益类资产的稳健配置
银柿财经 01-30
5
2025年春节档电影票房突破20亿元
银柿财经 01-29
6
深交所2025年交易日历 春节、国庆各休8天
银柿财经 01-28
7
AMC加速纾困房地产 融创北京重庆豪宅项目“回血”
银柿财经 01-27
8
四只银行股连续获险资举牌,增量资金或持续流入
银柿财经 01-31
9
中国华侨历史博物馆新设两家分馆
银柿财经 01-30
10