找回密码
 立即注册
搜索
日产 讴歌 福特 极氪 林肯 阿尔法 保时捷 奔腾 长城 东风 哈弗 Jeep 捷途 岚图 理想 兰博基尼 名爵 马自达 玛莎拉蒂 欧拉 奇瑞 smart 沙龙 坦克 特斯拉 蔚来 沃尔沃 小鹏 雪佛兰 高合 奥迪 丰田 本田 雷克萨斯 英菲尼迪 捷达 捷豹路虎 阿斯顿 马丁 罗密欧 标致 宾利 长安 法拉利 红旗 几何 凯迪拉克 领克 劳斯莱斯 路特斯 MINI 迈凯伦 哪吒 起亚 荣威 三菱 斯巴鲁 腾势 魏牌 五菱 现代 雪铁龙 宝骏 大众 宝马 比亚迪

迈向智能体时代"第一步" DeepSeek-V3.1 发布

[XinWen.Mobi 原创复制链接分享]
xinwen.mobi 发表于 2025-8-24 15:10:22 | 显示全部楼层 |阅读模式
2025年8月21日,DeepSeek正式发布DeepSeek-V3.1,官方称其为“迈向智能体时代第一步”。以下是关于DeepSeek-V3.1的详细介绍:模型架构与参数:DeepSeek-V3.1共有671B参数,激活参数37B,采用了混合推理架构,一个模型可同时支持推理模式和非推理模式,用户可通过官方App或网页端的“深度思考”按钮自由切换,在API接口中,deepseek - chat对应非思考模式,deepseek - reasoner对应思考模式,两者均支持128K上下文长度。性能提升:    推理效率更高:经过思维链压缩训练,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与前代模型DeepSeek-R1-0528持平,且响应速度更快。配合128K的上下文扩展和FP8精度推理,V3.1在工程层面强化了吞吐效率与能耗表现。    智能体能力更强:通过后训练优化,新模型在工具使用与智能体任务中的表现有较大提升。在代码修复和命令行任务等编程智能体场景中,能够在真实环境中完成多轮迭代修正,避免“越改越乱”的问题。在复杂搜索任务上,它可以规划搜索步骤、筛选证据并综合多源信息,在高难度的多学科题目测试中,性能已经远超前代模型。    编程能力突出:在AiderPolyglot多语言编程测试中,DeepSeek-V3.1获得71.6%的高分,超越了Claude 4 Opus等模型。在SVGBench基准测试中,其性能仅次于GPT-4.1-mini,远超DeepSeek R1。    多语言处理优化:DeepSeek-V3.1能处理超过100种语言,尤其对亚洲语言和资源较少语种的运用进行了优化。开源与生态:DeepSeek-V3.1的Base模型与后训练模型已在Hugging Face与魔搭平台开源,采用MIT许可证,允许商业使用与修改。此外,DeepSeek-V3.1增加了对Anthropic API格式的支持,用户可以轻松将DeepSeek-V3.1的能力接入其知名大模型Claude的编程框架。API价格调整:DeepSeek宣布从2025年9月6日凌晨起,对DeepSeek开放平台API接口调用价格进行调整并取消夜间时段优惠。调整后输入价格为缓存命中0.5元/百万tokens,缓存未命中4元/百万tokens;输出价格为12元/百万tokens。
回复

使用道具 举报

日产 讴歌 福特 极氪 林肯 阿尔法 保时捷 奔腾 长城 东风 哈弗 Jeep 捷途 岚图 理想 兰博基尼 名爵 马自达 玛莎拉蒂 欧拉 奇瑞 smart 沙龙 坦克 特斯拉 蔚来 沃尔沃 小鹏 雪佛兰 高合 奥迪 丰田 本田 雷克萨斯 英菲尼迪 捷达 捷豹路虎 阿斯顿·马丁 罗密欧 标致 宾利 长安 法拉利 红旗 几何 凯迪拉克 领克 劳斯莱斯 路特斯 MINI 迈凯伦 哪吒 起亚 荣威 三菱 斯巴鲁 腾势 魏牌 五菱 现代 雪铁龙 宝骏 大众 宝马 比亚迪

QQ|标签|爬虫xml|爬虫txt|新闻魔笔科技XinWen.MoBi - 海量语音新闻! ( 粤ICP备2024355322号-1|粤公网安备44090202001230号 )

GMT+8, 2025-11-2 05:05 , Processed in 0.070625 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

消息来源网络

快速回复 返回顶部 返回列表