XinWen无线 - XinWen.Mobi»XinWen无线 › 新闻 › 海量 ›

迈向智能体时代"第一步" DeepSeek-V3.1 发布 ...

日产讴歌福特极氪林肯阿尔法保时捷奔腾长城东风哈弗 Jeep 捷途岚图理想兰博基尼名爵马自达玛莎拉蒂欧拉奇瑞 smart 沙龙坦克特斯拉蔚来沃尔沃小鹏雪佛兰高合奥迪丰田本田雷克萨斯英菲尼迪捷达捷豹路虎阿斯顿马丁罗密欧标致宾利长安法拉利红旗几何凯迪拉克领克劳斯莱斯路特斯 MINI 迈凯伦哪吒起亚荣威三菱斯巴鲁腾势魏牌五菱现代雪铁龙宝骏大众宝马比亚迪

返回列表发新帖

迈向智能体时代"第一步" DeepSeek-V3.1 发布

[XinWen.Mobi 原创复制链接分享]

xinwen.mobi 发表于 2025-8-24 15:10:22 | 显示全部楼层 |阅读模式

▶ 语音朗读

2025年8月21日，DeepSeek正式发布DeepSeek-V3.1，官方称其为“迈向智能体时代第一步”。以下是关于DeepSeek-V3.1的详细介绍：模型架构与参数：DeepSeek-V3.1共有671B参数，激活参数37B，采用了混合推理架构，一个模型可同时支持推理模式和非推理模式，用户可通过官方App或网页端的“深度思考”按钮自由切换，在API接口中，deepseek - chat对应非思考模式，deepseek - reasoner对应思考模式，两者均支持128K上下文长度。性能提升：推理效率更高：经过思维链压缩训练，V3.1-Think在输出token数减少20%-50%的情况下，各项任务的平均表现与前代模型DeepSeek-R1-0528持平，且响应速度更快。配合128K的上下文扩展和FP8精度推理，V3.1在工程层面强化了吞吐效率与能耗表现。智能体能力更强：通过后训练优化，新模型在工具使用与智能体任务中的表现有较大提升。在代码修复和命令行任务等编程智能体场景中，能够在真实环境中完成多轮迭代修正，避免“越改越乱”的问题。在复杂搜索任务上，它可以规划搜索步骤、筛选证据并综合多源信息，在高难度的多学科题目测试中，性能已经远超前代模型。编程能力突出：在AiderPolyglot多语言编程测试中，DeepSeek-V3.1获得71.6%的高分，超越了Claude 4 Opus等模型。在SVGBench基准测试中，其性能仅次于GPT-4.1-mini，远超DeepSeek R1。多语言处理优化：DeepSeek-V3.1能处理超过100种语言，尤其对亚洲语言和资源较少语种的运用进行了优化。开源与生态：DeepSeek-V3.1的Base模型与后训练模型已在Hugging Face与魔搭平台开源，采用MIT许可证，允许商业使用与修改。此外，DeepSeek-V3.1增加了对Anthropic API格式的支持，用户可以轻松将DeepSeek-V3.1的能力接入其知名大模型Claude的编程框架。API价格调整：DeepSeek宣布从2025年9月6日凌晨起，对DeepSeek开放平台API接口调用价格进行调整并取消夜间时段优惠。调整后输入价格为缓存命中0.5元/百万tokens，缓存未命中4元/百万tokens；输出价格为12元/百万tokens。

模型, 推理, DeepSeek, 智能

		自动登录	找回密码
密码			立即注册

迈向智能体时代"第一步" DeepSeek-V3.1 发布 ...

迈向智能体时代"第一步" DeepSeek-V3.1 发布

相关帖子