当前位置:首页 > 实时热点 > 正文内容

DeepSeek-V3.1正式发布 新版本效率大幅提升

6天前实时热点26

  DeepSeek用户期待的R2模型尚未到来,但V3.1版本已经发布。8月21日,DeepSeek官方公众号宣布最新大语言模型DeepSeek-V3.1正式上线,距离上一个版本DeepSeek-V3-0324已有五个月。

  

  新版本在三个方面进行了升级:混合推理架构、更高的思考效率以及更强的Agent能力。从命名来看,DeepSeek-V3.1似乎是前一代DeepSeek-V3的小版本迭代。该模型支持两种工作模式——思考模式和非思考模式。面对简单问题时,它以非思考模式快速作答;处理复杂问题时,则切换到思考模式,提供更具深度和逻辑的答案。用户可以通过官方App或网页端的“深度思考”按钮来切换这两种模式。

  

  与之前的DeepSeek-R1-0528相比,DeepSeek-V3.1在思考模式下的效率大幅提升,能在更短时间内给出答案,并且经过思维链压缩训练后实时热点,token消耗量减少了20%至50%,同时保持了与R1-0528相当的任务表现。此外,在非思考模式下,新模型的输出长度也得到了有效控制,能够在输出长度明显减少的情况下保持相同的性能。

  通过Post-Training优化,新模型在工具使用与编程、搜索等智能体任务中的表现大幅提升。在代码修复和命令行终端任务测试中,DeepSeek-V3.1的表现显著优于以往模型。社区第三方测试数据显示,在Aider多语言编程基准测试中,V3.1取得了71.6%的高分,超越了多个知名模型,完成一次编程任务的成本仅为1.01美元,成本效益优势显著。

  随着V3.1的发布,DeepSeek调整了API接口调用价格,并取消了夜间优惠。自北京时间2025年9月6日凌晨起,输入价格方面,缓存命中时为0.5元/百万tokens,缓存未命中时则涨至4元/百万tokens;输出价格调整为12元/百万tokens。DeepSeek还在评论区提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,并对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。UE8M0 FP8是针对即将发布的下一代国产芯片设计的。DeepSeek-V3.1正式发布 新版本效率大幅提升

相关文章

小伙骑车剐蹭 全程只说一句话 我听交警的

小伙骑车剐蹭 全程只说一句话 我听交警的

  8月4日,在江苏苏州,一名小伙骑车时与逆行的女子发生了剐蹭。女子拿出手机边拍摄边质问小伙:“撞了人还揍人是吗?”“你是怎么活到现在的?”面对质问,小伙冷静回应:“我听交警的,交警什么时...

中国气象局调整暴雨Ⅲ级应急响应范围 华北黄淮等地迎强降雨

中国气象局调整暴雨Ⅲ级应急响应范围 华北黄淮等地迎强降雨

  中国气象局调整了重大气象灾害(暴雨)Ⅲ级应急响应范围。当前广东广西等地的强降雨过程已基本结束。预计8月7日夜间至9日,西北地区东部、内蒙古中东部、华北、黄淮等地将有一次强降雨过程。河北...

川渝鄂豫苏皖等地将迎暴雨天气 局地大暴雨或特大暴雨

川渝鄂豫苏皖等地将迎暴雨天气 局地大暴雨或特大暴雨

  中央气象台预计,8月9日下午至12日,四川盆地、西北地区东南部至黄淮南部、江汉、江淮一带将出现持续较强降雨天气。四川中东部、云南东北部、重庆中北部、陕西东南部、河南南部、湖北、湖南北部...

视觉盛宴!刘亦菲Lisa同框 刘亦菲整体造型温婉典雅 宛如从童话中走出的公主!

视觉盛宴!刘亦菲Lisa同框 刘亦菲整体造型温婉典雅 宛如从童话中走出的公主!

   刘亦菲Lisa同框   【刘亦菲Lisa同框】2025年5月19日,意大利西西里岛陶尔米纳的宝格丽高级珠宝展(...

马克龙:欧洲须参与乌危机解决方案 强调乌克兰未来由乌决定

马克龙:欧洲须参与乌危机解决方案 强调乌克兰未来由乌决定

  当地时间9日,法国总统马克龙与乌克兰总统泽连斯基、德国总理默茨以及英国首相斯塔默进行了交流。他表示,鉴于欧洲安全的重要性,欧洲必须参与解决乌克兰危机。   ...

李明德被判有期徒刑6个月 酒后砸车被刑事拘留,曾发文猛批《三人行》剧组!!

李明德被判有期徒刑6个月 酒后砸车被刑事拘留,曾发文猛批《三人行》剧组!!

   李明德被判有期徒刑6个月   【李明德被判有期徒刑6个月】2025年1月27日,演员李明德醉酒后砸坏“编导杨洋...