2025-01-20版本
deepseek-reasoner
•deepseek-reasoner是我们的新模型DeepSeek-R1.可以通过指定model=deepseek-reasoner调用。
•详细更新,请参考:DeepSeek-R1正式发布
•调用指南,请参考:推理模型
2024-12-26版本
deepseek-chat
•deepseek-chat模型升级为DeepSeek-V3,接口不变,可以通过指定model=deepseek-chat调用。
•详细更新,请参考:DeepSeek-V3正式发布
2024-12-10版本
deepseek-chat#
•deepseek-chat模型升级为DeepSeek-V2.5-1210,模型各项能力提升,相关基准测试:
•数学能力:在MATH-500基准测试中的表现从74.8%提升至82.8%
•代码能力:在LiveCodebench(08.01-12.01)基准测试中的准确率从29.2%提升至34.38%
•中文写作与推理能力:在内部测试集中表现也有相应提升
与此同时,全新版本的模型对文件上传和网页总结功能的用户体验进行了优化。
2024-09-05版本
deepseek-coder&deepseek-chat升级为DeepSeekV2.5模型
DeepSeek V2 Chat和DeepSeek Coder V2两个模型已经合并升级,升级后的新模型为DeepSeek V2.5。
为向前兼容,API用户通过deepseek-coder或deepseek-chat均可以访问新的模型。
新模型在通用能力、代码能力上,都显著超过了旧版本的两个模型。
新模型更好的对齐了人类的偏好,在写作任务、指令跟随等多方面进行了优化:
•ArenaHard winrate从68.3%提升至76.3%
•AlpacaEval 2.0 LC winrate从46.61%提升至50.52%
•MT-Bench分数从8.84提升至9.02
•AlignBench分数从7.88提升至8.04
新模型在原Coder模型的基础上进一步提升了代码生成能力,对常见编程应用场景进行了优化,并在标准测试集上取得了以下成绩:
• HumanEval: 89%
• LiveCodeBench(1-9月):41%
2024-08-02版本
API上线硬盘缓存技术
DeepSeek APl创新采用硬盘缓存,价格再降一个数量级
更新详情请跳转文档API上线硬盘缓存2024/08/02
2024-07-25版本
API接口更新
•更新接口/chat/completions
○JSON输出
○Function调用o对话前缀续写(Beta)
○8K最长输出(Beta)
•新增接口/completions
○FIM补全(Beta)
更新详情请跳转文档API升级新功能2024/07/25
2024-07-24版本
deepseek-coder
deepseek-coder模型升级为DeepSeek-Coder-V2-0724。
2024-06-28版本
deepseek-chat
deepseek-chat模型升级为DeepSeek-V2-0628,模型推理能力提升,关基准测试:
•代码,HumanEval Pass@179.88%->84.76%
•数学,MATH ACC@155.02%->71.02%
•推理,BBH 78.56%->83.40%
在Arena-Hard测评中,与GPT-4-0314的对战胜率从41.6%提升到了68.3%。
模型角色扮演能力显著增强,可以在对话中按要求扮演不同角色。
2024-06-14版本
deepseek-coder
deepseek-coder模型升级为DeepSeek-Coder-V2-0614,代码能力显著提升,在代码生成、代码理解、代码修复和代码补全上达到了GPT-4-Turbo-0409的水平,并拥有卓越的数学和推理能力,其通用能力与DeepSeek-V2-0517持平。
2024-05-17版本
deepseek-chat
deepseek-chat模型升级为DeepSeek-V2-0517,模型在指令跟随方面的性能得到了显著提升,IFEval Benchmark Prompt-Level准确率从63.9%跃升至77.6%。此外,我们对API端的“system“区域指令跟随能力进行了优化,显著增强了沉浸式翻译、RAG等任务的用户体验。
模型对于JSON格式输出的准确性得到了提升。在内部测试集中,JSON解析率从78%提高到了85%。通过引入恰当的正则表达式,JSON解析率进一步提高至97%。