deepseek 的首款推理模型 r1 在数学、代码和推理任务上达到了与 openai 的 o1 相当的表现
deepseek 的首款推理模型 r1 在数学、代码和推理任务上达到了与 openai 的 o1 相当的表现!
DeepSeek 同时开源了两个 660B 大小的模型,DeepSeek-R1-Zero 和 DeepSeek-R1,并通过 DeepSeek-R1 的输出蒸馏出 6 个小模型供社区使用。其中,32B 和 70B 模型在多个领域的表现与 OpenAI 的 o1-mini 相当。
Ollama 现已全面支持 DeepSeek 推理模型系列 R1 及其蒸馏模型。
如果你认为 v3 在编程方面表现已足够好,那么在桌面端替代的蒸馏模型是哪个呢?根据上一篇文章的 LiveCodeBench 评分显示,DeepSeek V3 得分为 42.2,而蒸馏模型 Qwen 14B 在第一张图中的得分达到 53.1,表现相当出色,且大小适宜于桌面级运行,推荐大家在桌面端使用 14B 模型。
菜鸟下载发布此文仅为传递信息,不代表菜鸟下载认同其观点或证实其描述。
版权投诉请发邮件到 cn486com#outlook.com (把#改成@),我们会尽快处理
Copyright © 2019-2020 菜鸟下载(www.cn486.com).All Reserved | 备案号:湘ICP备2023003002号-8
本站资源均收集整理于互联网,其著作权归原作者所有,如有侵犯你的版权,请来信告知,我们将及时下架删除相应资源