Phi-4模型要点总结:Phi-4模型概述:开发人员:微软研究院描述:Phi-4是一款先进的开放模型,利
Phi-4模型要点总结:
Phi-4模型概述:开发人员:微软研究院描述:Phi-4是一款先进的开放模型,利用合成数据集、经过筛选的公共领域网站数据、学术书籍及问答数据集进行构建。其设计目标是确保小型能力模型能够通过高质量和高推理能力的数据进行训练。Phi-4经过严密的增强和调整过程,结合监督微调与直接偏好优化,以保证精确的指令遵循和强有力的安全措施。
架构:参数:14B 参数模型类型:密集解码器专用 Transformer 模型输入:类型:文本最佳格式:聊天格式的提示上下文长度:16K Token
硬件需求:GPU:1920 H100-80G训练时间:21天
训练数据:9.8T Token
输出:根据输入生成的文本
日期:训练时间:2024年10月 - 2024年11月数据截止日期:2024年6月及之前发布日期:2024年12月12日
状态:类型:在离线数据集上训练的静态模型数据来源:公开数据,截止日期为2024年6月及之前
模型效果如下:
菜鸟下载发布此文仅为传递信息,不代表菜鸟下载认同其观点或证实其描述。
版权投诉请发邮件到 cn486com#outlook.com (把#改成@),我们会尽快处理
Copyright © 2019-2020 菜鸟下载(www.cn486.com).All Reserved | 备案号:湘ICP备2022003375号-1
本站资源均收集整理于互联网,其著作权归原作者所有,如有侵犯你的版权,请来信告知,我们将及时下架删除相应资源