阿里通义发布Fun-ASR1 5语音识别大模型:30种语言与汉语七大方言全覆盖 阿里通义实验室正
阿里通义实验室正式推出新一代语音识别大模型Fun-ASR1.5。该模型凭借其卓越的多语言与方言处理能力,为语音识别技术设定了新的行业基准。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

Fun-ASR1.5的核心突破在于其统一的模型架构实现了前所未有的泛化能力。单一模型即可精准处理全球30种主流语言,并深度支持汉语的七大方言体系及二十余种地方口音。其技术边界甚至延伸至古诗词吟诵的韵律识别与转写,展现了强大的上下文理解与声学建模能力。

在关键的性能指标上,Fun-ASR1.5表现突出。针对复杂方言场景,其字错误率(CER)实现了56.2%的相对下降。目前,模型对5种方言的识别准确率已超过90%,另有15种方言的准确率稳定在80%以上,为跨地域商业应用提供了可靠的技术基础。
除了高精度识别,Fun-ASR1.5集成了智能后处理功能。它能自动为口语转录添加标点,并将数字、日期、金额、电话号码等实体信息转换为标准书面格式。这一特性直接提升了转录内容的可读性与可用性。
对于会议纪要、访谈整理、司法笔录等专业场景,这一功能显著减少了人工后期校对的时间成本,使从业者能够将资源集中于内容分析与策略制定,从而优化工作流程并提升效率。

开发者与企业可便捷地集成该模型。用户可通过阿里云百炼平台直接调用Fun-ASR1.5的API服务,快速部署至自有产品。同时,也可在魔搭社区进行免费在线体验,直观测试其多语言与方言识别效果。
相关体验地址如下:
阿里云百炼:https://bailian.console.aliyun.com/cn-beijing?tab=model#/efm/model_experience_center/voice?modelId=fun-asr
魔搭社区:https://modelscope.cn/studios/iic/FunAudio-ASR
菜鸟下载发布此文仅为传递信息,不代表菜鸟下载认同其观点或证实其描述。