当前位置:首页 > 币圈百科 > 比特币

Mistral 发布 Voxtral:全球首个专注音频的LLM系列,性能叫板GPT-4o、Gemini

2025-07-17 09:44:47 | 来源: | 作者:
欧洲人工智能领军企业 Mistral AI 近日宣布推出 Voxtral,一个全新系列的专注于音频处理的大型语言模型 (LLM)。该公司宣称,这是首个专为音频人工智能设计的LLM系列,主要面向企

欧洲人工智能领军企业 Mistral AI 近日宣布推出 Voxtral,一个全新系列的专注于音频处理的大型语言模型 (LLM)。该公司宣称,这是首个专为音频人工智能设计的LLM系列,主要面向企业级应用,旨在提供实用的语音智能解决方案。

核心能力:超越转录,深度理解

Voxtral 基于 Mistral 的文本大模型 Mistral Small 3.1 构建,具备强大的音频理解和处理能力:

  • 多语言支持: 精通英语、法语、西班牙语、葡萄牙语、意大利语、德语、荷兰语、印地语等多种语言。

  • 长音频处理: 可转录长达30分钟的音频;能理解长达40分钟的上下文,支持用户进行深入对话、提问。

  • 超越转录: 不仅能转写文字,更能生成摘要、提供分析洞察、执行API函数调用

双版本发布:满足不同场景

Voxtral 提供两个版本:

  1. Voxtral Small (24B 参数): 旗舰型号,专为生产级部署设计。Mistral 宣称其在所有任务上的表现与 OpenAI 的 GPT-4o-mini 和 Google 的 Gemini 1.5 Flash 具有竞争力

  2. Voxtral Mini (3B 参数): 轻量级方案,适合本地或边缘设备部署。其 API 版本 Voxtral Mini Transcribe 尤其亮眼,Mistral 表示其性能超越 OpenAI 的 Whisper large-v3,而价格不到 Whisper 的一半,极具性价比。

灵活部署与接入

  • 开发者可从 Hugging Face 下载 Voxtral Small 和 Mini 模型进行本地托管

  • 也可通过单一 API 调用轻松集成到任何应用中,起价低至每分钟 $0.001,确保转录服务的可扩展性。

  • Voxtral 预计将在未来几周内登陆 Mistral 的 Le Chat 平台(Web 或 App)。

背景:欧洲AI新星的进击

成立于2023年的 Mistral AI 已是欧洲最具影响力的AI公司之一,获得了 Andreessen Horowitz、英伟达 (Nvidia)、三星和 Salesforce 等顶级机构的投资,融资总额超10亿欧元(约12亿美元)。Voxtral 的发布标志着其在多模态AI领域的又一重要布局。

声明:文章内容不代表本站观点及立场,不构成本平台任何投资建议。本文内容仅供参考,风险自担!

你可能感兴趣的文章

币圈快讯

  • SUI 未平仓合约高企(近10亿美元),4美元上方空头挤压风险升温

    2025-07-23 10:43
    SUI 代币近期在衍生品市场表现活跃,未平仓合约(OI)价值维持在历史高位附近(约10亿美元),使其成为继主要蓝筹代币之后第六大最活跃的衍生品交易资产(数据来源:Coinank)。Glassnode 更
  • 43.9亿美元单周涌入!以太坊ETF狂吸21亿创纪录,引爆加密机构资金潮

    2025-07-22 10:34
    核心数据速览 历史峰值:数字资产投资产品单周流入43.9亿美元(超越2024年12月42.7亿纪录) 以太坊统治力:ETH ETP吸金21.2亿美元,近乎翻倍此前纪录(13周流入占其总规模23%) 比特币
  • 强势突破!以太坊飙破3800美元,创七个月新高,分析师喊出1万目标

    2025-07-21 10:48
    据CoinGecko数据显示,以太坊(ETH)于近日成功突破3800美元大关,这是自2024年12月以来首次站上这一价位。此次强劲上涨推动以太坊市值一度突破4500亿美元,正式确认其创下七个月以来
  • 以太坊强势崛起:54%稳定币市占率+华尔街巨鲸押注,ETH周涨20%领跑加密市场

    2025-07-19 10:54
    以太坊(ETH)正以三重驱动力重塑加密市场格局: ✅ 稳定币霸权:全网54%稳定币在以太坊发行,奠定其数字金融基础设施核心地位; ✅ 机构巨鲸入场:SharpLink Gaming(以太坊联合创始人执掌
  • 查看更多