当前位置:首页 > 币圈百科 > 比特币

Mistral 发布 Voxtral:全球首个专注音频的LLM系列,性能叫板GPT-4o、Gemini

2025-07-17 09:44:47 | 来源: | 作者:
欧洲人工智能领军企业 Mistral AI 近日宣布推出 Voxtral,一个全新系列的专注于音频处理的大型语言模型 (LLM)。该公司宣称,这是首个专为音频人工智能设计的LLM系列,主要面向企

欧洲人工智能领军企业 Mistral AI 近日宣布推出 Voxtral,一个全新系列的专注于音频处理的大型语言模型 (LLM)。该公司宣称,这是首个专为音频人工智能设计的LLM系列,主要面向企业级应用,旨在提供实用的语音智能解决方案。

核心能力:超越转录,深度理解

Voxtral 基于 Mistral 的文本大模型 Mistral Small 3.1 构建,具备强大的音频理解和处理能力:

  • 多语言支持: 精通英语、法语、西班牙语、葡萄牙语、意大利语、德语、荷兰语、印地语等多种语言。

  • 长音频处理: 可转录长达30分钟的音频;能理解长达40分钟的上下文,支持用户进行深入对话、提问。

  • 超越转录: 不仅能转写文字,更能生成摘要、提供分析洞察、执行API函数调用

双版本发布:满足不同场景

Voxtral 提供两个版本:

  1. Voxtral Small (24B 参数): 旗舰型号,专为生产级部署设计。Mistral 宣称其在所有任务上的表现与 OpenAI 的 GPT-4o-mini 和 Google 的 Gemini 1.5 Flash 具有竞争力

  2. Voxtral Mini (3B 参数): 轻量级方案,适合本地或边缘设备部署。其 API 版本 Voxtral Mini Transcribe 尤其亮眼,Mistral 表示其性能超越 OpenAI 的 Whisper large-v3,而价格不到 Whisper 的一半,极具性价比。

灵活部署与接入

  • 开发者可从 Hugging Face 下载 Voxtral Small 和 Mini 模型进行本地托管

  • 也可通过单一 API 调用轻松集成到任何应用中,起价低至每分钟 $0.001,确保转录服务的可扩展性。

  • Voxtral 预计将在未来几周内登陆 Mistral 的 Le Chat 平台(Web 或 App)。

背景:欧洲AI新星的进击

成立于2023年的 Mistral AI 已是欧洲最具影响力的AI公司之一,获得了 Andreessen Horowitz、英伟达 (Nvidia)、三星和 Salesforce 等顶级机构的投资,融资总额超10亿欧元(约12亿美元)。Voxtral 的发布标志着其在多模态AI领域的又一重要布局。

声明:文章内容不代表本站观点及立场,不构成本平台任何投资建议。本文内容仅供参考,风险自担!

你可能感兴趣的文章

币圈快讯

  • 苹果斥资5亿美元联姻MP Materials,强化美国稀土供应链

    2025-07-16 10:27
    苹果公司与美国稀土生产商MP Materials周二宣布达成一项价值5亿美元的战略合作。该合作旨在保障苹果的国内稀土磁体供应,并共同建设新的回收设施,以减少对海外资源的依赖。市
  • xAI 获五角大楼 2 亿美元合同,Grok 争议阴影犹存

    2025-07-15 15:08
    埃隆·马斯克的人工智能公司 xAI 近日获得美国国防部一份价值 2 亿美元 的合同,旨在为联邦工作人员开发和提供人工智能工具。这一消息的发布,正值其聊天机器人 Grok 因
  • 加密货币巨头争抢银行牌照,特朗普时代开启监管套利窗口

    2025-07-14 15:03
    在唐纳德·特朗普总统任期内,加密货币公司正紧抓监管松动的机遇,积极融入美国传统银行体系。多家头部企业正快速行动:Ripple、Circle 和 BitGo 已申请国家信托银行牌照。
  • 比特币创投资神话:100%持有天数盈利,回报率碾压传统资产

    2025-07-12 14:56
    比特币(BTC)以其无与伦比的投资回报率持续创造历史。最新分析揭示了其惊人的盈利能力和作为价值存储的坚实地位。核心数据亮点: 近乎完美的持有盈利记录: 根据 Bitcoin Magazin
  • 查看更多