· 2025-06-13 · 来源: |
标签:行业资讯 | 打印
| 纠错 |
近日,汇正财经联合上海人民广播电台“新质生产力调研行”第三站走进上海稀宇极智科技有限公司,深入探寻国产大模型快速迭代背后的创新活力,见证其在全球市场的崛起之路。
稀宇极智最新发布的新一代语音大模型Speech-02在国际权威语音评测榜单Artificial Analysis和Hugging Face TTS Arena上力压OpenAI、ElevenLabs等国际巨头,荣登双榜榜首,成为这两份榜单上唯一的中国竞争者。
在稀宇极智,主持人亲身体验了Speech-02的强大功能。只需从主持人播报的天气新闻中截取10秒采样,该模型就能生成几可乱真的音频。更令人惊叹的是,Speech-02支持32个小语种合成任意文本,且每个语种都有成千上万个音色可供选择。稀宇极智还曾利用这一技术,帮助一位客户复刻了离世亲人的数字孪生,让客户在亲人离世后仍能进行语音或文字交互,这一温暖案例充分展现了技术的温度与力量。
除了音频领域,稀宇极智的MiniMax-01通用大模型同样表现出色。该模型包含文本、音频和视频三条主力模型线,具备超长上下文处理能力,性能卓越。基于大模型推出的海螺视频、星野(AI社区)等原生应用也备受关注。特别是其图生视频模型,仅需单张图片就能生成视频,让每个人都能成为“大片导演”,真正实现了“创意民主化”。
成立仅3年的稀宇极智,如何在竞争激烈的人工智能赛道脱颖而出?稀宇极智开发者社区负责人蔡佳人介绍,公司在AGI(人工通用智能)领域走出了一条创新之路,如采用线性注意力机制、MoE架构、data packing技术等,使上下文窗口最高可达400万token,让模型又快又好。同时,三条主力模型线实现了多模态协同、共同设计,语音合成的情绪控制依赖文本模型的上下文理解能力,音质的提升也借助了视频模型团队的创新。
目前,稀宇极智在互联网娱乐、办公、教育、医疗、金融等多个领域都拥有头部客户,普通用户也能通过上海AI+文旅MaaS平台调用其多种模型。汇正财经首席投资顾问姚中元表示,人工智能市场规模正以倍数级别增长,稀宇科技参与的赛道潜力巨大,未来有望诞生像宁德时代、比亚迪这样的行业领军企业。
“新质生产力调研行”是由上海人民广播电台上海新闻广播和汇正财经共同发起的融媒体新闻行动,携手产业部门、专家学者、市场机构实地探访企业,解析变革,洞察趋势。通过实地探访一系列前沿科创企业,不仅为公众揭开了新质生产力的技术内核,更搭建起资本与产业对话的桥梁,共同助力科创产业生态从“认知破圈”迈向“价值落地”。
【推广】 |
|
|
产品专区 |
|
合作伙伴: |
互联网新闻信息服务许可证10120200001 京ICP备08005356号 京公网安备110102005860号 违法和不良信息举报电话:(010)68996274
版权所有 2000-2024 北京周报中文网 本网站所刊登的来源为北京周报及北京周报网的各种新闻﹑信息和各种专题专栏资料,均为北京周报社版权所有。