文章来源:放心AI网发布时间:2025-06-26 09:54:42
在 AI 语音生成领域,竞争正变得愈发激烈。近日,来自韩国的两名本科生合伙创建了一款名为 Dia 的 AI 语音模型,声称其功能可与谷歌的 NotebookLM 相媲美。尽管这两位创始人在 AI 领域的经验尚浅,但他们在短短三个月内,成功开发出一款开放获取的语音生成工具。
Dia 的训练依赖于谷歌的 TPU Research Cloud 项目,该项目为研究人员提供免费的 TPU AI 芯片使用权限。Dia 模型拥有1.6亿个参数,能够根据给定的脚本生成对话。用户还可以自由定制发言人的语调,并插入诸如咳嗽、笑声等非语言提示。参数越多,通常意味着模型的性能越好。
Dia 目前可通过 AI 开发平台 Hugging Face 和 GitHub 获取,适用于大多数配备至少10GB VRAM 的现代个人电脑。在未提供具体风格描述时,Dia 会生成随机的声音,但用户也可以使用该模型进行声音克隆。
在 TechCrunch 的初步测试中,Dia 表现良好,能够毫无障碍地生成关于各种主题的双向对话,语音质量与市面上其他工具相当。值得注意的是,Dia 的声音克隆功能也是记者尝试过的最简单易用的之一。
然而,Dia 在保障措施方面的不足引发了一些担忧。用户可以轻易利用该工具制作虚假信息或欺诈录音。尽管 Nari 在 Dia 的项目页面上呼吁用户不要利用模型进行欺诈或其他非法活动,但他们也表示不对模型的滥用行为负责。此外,Nari 尚未披露用来训练 Dia 的数据来源,这意味着其可能使用了受版权保护的内容,相关法律问题依然复杂。
Nari Labs 的创始人 Toby Kim 表示,他们计划在 Dia 的基础上,构建一个具有 “社交特性” 的合成语音平台,并希望在未来支持更多语言。Nari 还计划发布 Dia 的技术报告,以进一步扩大其影响力。
项目:https://github.com/nari-labs/dia
相关攻略 更多
最新资讯 更多
两名本科生打造AI语音模型,挑战谷歌NotebookLM
更新时间:2025-06-26
字节跳动调整AI产品线:猫箱换帅,星绘并入豆包,Allin增长
更新时间:2025-06-26
Sentra获5000万美元B轮融资,助力企业数据安全应对AI时代挑战
更新时间:2025-06-25
加州AI博士遭遇签证风波:数千留学生面临身份危机
更新时间:2025-06-25
颠覆视频创作!阿里巴巴VACE模型统一处理文本、图像和视频输入
更新时间:2025-06-25
华盛顿邮报与OpenAI达成合作,让ChatGPT为用户提供优质新闻摘要
更新时间:2025-06-25
谷歌考虑与安卓制造商签署Gemini人工智能独家合作协议
更新时间:2025-06-25
BD推出AI手术监测黑科技:提前预测血压骤降,拯救生命于分秒之间
更新时间:2025-06-25
AI广告存在误导性,苹果美国官网撤下AI功能“现已推出”字样
更新时间:2025-06-25
Otto推出业界首个PIMS集成功能,AI生成医疗记录再升级
更新时间:2025-06-25