11月28日,智能应用豆包对其语音交互服务进行了功能升级。本次更新的核心亮点在于,其语音对话系统新增了对四种地方方言的支持,用户现可选择使用粤语、四川话、东北话或陕西话进行交流。
豆包应用界面示意图
用户在使用时,只需在应用对话框内输入文字或直接说出语音指令,指定希望使用的方言,即可通过其默认的“温柔桃子”音色开启对话。该功能旨在为用户提供更亲切、个性化的交互体验。
技术层面,此次升级实现了单一音色对多种方言的模拟与输出。系统能够理解用户意图,并在对话过程中根据需要进行方言的灵活切换。

此外,豆包语音系统的识别能力也得到进一步扩展,现已能够准确理解包括上海话、南京话在内的多达18种中国地方方言。
据了解,此次功能提升得益于语音转文本技术的优化,其在方言处理的准确率与响应速度方面均有显著改进。
- 相关推荐
- 豆包语音
- 方言对话
- 语音模型
- ASR技术
-
不露脸,只出声,语音厅怎么就成了300亿黑马?
不露脸,只出声,直播日均流水超200万元,一款周边爆卖20.6万元。 当团播还在卷生卷死的时候,纯靠声音的语音厅却悄悄拿下了一个300亿的市场,并捧出了“𝑇.赵太阳”“控”等拥有百万粉丝的语音圈顶流。 不久前,“𝑇.赵太阳”还以听潮阁传媒总裁的身份参与录制了抖音、湖北卫视联合呈现的综艺《我被有趣的工作包围了》。
语音厅 直播 主播 -
阿里两款千问语音新模型齐发:动物也能“原声”说人话了!
阿里今日升级语音模型家族Qwen3-TTS,发布音色创造Qwen3-TTS-VD和音色克隆Qwen3-TTS-VC两款全新模型。 在生成效果上,全新模型的表现显著超越GPT-4o。 Qwen3-TTS新模型可实现DIY声音设计和像素级音色模仿,甚至让动物原生”开口说人话。 其音色自然、效果稳定、生成高效,可大大加速语音大模型在有声小说、AI漫剧、影视配音等多专业领域落地。 其中,音色创造模型支持通过自然�
语音模型 Qwen3-TTS 音色克隆 -
灰姑娘方言版瞬间变“隔壁村八卦”:本土化魔改火爆出圈
近日,一部贵州方言版《灰姑娘》在网络上掀起热潮,凭借其极具创意且接地气的“村口八卦”式演绎火爆出圈,网友纷纷调侃“童话秒变隔壁村狗血连续剧”,其中“哄睡变笑醒”的反差效果更是引发了广泛热议。 这部贵州方言版《灰姑娘》对经典童话进行了大胆且彻底的本土化改编。原本优雅高贵的灰姑娘摇身一变,成了充满乡土气息的“村花”。而继母对灰姑娘的刁
贵州方言 灰姑娘 本土化改编 -
荐豆包狂飙,字节AI再亮剑
中国AI领域的竞争,依旧体现在互联网巨头们的一举一动中。临近年末,各大厂也在密集总结成绩,并放出新的大招。 “豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍。” 12月18日,火山引擎FORCE原动力大会上,火山引擎总裁谭待宣布的这一数据引发行业关注。截至今年12月,已有超过100家企业客户累计token使用量超过一万亿。 这意味着,字节跳动正式加入�
AI竞争 豆包大模型 token经济 -
荐豆包“包圆”互联网
豆包手机才发布半个多月,字节就发布了通用agent模型豆包1.8。这是一个能在真实世界中“做事”的多模态大模型。 豆包1.8可以直接操作你的手机、电脑和浏览器。它能看懂屏幕上的按钮和界面,然后像人一样点击、滑动,帮你完成各种任务。 这是字节一次非常大胆的尝试。要知道,在12月1号的时候,字节才发布了豆包手机。通用agent大模型的推出,让豆包的领地从手机一
豆包1.8 通用agent模型 多模态大模型 -
荐手机厂靠拢豆包
努比亚 M153的三万台还没有卖光,豆包的手机端合作版图,有望进一步扩大。 近日,界面新闻报道称,字节跳动正推进与 vivo、联想、传音等硬件厂商开展 AI 手机合作,为其设备预装 AIGC 插件;多位 vivo 员工向媒体证实双方已确认合作、正在讨论细节。 不过,仅凭这条消息模糊的表述,尚无法确认这些“合作”的具体性质,是否和此前字节与中兴的合作方案划等号。此前,�
AI手机合作 字节跳动 硬件厂商 -
对标豆包!微信输入法iOS版3.0开启内测:支持方言语音输入
微信输入法自上线以来,凭借无广告、界面简洁、支持PC联动等特点获得良好口碑。近期,豆包输入法正式上线,给微信团队带来竞争压力。目前iOS微信输入法已开启3.0版本内测,主要升级了语音输入体验,包括模型升级、支持更多方言和英文识别、超长语音记录及待机时长功能。新版本语音识别准确度高,甚至能自动标注标点。不过,多数用户仍不习惯语音输入,对于习惯打字的用户而言,此次升级体验变化不大。
微信输入法 豆包输入法 语音输入 -
微信输入法iOS版3.0发布:语音输入大模型全面升级
微信输入法iOS版迎来3.0.0大版本更新,聚焦语音功能优化。升级后语音识别准确率与速度显著提升,并新增15种方言语音输入,覆盖粤语、四川话等。新版支持不限时长的语音输入,方便记录会议等内容,同时具备离线语音输入功能,保障网络不佳时顺畅使用。官方强调严格遵循隐私政策,仅收集必要信息,保障用户数据安全。
微信输入法 iOS版更新 语音输入 -
荐AI日报:字节发布Seed Prover1.5;MiniMax M2.1开源;通义开源语音交互大模型Fun-Audio-Chat-8B
本期AI日报聚焦多项AI领域新进展:字节跳动发布Seed Prover 1.5,在形式化数学推理领域取得突破;阿里通义开源语音交互模型Fun-Audio-Chat-8B,具备超低延迟和情感感知能力;MiniMax开源M2.1编码模型,性能超越闭源巨头;知乎发布2025年度AI产品榜单,豆包位居榜首;Anthropic推出开源Agent Skills知识库,助力Claude模型技能拓展;Lima v2.0发布,从容器工具进化为安全AI工作流平台;讯飞星�
AI 形式化数学推理 字节跳动 -
鲁豫首次对话鸿蒙开发者:照亮鸿蒙生态的,是无数具体的“人”
文章通过开发者访谈,展现了鸿蒙生态的开放与包容。开发者们选择鸿蒙,源于用户需求的真实驱动,如一封用户来信促使团队快速上线鸿蒙版应用。生态内,每个“好想法”都被珍视,从个人应用到企业战略布局,鸿蒙提供技术支持和高效响应,让创意得以实现。便捷的“碰一碰”分享、多设备无缝流转等功能,优化了用户体验。如今,搭载鸿蒙的设备已超3200万台,这片由�
鸿蒙生态 开发者故事 用户选择
今日大家都在搜的词:
- 人生重开模拟器
- 显卡天梯图
- 国内云服务器哪家好
- 高通骁龙处理器排名
- 手机CPU天梯图
- 单反相机天梯图
- 安兔兔手机跑分排行榜
- 笔记本电脑排行榜