梦见自己大出血是什么征兆| 10月30是什么星座| adhd是什么病| 94年属于什么生肖| 什么药治高血压效果最好| 524是什么意思| 鼻窦炎有什么症状表现| 刺猬和豪猪有什么区别| 今天属什么生肖老黄历| 大便羊屎粒是什么原因| 喝酒手掌发红是什么原因| 小哥哥是什么意思| 晚上11点多是什么时辰| 金匮肾气丸有什么功效| 什么能解酒| 补血补气吃什么好| 网罗是什么意思| 皮肤痒用什么药最好| 木瓜什么味道| 为什么生气会胃疼| 前列腺肿瘤有什么症状| 三羊开泰是什么生肖| 治便秘吃什么| 低密度脂蛋白是什么| 孕妇尿酸高是什么原因| 脚麻看什么科室最好| 紫河车是什么东西| 坐月子可以吃什么水果| mra检查是什么意思| 叶酸有什么作用| 什么分明| sany是什么牌子| 同房肚子痛是什么原因| 炎热的夏天风儿像什么| 月经不来吃什么药| 忠贞不渝是什么意思| 梯子是什么| 铁蛋白偏高是什么意思| 世界上最坚硬的东西是什么| 属马的是什么星座| 9.6什么星座| 火麻仁是什么| 继发性高血压什么意思| 脸部肿胀是什么原因| 沏茶是什么意思| 什么叫天干| 恋物癖是什么| 是什么样的| 甘油三酯高有什么危害| 什么人什么天| 明油是什么油| 恋恋不舍的意思是什么| 红蜘蛛是什么虫| 驴血是什么颜色| 血管瘤吃什么药| 十二年义务教育什么时候开始| 安全期一般是什么时候| 牙酸是什么原因| 护理学什么| 疾苦的疾是什么意思| 鸽子不能和什么一起吃| 番茄可以做什么菜| 犬瘟热是什么症状| 小柴胡颗粒治什么病| 渡人渡己什么意思| 黑鸟是什么鸟| 窦性心动过缓吃什么药| 手足无措是什么意思| 什么在千里| 一个虫一个圣念什么| 悔教夫婿觅封侯是什么意思| 恶心呕吐吃什么药| 居居是什么意思| 处暑吃什么传统食物| 突然耳朵疼是什么原因| 什么鱼吃泥鳅| 肌电图主要检查什么病| 起飞是什么意思| 梦见一个人代表什么| 蓟类植物是什么| pgr是什么意思| 酸梅汤有什么功效| 左边小腹疼是什么原因| 傍家儿是什么意思| 吃无花果有什么好处| 2点是什么时辰| 形态是什么意思| 冠心病什么症状表现| 霉菌有什么症状| 多吃核桃有什么好处和坏处| 什么是gdp| 禅意是什么意思| 梦见女儿结婚是什么意思| 199是什么意思| 白头翁吃什么食物| 中医的望闻问切是什么意思| 广义货币m2是什么意思| it是什么意思| 桃子又什么又什么| 1959年属猪的是什么命| 嘴巴淡而无味是什么原因| 西柚是什么季节的水果| 咳嗽吐白痰是什么病| 融合菜是什么意思| 什么街道| 大肠埃希菌是什么病| 儿童中暑吃什么药| 便溏是什么原因引起的| 什么病误诊为帕金森| 煮方便面什么时候放鸡蛋| 神采什么| 小便有点黄是什么原因| 唐氏筛查是什么检查| 胃疼是什么原因| 中元节不能穿什么衣服| 版图是什么意思| 酒酿蛋什么时候吃效果最好| 查心电图挂什么科| 嗓子疼咳嗽挂什么科| 为什么一动就满头大汗| 阿昔洛韦片治什么病| 尿后余沥是什么意思| 上海月薪三万什么水平| 骨关节炎是什么原因引起的| 谷氨酰转肽酶是指什么| 感冒可以吃什么| 成吉思汗属什么生肖| 拔牙之后需要注意什么事项| 窈窕淑女是什么生肖| 小孩子头晕是什么原因| 女人吃善存有什么好处| 儿童内分泌科检查什么| 杨柳是什么生肖| 蜂蜜可以做什么美食| 气什么意思| vs什么意思| 示字旁与什么有关| 正负得什么| 专科什么专业就业前景好| 左边脖子疼是什么原因| 为什么会紫外线过敏| 为什么会有盆腔炎| 男的纹般若有什么寓意| 小孩吐奶是什么原因| 混不吝是什么意思| 今年52岁属什么生肖| 大白话是什么意思| 晚上7点是什么时辰| 吃什么补性功能最快| 十月初四是什么星座| 蘑菇是什么菌| 皮肤黑穿什么颜色好看| alienware是什么牌子| 放热屁是什么原因| 至字五行属什么| 饭前吃药和饭后吃药有什么区别| 浅笑是什么意思| 双子座和什么星座最不配| 纤维化是什么意思| 1995属什么| 尿胆红素阳性是什么意思| 什么食物含牛磺酸| 碧色是什么颜色| 盖是什么意思| 什么是南红| 烫发对身体有什么危害| 排卵期在什么时候| 什么时候喝牛奶最好| 獭尾肝是什么意思| 免疫球蛋白是什么东西| 男性内分泌失调有什么症状| 耳鸣和脑鸣有什么区别| 亥时右眼跳是什么预兆| 33数字代表什么意思| 作曲是什么意思| 多潘立酮片是什么药| 肚脐眼是什么穴位| 扁平疣用什么药| 羊水多对胎儿有什么影响| 尖货是什么意思| 玫瑰痤疮吃什么药| 公开遴选公务员是什么意思| 放疗和化疗有什么区别| 总是拉肚子是什么原因| 宝宝发烧手脚冰凉是什么原因| 孕妇前三个月吃什么对胎儿好| 1210是什么星座| 双抗是什么意思| 牙龈疼是什么原因| 氯化钠敷脸有什么作用| ld是什么意思| 男人喜欢什么样的女人做老婆| 梦见理发是什么意思| 争强好胜什么意思| 保家仙都有什么仙| b型血rh阳性是什么意思| 阴茎越来越小是什么原因| 鞋子上eur是什么意思| 为什么会牙痛| 女人得性疾病什么症状| 牙周炎吃什么药好| 孩子为什么要躲百天| 阿罗汉是什么意思| 眼睛发黄是什么原因引起的| 宫颈炎有什么症状| 什么叫射线| 牙齿浮起来是什么原因| 上呼吸道感染吃什么药| 宵夜吃什么| 10月9日什么星座| 吃桂圆干有什么好处和坏处| 总蛋白低是什么意思| 女人下面长什么样| 什么药可以溶解血栓| 导管扩张是什么意思| 养胃早餐吃什么好| 心悸吃什么药| 师长相当于地方什么级别| 哆啦a梦大结局是什么| 蛋白质高是什么原因| 后背发热是什么原因| 男性支原体阳性有什么症状| 人乳头病毒是什么意思| 情趣内衣是什么意思| fu什么意思| 阴囊是什么| 乙肝表面抗体弱阳性是什么意思| 倾注是什么意思| 为什么耳朵总是嗡嗡响| 低血糖有什么症状表现| 亚麻是什么| 豆角是什么| 腿上有淤青是什么原因| 高血压不能吃什么| 香菜什么时候种植最好| 为什么老虎头上有王字| 吃什么补充dha| 蚊子喜欢什么气味| 什么是文爱| 毛骨鱼是什么鱼| 正事是什么意思| 口僻是什么病| soho是什么意思| 薄谷开来为什么杀人| 弱水三千什么意思| 甘油三酯指的是什么| 花生什么时候种| 大便感觉拉不干净什么原因| 硒片什么牌子好| 性激素是查什么| 头发有点黄是什么原因| 内膜薄是什么意思| 吃海鲜不能吃什么| 218号是什么星座| 丝瓜不可以和什么一起吃| 曩是什么意思| 知更鸟是什么鸟| 肛门下坠感是什么症状| 长期咳白痰是什么原因| 胃炎吃什么食物好得快| 浅是什么意思| 弯弯的什么| 发霉的衣服用什么洗能洗掉| 做梦梦见掉牙齿是什么意思| 百度

2017年04月18日    22:12

利用 Google AI 将语音转成文本

百度 与捷克之间的三四名决赛是国足最后的救命稻草,国脚们能否挽回自己在球迷心中的形象在此一举。

通过简单易用的 API,将音频转换为文字转写,并将语音识别功能集成到应用中。

新客户最高还可获享 $300 赠金,用于试用 Speech-to-Text 和其他 Google Cloud 产品。

功能

高级语音 AI

Speech-to-Text 可以利用 Chirp,这是 Google Cloud 的语音基础模型,使用数百万小时的音频数据和数十亿个文本句子训练而成。这与传统语音识别技术(侧重于大量特定于语言的监督数据)形成了鲜明对比。这些技术可以为用户提高识别和转录能力,从而更好地理解口语和口音。

支持 125 种语言和语言变体

通过广泛的语言支持打造全球用户群。转录短音频、长音频甚至流式传输的音频数据。Speech-to-Text 还利用新一代通用语音模型 Chirp,为用户提供更加准确、覆盖全球的翻译和识别。Chirp 使用数百万小时的音频和 280 亿个句子的文本(涵盖 100 多种语言)的自监督训练构建而成。

用于转写的预训练模型或可自定义的模型

多种经过训练的模型中进行选择,实现优化的语音控制、电话和视频转录,满足特定领域的质量要求。通过 Speech-to-Text 界面,轻松自定义、试验、创建和管理自定义资源。

开箱即用的监管和安全合规性

无需额外设置,Speech-to-Text API v2 即可帮助企业客户满足额外安全和监管要求。数据驻留支持通过完全区域化的服务(该服务接入至新加坡和比利时等 Google Cloud 区域)来调用转录模型。借助识别器应变性 (resourcefulness),您无需使用专用服务账号进行身份验证和授权。您可以在 Google Cloud 控制台中轻松查看关于资源生成和转写的日志。Speech-to-Text API v2 为所有资源以及批量转录提供使用客户管理的加密密钥的企业级加密。


AI 赋能的语音识别和转录

Speech-to-Text 使用模型自适应技术来提高常用字词的准确性、扩充可用于转录的词汇,并改善嘈杂音频的转录效果。模型自适应可让用户自定义 Speech-to-Text,使其能够更频繁地使用同音字词中的某一个而非建议的其他选项。例如,您可以让 Speech-to-Text 在转录时更多地使用“时常”而不是“时长”。

流式语音识别

在 API 处理通过应用的麦克风流式传输的音频输入或从预先录制的音频文件发送的音频输入(内嵌或通过 Cloud Storage 传输)时,获得实时语音识别结果。


语音自适应

通过提供提示来定制语音识别功能,以转录特定领域的术语和生僻字词,并提高特定字词或短语的转录准确率。使用类别,自动将语音中的数字转换为地址、年份、货币或其他内容。

Speech-to-Text On-Prem

全面掌控您的基础架构和受保护的语音数据,同时在自己的本地私有数据中心利用 Google 的语音识别技术。与销售人员联系,开启体验之旅。

多通道识别

Speech-to-Text 可在多通道情况(例如视频会议)下识别不同的通道,并为转录内容添加注释以保留相应的顺序。

抗噪音干扰

Speech-to-Text 可处理来自各种环境的嘈杂音频,而无需额外的降噪措施。

特定领域的模型

多种经过训练的模型中进行选择,实现优化的语音控制、电话和视频转写,满足特定领域的质量要求。举例来说,我们的增强型电话模型针对来自电话的音频(例如以 8khz 采样率录制的电话通话)进行了优化。

内容过滤

脏话过滤器可帮助您检测音频数据中不当或不专业的内容,并滤除文本结果中的亵渎性字词。

转录评估

上传您自己的语音数据,并进行转录,而无需使用代码。通过配置迭代来评估质量。

自动加注标点符号(Beta 版)

Speech-to-Text 能够准确地为转录的文本加注标点符号,例如逗号、问号和句号。


讲话人区分

获得有关对话中哪位讲话者讲了哪句话的自动估测结果,了解有哪些人讲话以及分别说了什么。

工作方式

Speech-to-Text 有三种主要方法来执行语音识别:同步、异步和流式。每种方法都会根据后期处理中是否需要转录定期或实时返回文本结果。简而言之,您输入音频数据,然后接收基于文本的回复。

向应用添加语音转文字功能
了解如何将 Speech-to-Text 添加到应用

演示

试用 Speech-to-Text API

快速为上传的文件或直接对着麦克风的讲话创建音频转写内容。

常见用途

转录音频

创建音频转写内容

了解如何在 Cloud 控制台中使用 Speech-to-Text API 只通过几个步骤创建音频转写内容。您还可以转录短音频、长音频和流式音频

音频转写界面
Speech-to-Text 上传工具预览

创建音频转写内容

了解如何在 Cloud 控制台中使用 Speech-to-Text API 只通过几个步骤创建音频转写内容。您还可以转录短音频、长音频和流式音频

音频转写界面
Speech-to-Text 上传工具预览

使用 AI 为视频添加字幕

利用 AI 为视频创建字幕

转写音频和视频以添加字幕。为现有内容添加字幕,或实时向流式传输内容添加字幕。我们的视频转写模型非常适合为视频和/或有多人说话的内容编制索引或编排字幕,该模型使用与 YouTube 视频字幕类似的机器学习技术。本教程介绍了如何使用 Google Cloud AI 服务 Speech-to-Text API 和 Translation API 为视频添加字幕,以及提供其他语言的本地化字幕。

Speech-to-Text 字幕

利用 AI 为视频创建字幕

转写音频和视频以添加字幕。为现有内容添加字幕,或实时向流式传输内容添加字幕。我们的视频转写模型非常适合为视频和/或有多人说话的内容编制索引或编排字幕,该模型使用与 YouTube 视频字幕类似的机器学习技术。本教程介绍了如何使用 Google Cloud AI 服务 Speech-to-Text API 和 Translation API 为视频添加字幕,以及提供其他语言的本地化字幕。

Speech-to-Text 字幕

将 Speech-to-Text 添加到应用

如何将 Speech-to-Text 添加到应用

了解如何借助 Google Cloud 快速轻松地为您的应用启用 Speech-to-Text。此视频介绍了如何在没有大量机器学习模型经验的情况下将 AI 添加到您的应用。利用预训练的 Speech-to-Text API,您可以快速轻松地为应用启用 AI。

由 Google AI 和 API 界面提供支持的高级转写功能

如何将 Speech-to-Text 添加到应用

了解如何借助 Google Cloud 快速轻松地为您的应用启用 Speech-to-Text。此视频介绍了如何在没有大量机器学习模型经验的情况下将 AI 添加到您的应用。利用预训练的 Speech-to-Text API,您可以快速轻松地为应用启用 AI。

由 Google AI 和 API 界面提供支持的高级转写功能

将音频转换为文本

利用 Google Cloud API 处理语言、语音、文本和翻译

在本课程中,您将使用 Speech-to-Text API 将音频文件转录为文本文件,使用 Google Cloud Translation API 进行翻译,并使用 Natural Language AI 创建合成语音。

Speech-to-Text 课程

利用 Google Cloud API 处理语言、语音、文本和翻译

在本课程中,您将使用 Speech-to-Text API 将音频文件转录为文本文件,使用 Google Cloud Translation API 进行翻译,并使用 Natural Language AI 创建合成语音。

Speech-to-Text 课程
生成解决方案
您想解决什么问题?
What you'll get:
分步指南
参考架构
可用的预构建解决方案
此服务是使用 Vertex AI 构建的。您必须年满 18 周岁才能使用。请勿输入敏感信息、机密信息或个人信息。

价格

Speech-to-Text 的定价方式Speech-to-Text 的价格取决于 API 版本、音频通道、批处理方法以及任何附加的 Google Cloud 服务费用(例如存储费用)。
API 版本服务和功能价格

Speech-to-Text V1 API

V1 仅针对多区域提供数据驻留。提供的模型包括短音频、长音频、电话通话和视频。V1 不包括审核日志记录。新客户可获享 $300 赠金以及每月 60 分钟的免费音频转录和分析服务,不计入赠金额度。

$0.024

每分钟

Speech-to-Text V2 API


V2 为多区域和单区域提供数据驻留。模型包括短音频、长音频、电话通话、视频和 Chirp。V2 包含审核日志记录,并支持客户管理的加密密钥。

$0.016

每分钟

查看 Speech-to-Text 的价格详情

Speech-to-Text 的定价方式

Speech-to-Text 的价格取决于 API 版本、音频通道、批处理方法以及任何附加的 Google Cloud 服务费用(例如存储费用)。

Speech-to-Text V1 API

服务和功能

V1 仅针对多区域提供数据驻留。提供的模型包括短音频、长音频、电话通话和视频。V1 不包括审核日志记录。新客户可获享 $300 赠金以及每月 60 分钟的免费音频转录和分析服务,不计入赠金额度。

价格

$0.024

每分钟

Speech-to-Text V2 API


服务和功能

V2 为多区域和单区域提供数据驻留。模型包括短音频、长音频、电话通话、视频和 Chirp。V2 包含审核日志记录,并支持客户管理的加密密钥。

价格

$0.016

每分钟

查看 Speech-to-Text 的价格详情

价格计算器

估算您的每月 Speech-To-Text 费用,包括特定于区域的价格和费用。

定制报价

请与我们的销售团队联系,获取为贵组织量身定制的报价。

开始概念验证

新客户最高可获享 $300 赠金,用于试用 Speech-to-Text 和其他 Google Cloud 产品

有一个大型项目?

Speech-to-Text On-Prem

Speech-to-Text 基础知识

Speech-to-Text 代码示例

Cloud Speech-to-Text
Google Cloud
头发热是什么原因 胃一阵一阵的疼吃什么药 什么是机械键盘 猴头菇和什么煲汤最好 50年是什么婚
对立面是什么意思 什么原因导致尿酸高 身上经常出汗是什么原因 青色是什么色 手淫过度有什么危害
血小板计数偏高是什么原因 双的反义词是什么 月经血块是什么原因 美尼尔综合症是一种什么病 三观不正是什么意思
3.2号是什么星座 白细胞和血小板高是什么原因 数字是什么意思 呼吸科属于什么科室 肾阳虚吃什么食物
太阳像什么的比喻句xinmaowt.com 脖子黑是什么病hcv9jop1ns7r.cn 吃什么预防脑梗hcv9jop3ns5r.cn 症瘕病是什么病hcv9jop0ns0r.cn 如厕什么意思hcv9jop0ns1r.cn
牛角尖是什么意思hcv7jop9ns5r.cn 黑醋是什么醋zsyouku.com 六害是什么意思hcv8jop5ns7r.cn 血糖高适合吃什么食物inbungee.com tpo是什么hcv8jop2ns4r.cn
爱的反义词是什么hcv7jop4ns6r.cn 七情六欲指什么hcv8jop1ns9r.cn 手指发麻什么原因hcv9jop1ns0r.cn 交感神经是什么jingluanji.com 小仙女是什么意思ff14chat.com
吃什么降血糖hcv9jop1ns1r.cn 杂菌阳性是什么意思hcv8jop5ns0r.cn 为什么会得近视眼huizhijixie.com 月经前腰疼的厉害是什么原因hcv7jop6ns2r.cn 毛血旺是什么菜hcv9jop3ns0r.cn
百度