Google 语音识别

摘要:国际化语音识别,适用于搜索,AI聊天等场景

整理一下 近期做的项目识别用户语音,从而实现用户的语音搜索,以及语音聊天

1. API 启用

需要在Google Cloud Console中启用 Google Cloud Speech-to-Text API 服务。

2. 服务账号权限配置

2.1 权限范围(Scope)

代码中使用的权限范围是:


https://www.googleapis.com/auth/cloud-platform

这是一个广泛的权限范围,允许访问所有Google Cloud服务,包括Speech-to-Text API。

2.2 IAM角色

为服务账号分配以下角色之一:

  • 角色名称 : roles/cloudspeechto-text.admin (推荐,权限更精确)
  • 或 角色名称 : roles/editor (通用编辑权限,包含Speech-to-Text访问权限)
  • 或 角色名称 : roles/owner (项目所有者权限,权限最高)

3. 服务账号密钥

需要创建一个服务账号并下载JSON格式的密钥文件,保存到 storage_path('app/google/speech.json') 路径。

评论