ListenHub 基于云端音频生成服务构建。客户端通过 OpenAPI 网关进行通信,在语音内容生成过程中涉及多模块协同。大致流程为:
术语定义:
用户在创建单集时需指定 speakerId 参数以选择目标音色进行内容生成。
下图示意 ListenHub 流程:
sequenceDiagram
participant C as 用户
participant G as API网关
participant F as 生成引擎
participant S as 云存储
Note over C, G: Episode创建
C->>G: 创建单集接口调用
G->>G: 验证Token/配额/权益等
G->>F: 创建语音任务
F-->>G: 任务完成(episodeID)
G-->>C: 返回结果(200 OK, episodeID)
F->>F: 处理文本(<1min)
F->>F: 生成语音(1-2min)
F->>S: 上传音频文件
S-->>F: 上传确认
F->>C: webhook确认生成完毕
Note over C, G: Episode查询 - 单集所有信息
C->>G: 查询单集详情接口调用
G-->>C: Episode 相关信息(audioStreamUrl+单集信息)
C->>S: GET 音频URL(播放)
S-->>C: 返回音频流
Note over C, G: Episode查询 - 文本流式
C->>G: 查询单集文本流式接口调用
G-->>C: 返回 Episode 脚本(script)/ 大纲 (outline)流式数据
功能支持:
ListenHub OpenAPI V1.0 提供全面的音频内容生成能力,支持以下核心功能:
后续版本将陆续支持:
计费标准:
OpenAPI 服务仅支持 Business 和 Enterprise 套餐用户 使用