Open API 开发者文档
  1. 数字人
Open API 开发者文档
  • API文档
    • 快速开发指南
      • 产品更新动态
      • 发出请求
      • 常见问题汇总
      • 如何获取调用密钥KEY
      • 如何用代码调用
      • 用量及历史调用查询
    • PPT API 文档
      • 文多多(官方格式)
        • PPT 接口调用说明
        • 创建接口token
        • 分页查询 PPT 模板
        • 更换PPT模板
        • 修改大纲
        • 解析文件内容
        • 生成大纲
        • 生成大纲内容
        • 随机获取PPT模板
        • 生成PPT
        • 获取PPT列表
        • 加载PPT数据
        • 下载PPT
        • 更新PPT属性
        • 保存PPT
        • 删除PPT
        • 查询异步生成 PPT 信息
        • JSON转PPT
        • PPT转JSON
      • 韦尼克(官方格式)
        • 申请PPT生成任务(PPT描述/主题一键生成)
        • 通过描述生成PPT标题大纲(逐步生成PPT)
        • 根据标题生成封面预览图(模版封面图预览)
        • 根据标题以及封面预览信息生成不同主题色的预览(设置主题色)
        • 通过task_id增加PPT单页(PPT中插入单页)
        • 短文本文件生成PPT(文件内容解析)
        • 基于当前模板生成(基于当前模版生成)
        • 获取PPT生成状态和预览页(文件内容解析)
        • 获取PPT生成状态和预览页(文件内容解析)
        • 更换模版(更换模版)
        • 通过文件生成PPT(文件内容解析)
        • 申请PPT生成任务(逐步生成PPT)
        • 获取PPT生成状态和预览页(逐步生成PPT)
        • 获取PPT生成状态和预览页(PPT描述/主题一键生成)
        • 生成PPT备注(演讲稿备注)
        • 获取PPT下载链接(获取下载链接)
    • API文档(KEY 认证方式)
      • MJ
        • @回调说明
        • 慢速MJ(不推荐调用)
          • 生成(生成变换/放大)
        • 提交Blend任务(混图)
        • MJ生成(生成/变换/放大)
        • 异步查询
      • SUNO AI音乐
        • @回调说明
        • @接口说明
        • 开始创作歌曲
        • 合并
        • 歌词生成
        • 歌曲查询
      • PIKA
        • PRO版
          • generate(文本)
          • generate(参考图片)
          • generate(参考视频)
        • feed
      • PIXVERSE
        • @回调说明
        • @接口说明
        • generate(文本)
        • feed
        • generate(参考图片)
        • generate(character角色)
        • character
      • KLING
        • PRO
          • generate(文本)
          • generate(图片)
          • extend
        • feed
      • LUMA
        • PRO版
          • generate(文本)
          • generate(参考图片)
          • extend
        • feed
      • RUNWAY(推荐))
        • PRO版
          • generate(文本)
          • generate(参考图片)
          • video2video(视频转视频)
        • feed
    • API文档(HEAD认证方式)
      • 聊天接口(Chat)
        • 创建聊天补全(SeedEdit)
        • 聊天接口
        • gpts
        • gemini-pro
        • gpt-4-all(分析图片)
        • gpt-4-vision-preview
      • 自动补全接口(Completions)
        • 内容补全接口
      • 图像接口(Images)
        • DALL·E 3
        • gpt-4-all(生成图片)
      • 向量生成接口(Embeddings)
        • 创建嵌入
      • 音频接口(Audio)
        • 创建转录
        • 创建翻译
        • TTS文本转语音
      • 图像接口(Midjourney)
        • 补充 - 其他参数以及回调
        • InsightFace任务提交
          • 提交swap_face任务
        • 任务提交
          • 执行动作
          • 提交Blend任务
          • 提交Describe任务
          • 提交Modal
          • 提交Shorten任务
        • 任务查询
          • 查询所有任务
          • 根据ID列表查询任务
          • 分页查询任务
          • 查询任务队列
          • 取消任务
          • 获取任务图片的seed(需设置mj或niji的私信ID)
      • 图像接口(Recraft V3)
        • 创建图像(Recraftv3)
      • 图像接口 (Ideogram)
        • Generate(文生图)
        • Remix(混合图)
        • Upscale(放大高清)
        • Describe(描述)
      • 图像接口(Flux)
        • 创建图像(Flux)
      • 图像接口(jimeng)
        • 创建图像(jimeng)
      • 图像接口(Stable Diffusion)
        • 创建图像(StableDiffusion)
      • Suno音乐接口
        • GoAmzAI格式
          • v3.5
            • 生成音乐
            • 获取音乐
          • v3.0
            • 生成音乐
            • 获取音乐
        • 官网原生格式(v2)
          • 官网格式
          • 所有接口
            • 音乐链接转成suno(upload)
            • 音乐生成(generations)
            • 查询任务(feed)
          • 场景1 生成自定义音乐(带歌词)
            • 音乐生成(generations)
            • 查询任务(feed)
          • 场景 2 通过提示词直接生成音乐(带歌词)
            • 音乐生成(generations)
            • 查询任务(feed)
          • 场景 4 通过提示词直接生成音乐(纯音乐)
            • 音乐生成(generations)
            • 查询任务(feed)
          • 场景3 生成自定义音乐(纯音乐)
            • 音乐生成(generations)
            • 查询任务(feed)
          • 场景 5 上传自定义音频并续写
            • 续写自定义音频步骤介绍
            • 音乐链接转成suno(upload)
            • 音乐生成(generations)
            • 查询任务(feed)
        • 生成歌词
          • 获取歌词
          • 生成歌词
      • Luma视频接口
        • GoAmzAI格式
          • 付费版
            • 生成视频
            • 获取视频
          • 免费版
            • 生成视频
            • 获取视频
        • 官网原生格式(v2)
          • 提交生成视频任务
          • 查询单个任务
          • 扩展视频
          • 获取视频无水印链接
      • kling可灵视频图片接口
        • 图像v2(包含v1模型&兼容更多参数&同步接口)
          • 虚拟换衣 v2
        • 虚拟换衣
        • 获取虚拟换衣任务
        • 文生图
        • 图生图
        • 文生视频
        • 图生视频
        • 获取图片生成任务
        • 获取文生视频任务
        • 获取图生视频任务
      • 视频接口(混元视频API)
        • 官方格式
          • 创建任务
          • 获取任务
      • 海螺Hailuo AI视频接口
        • 创建视频生成任务
        • 获取视频生成任务
      • 佐糖API
        • 创建抠图任务
        • 获取图片压缩结果
        • 获取抠图结果
        • 创建图片变清晰任务
        • 获取图片变清晰结果
        • 创建图像修复任务
        • 获取图像修复结果
        • 创建背景生成任务
        • 获取背景生成结果
        • 创建证件照制作任务
        • 获取证件照制作结果
        • 创建图像上色任务
        • 获取黑白图像上色结果
        • 创建图片压缩任务
        • 创建OCR任务
        • 获取OCR结果
        • 创建图片智能切边任务
        • 获取图片智能切边结果
      • MewXAI星月熊开放API
        • 生成图片融合示例
        • 8.不同版本(艺术二维码调用示例)
        • 3.艺术字调用 - 使用模版(AI艺术字调用示例)
        • 校验接口(MX绘画)
        • 计算点数(MX绘画)
        • 融合模型示例-多个融合模型(MX绘画-生成类接口-MX-生成示例(必看))
        • 模型列表(MX绘画-MX)
        • 融合模型列表(MX绘画-MX)
        • 生成图片接口(MX绘画-Cute)
        • 融合模型列表(MX绘画-Cute)
        • 回调演示
        • 查询详情
        • 余额查询
        • 获取模板列表
        • 获取模型列表
        • 反词 - 追加反词(MX绘画-生成类接口-Cute-生成示例(必看))
    • Claude
      • 入门
      • IP 地址白名单
      • 版本控制
      • 错误和速率限制
      • 提示验证
      • 客户端 SDK
      • 选择模型
      • 数据流
      • 支持地区
      • 生成文本补全
      • 创建对话
    • Google Gemini
      • 获取 API 密钥
      • API 版本说明
      • 安全设置
      • 安全指导
      • 下载内容
      • 在Google Cloud上运行Gemini
      • 概览
        • 概览
        • 文本和图片输入
        • 纯文字输入
        • 多轮对话(聊天)
        • 流式传输
      • 模型
        • 概览
        • Gemini
        • PaLM 2 型号
    • 帮助中心
      • 常见问题及解决办法
      • 文件处理
      • PPT生成
    • 语音克隆
      • 创建语音克隆模型
      • 语音合成
    • 数字人
      • 数字人简介
        POST
      • 生成数字人视频
        POST
      • 获取任务详情
        GET
      • 查询默认voice列表(免费)
        GET
  1. 数字人

数字人简介

POST
/
数字人
通过不同的请求体结构,可以实现三种不同的使用场景:
1.
直接使用音频和形象文件
2.
创建音色并设置朗读文本
3.
使用预设音色并设置朗读文本

请求参数

Authorization
Body 参数application/json
可选
One of
场景1 - 直接使用音频文件和形象
audio_url
string <uri>
必需
音频文件URL(包含用户的声音和朗读内容)
示例值:
https://cdn.gptbest.vip/file/cdn/20250107/RFDQkBGVrHFydzGzzvgXGQmbuPhicK.mp3
avatar_url
string <uri>
必需
用户形象URL(支持图片或视频,推荐使用视频)
示例值:
https://cdn.gptbest.vip/file/cdn/20250107/W213dUwMKyxZzXVvW0wUETJZ8KiUDB.mp4
示例
{
  "audio_url": "https://cdn.gptbest.vip/file/cdn/20250107/RFDQkBGVrHFydzGzzvgXGQmbuPhicK.mp3",
  "avatar_url": "https://cdn.gptbest.vip/file/cdn/20250107/W213dUwMKyxZzXVvW0wUETJZ8KiUDB.mp4"
}

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST '/' \
--header 'Content-Type: application/json' \
--data-raw '{
    "audio_url": "https://cdn.gptbest.vip/file/cdn/20250107/RFDQkBGVrHFydzGzzvgXGQmbuPhicK.mp3",
    "avatar_url": "https://cdn.gptbest.vip/file/cdn/20250107/W213dUwMKyxZzXVvW0wUETJZ8KiUDB.mp4"
}'

返回响应

🟢200成功
application/json
成功创建数字人
Body
id
string 
数字人唯一标识
可选
示例值:
dh_123456789
video_url
string <uri>
可选
生成的数字人视频URL
示例值:
https://cdn.example.com/digital-human/video_123456.mp4
status
enum<string> 
生成状态
可选
枚举值:
processingcompletedfailed
示例值:
completed
created_at
string <date-time>
创建时间
可选
示例值:
2023-08-05T12:34:56Z
示例
{
  "id": "dh_123456789",
  "video_url": "https://cdn.example.com/digital-human/video_123456.mp4",
  "status": "processing",
  "created_at": "2023-08-05T12:34:56Z"
}
🟠400请求有误
🔴500服务器错误
上一页
语音合成
下一页
生成数字人视频
Built with