# 平臺能力

平臺針對企業賬戶提供各項算法能力,包括:視頻合成能力、人物形象模型生成能力、TTS個人音色模型生成能力、人物形象模型更新能力、視頻人物換臉能力等。

# 功能介紹

# 視頻合成

2D數字人視頻合成服務爲您提供輸入選擇2D數字人形象模型,添加文本或音頻合成爲2D虛擬數字人mp4/webm格式的視頻,幷且通過返回的視頻鏈接下載視頻內容。

  • 形象配置
    • 支持通過參數指定本次視頻合成需要使用的2D數字人形象,系統提供若干個默認的2D數字人形象模型,供用戶選擇。具體可聯繫運營開通賬號後查看。
  • 音色配置
    • 系統支持兩種形式的音色配置
      • 上傳錄音文件,支持在綫錄音上傳或者選擇對應的音頻文件上傳,音頻將會經過降噪處理後將原聲用于最終合成的視頻內容。
      • 上傳文本+選擇音色,支持通過參數指定本次視頻合成需要使用的發音人音色,以及聲音的語速、音調、音量調節,系統提供若干個默認的TTS個人音色模型,供用戶選擇,將使用指定的音色朗讀對應的文本內容,最終將此音頻用于視頻合成。
  • 數字人驅動
    • 支持數字人表情、口型驅動。
  • 視頻編碼信息
    • 編碼格式: H264
    • 幀率: 25FPS
  • 視頻格式
    • 目前支持MP4/WebM兩種視頻格式,視頻時長由合成視頻的時候選擇的內容决定。
  • 視頻分辨率
    • 支持創建視頻合成任務的時候指定産出視頻的分辨率,建議選擇範圍爲:480p、720p、1080p
  • 字幕
    • 支持根據用戶輸入的文字或語音內容生成與之相匹配的字幕文件
  • 自定義前景/背景/標題文字
    • 支持通過URL指定視頻背景圖,圖片格式支持jpg、png兩種格式
    • 支持通過URL指定視頻前景圖,圖片格式支持jpg、png兩種格式
    • 支持通過參數指定視頻中標題文字內容的字體,字號,以及出現的位置
  • 自定義人物美顔效果
    • 支持通過參數調節人物美顔效果,包括:美白/磨皮/臉型調整/眼形調整/髮際綫調整/蘋果肌調整/鼻子調整/下巴調整/嘴巴調整/人中調整/縮頭/對比度/飽和度/清晰度/銳化程度調整等十余項參數調整功能,具體請參考參數說明 (opens new window),瞭解使用規則
  • 最大存儲時間
    • PaaS平臺支持7天在綫存儲,需要及時轉存,7天后生成內容將無法下載。

# 視頻合成時序圖

Video Composite Process

# TTS個人音色模型生成

TTS個人音色模型生成服務可根據用戶上傳的真人采集或錄製的語音素材文件通過算法訓練産出發音效果與聲音素材提供者一致的數字人TTS音色模型。請在采集時遵照商湯數字人音色複製采集製作規範,內容包括環境要求、設備要求、發音要求、授權要求、朗讀脚本,具體參考:采集規範 (opens new window)。PaaS平臺支持7天在綫存儲,需要及時轉存,7天后生成內容將無法下載。

# 人物形象模型生成

人物形象模型生成服務可根據用戶上傳的真人采集或錄製的視頻通過算法訓練産出AI驅動效果與真人幾乎無异的數字人人物形象模型。爲了完美克隆人物形象,請在拍攝時遵照商湯數字人采集製作規範,內容包括視頻、語音,用于 2D 數字人的訓練和測試,具體參考:采集規範 (opens new window)。PaaS平臺支持7天在綫存儲,需要及時轉存,7天后生成內容將無法下載。

# 人物形象模型生成時序圖

Human Model Process

# 人物形象模型更新

2D數字人人物形象模型更新服務可針對已經生成完成的人物形象模型進行更新,支持修改數字人訓練動作片段。PaaS平臺支持7天在綫存儲,需要及時轉存,7天后生成內容將無法下載。

# 綠幕分割效果預覽

平臺支持對圖片、視頻進行綠幕分割效果預覽,用來在實際提交人物模型生成任務之前確認綠幕分割參數效果,或者正式拍攝之前確認拍攝環境是否可以滿足拍攝要求。

# 視頻人物換臉(暫不支持)

視頻人物換臉任務可以根據用戶上傳的視頻內容和模板圖片調用算法能力進行視頻人物換臉處理,最終返回處理後的視頻文件和縮略圖供用戶下載。PaaS平臺支持7天在綫存儲,需要及時轉存,7天后生成內容將無法下載。

# API 說明

用戶調用平臺全部API服務,皆需要訪問服務接入點:aigc.softsugar.com,幷在請求頭中加上token信息。

# 創建視頻合成任務

# 接口描述

根據用戶上傳的指定內容調用算法能力進行視頻合成,最終返回mp4/webm格式的視頻文件供用戶下載。PaaS平臺支持7天在綫存儲,需要及時轉存,7天后生成內容將無法下載。

# 請求地址

POST /api/2dvh/v1/material/video/create

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
param String True 創建視頻合成任務需要傳入正確的param信息,其中包括各類視頻合成參數(該參數爲json轉義後的字符串),請參考下面的參數說明和 json 示例 (opens new window)示例效果 (opens new window)
videoName String True 視頻名稱
thumbnailUrl String False 縮略圖url

# 請求樣例

{
  "videoName": "xxx",
    
  "param": "{\"version\":\"0.0.4\",\"resolution\":[1080,1920],\"bit_rate\":16,\"frame_rate\":25,\"watermark\":{\"show\":true,\"content\":\"示例視頻\"},\"digital_role\":{\"id\":3964,\"face_feature_id\":\"0401_chenying_s1\",\"name\":\"0401_chenying_s1\",\"url\":\"https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/materials/77/0401_chenying_s1_20230427133135306.zip\",\"position\":{\"x\":0,\"y\":0},\"scale\":1.0},\"tts_config\":{\"id\":\"nina\",\"name\":\"Nina\",\"vendor_id\":3,\"language\":\"zh-CN\",\"pitch_offset\":0.0,\"speed_ratio\":1,\"volume\":100},\"tts_query\":{\"content\":\"絲綢之路是一條連接東西方的古老商路,在這條路上,東西方通過貿易和文化交流,促進了不同文明的不斷融合。 歷史上張騫出使西域,開啓了最早的絲綢之路,從此絲綢之路上的商人一次次穿越沙漠和山脉進行通商往來。 中國的絲綢、瓷器、茶葉,以及印度的佛教、希臘的哲學等都在這條路上得到充分地傳承和發展。\",\"ssml\":false},\"backgrounds\":[{\"type\":0,\"name\":\"背景\",\"url\":\"http://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/test/background.png\",\"rect\":[0,0,1080,1920],\"cycle\":false,\"start\":0,\"duration\":-1}],\"foregrounds\":[{\"type\":0,\"name\":\"前景\",\"url\":\"http://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/test/frontgroud.png\",\"rect\":[0,1359,1092,561],\"cycle\":false,\"start\":0,\"duration\":-1}],\"foreground-texts\":[{\"text\":\"絲綢之路介紹\",\"font_size\":20,\"font_family\":\"Noto Sans S Chinese Black\",\"position\":{\"x\":100,\"y\":200},\"rgba\":[100,200,100,100]}]}"

}

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Integer False 任務id

# 響應樣例

{

    "code": 0,

    "message": "success",

    "data": 1

}
# json參數說明
名稱 類型 取值示例 必填 說明
version String "0.0.17" 視頻合成json配置文件最新版本號
video_format String "mp4" 視頻輸出格式,取值爲MP4、WEBM、MOV,如果沒有該字段,默認爲MP4。其中,WEBM和MOV格式支持透明通道。
resolution Int Array [1080,1920] 視頻分辨率,建議選擇[480,854],[720,1280],[1080,1920]三種竪屏格式,人物模型分辨率爲2K(1080 * 1920)和 4K(2160 * 3840),選擇不同分辨率需要調整數字人形象比例以達到較好的效果,例如選擇[1080,1920]分辨率,則建議 4K數字人形象scale 參數調整爲0.5左右
bit_rate Float 8 視頻碼率(Mbps),最大值16,最小值1
frame_rate Integer 25 視頻幀率,目前只支持25fps
watermark Object 視頻水印
 show Boolean True 是否顯示視頻水印
 content String "測試 Test " 視頻水印內容,若開啓但不填寫內容,則自動進行填寫。
invisible-watermark Object 視頻隱藏水印,僅支持 mp4
 show Boolean True 是否開啓視頻隱藏水印。
 content String "1234567890123456 " 隱藏水印文字 ,不可以用中文!僅限英文+數字,一共16個字符,如果不足16字符,後面會自動補0,如果超過16,會截取前16字符。
digital_role Object 包含內容如下
 id Integer 1 數字人id
 face_feature_id String "1" 數字人face feature id
 name String "小李" 數字人名稱
 url String "https://xxx/role.zip" 數字人形象zip包。在合成視頻中,爲必傳參數。在視頻直播場景中,本項無需設置值,使用fileid
 fileId String "12345" 預熱素材上傳後的id,在視頻直播場景爲必傳內容
 position Object 包含內容如下 數字人形象圖片的起始像素位置,以1080*1920分辨率大小畫布的左上角爲原點,向右爲x方向,向下爲y方向
  x Integer 0 x方向坐標值
  y Integer 0 y方向坐標值
 scale Float 1.0 數字人形象比例
 rotation Float 0.0 旋轉角度,取值[0.0,360.0],畫布坐標系Y軸的反方向爲0度,順時針方向的夾角爲旋轉角,旋轉時以圖片中心點爲錨點
 volume Integer 0 數字人播報音量,大小取值範圍0~100。注:最低版本要求:0.0.13。
 z_position Integer 0 圖層順序,各個 zposition 不可重複,數字越大顯示越靠前。 注:最低版本要求:0.0.6(必須字段)。
 start_frame_index Integer 0 合成視頻起始幀,取值範圍爲[1, N],如果輸入參數範圍不在範圍內,直接返回錯誤。注:最低版本要求:0.0.14。精品數字人不建議設置該參數
tts_config Object 包含內容如下 tts配置。tts_query和audios必須存在其一,tts_query和audios都存在時,tts_query優先
 qid String 8wfZav:AEA_Z10Mqp9GCwDGMrz8xIzi3VScxNzUtLCh 填寫此字段會覆蓋 voiceid, languagevendor_id字段。
 id String "zh-CN-XiaoxuanNeural" 發音人id , 同 voiceID
 name String "曉萱" 發音人名稱
 vendor_id Integer 4 供應商id ,即 vendor_id ,需要與使用的TTS音色模型信息保持一致。隨意填寫會有錯誤。不要隨意填寫。使用qid的時候可以沒有這個字段。
 language String "zh-CN" 語言碼
 pitch_offset Float 0.0 音調,數值越大越尖銳,越低越低沉,支持範圍 [-60, 60]
 speed_ratio Float 1 語速,數值越大語速越慢,支持範圍 [0.5, 2]
 volume Integer 100 音量,數值越大聲音越大,支持範圍 [1, 400]
tts_query Object 包含內容如下 tts語音合成。tts_query和audios必須存在其一,tts_query和audios都存在時,tts_query優先
 content String "尊敬的觀衆朋友們,大家好!非常榮幸能够在這個美好的時刻與大家相聚,歡迎收看今天的節目。" 待合成語音的文本內容,字數不得少于10個字,所有語言的發音人都可以合成英文query;所有語言的發音人都可以合成自己語言的query;粵語、滬語等中文方言發音人可以合成中文query
 use_action Boolean false false 是否tts文本中支持動作編輯
tts文本中動作定義如下:若想要插入某個動作,則在文本對應位置插入{action index:動作序號}。例如{action index:0}。action和index之間空格分割。其中動作序號可在數字人的結果json中獲取。如果用戶TTS本身需要輸出{action},則使用^{action }來進行轉義,不作爲動作提取
 ssml Boolean false 是否使用ssml,開啓後query可以使用USSML,推薦使用USSML
audios Object Array 包含內容如下 音頻驅動。tts_query和audios必須存在其一,tts_query和audios都存在時,tts_query優先
 url Object {"url":"https://xxx/audio.mp3"} 數組,支持多條mp3格式的驅動音頻文件
subtitle Object 包含內容如下 字幕
 url String "https://xxx/subtitle.srt" 字幕文件列表。0.0.13及之前版本只解析此字段
 urls String Array ["https://xxx/subtitle.srt","https://xxx/subtitle.srt"] 0.0.14及之後版本優先解析此字段,如果此字段不存在,則解析url字段。
特殊情况說明:如果版本號大于等于0.0.14,audios中存在多個音頻,此時仍然解析url字段,只顯示一個字幕,這是正常case。
 scale Float 1.0 文字縮放比例,取值範圍0~+∞,默認爲1,原始參考尺寸爲font_size。
 position Object 包含內容如下 字幕起始位置,以1080*1920分辨率大小畫布的左上角爲原點,向右爲x方向,向下爲y方向,默認位置爲視頻的下方,字幕效果呈現爲居中對齊。注:最低版本要求:0.0.13。
  x Integer 0 x方向坐標值
  y Integer 0 y方向坐標值
 rgba Int Array [100,100,100,100] 字幕顔色,按照rgba形式傳入,取值範圍 0~255 【a通道暫不支持】
 font_size Integer 20 字幕字體大小設置
 font_family String "Noto Sans S Chinese Black" 字體名稱,支持的字體見json支持字體列表
 stroke_width Float 2 描邊寬度,取值範圍0~+∞,默認爲0,表示描邊寬度。注:最低版本要求:0.0.10。
 stroke_rgba Int Array [100,100,100,100] 字幕描邊顔色,按照rgba形式傳入,取值範圍 0~255 【a通道暫不支持】注:最低版本要求:0.0.10。
 background_rgba Int Array [100,100,100,100] 字幕背景(字體底色)顔色, 取值範圍0~255。a通道爲0時表示全透明。注:最低版本要求:0.0.10。
 opacity Float 0.5 字幕圖層透明度, 取值範圍0~1。0表示全透明,1表示不透明。注:最低版本要求:0.0.10。
 subtitle_max_len Integer 10 字幕最大切分長度,默認爲 0,即不限長度,若未設置最大切分字數,設定字幕占用最大長度爲畫布寬度的80%,超出則自動折行。注:最低版本要求:0.0.10。
 subtitle_cut_by_punc Boolean True 是否按標點符號切分。注:最低版本要求:0.0.10。
 rotation Float 0.0 旋轉角度,取值[0.0,360.0],畫布坐標系Y軸的反方向爲0度,順時針方向的夾角爲旋轉角,旋轉時以圖片中心點爲錨點。注:最低版本要求:0.0.14。
 auto_font_size Boolean True 不填寫,默認爲True,字幕根據公式來計算最終顯示的font size,與前景文字、標題在同樣的font size設置下,顯示效果不同;False,字幕采用與前景文字、標題一樣的font size規則。
 sub_to_canvas_width_ratio Float 1.0 不填寫,默認爲1.0。此字段表示字幕所占用畫布寬度的比例,取值範圍爲(0, 2],如果傳入參數<=0或者>2,則默認將值重置爲1.0。如果單行顯示不了,則換行。
backgrounds Object Array 包含內容如下 背景
 type Integer 0 0:圖片,支持jpg、png格式;1:視頻,支持mp4格式,幀率要求 25 以上,分辨率暫無要求,不同分辨率的視頻按照短邊撑滿,視頻等比例縮放形式處理
 name String "背景" 背景名稱
 url String "https://xxx/bg.png" 背景文件url,如沒設置背景圖或視頻,Webm格式展示黑色背景;Mp4格式展示灰色默認的frame的背景效果。在視頻直播場景中,該字段爲空,使用fileid字段
 fileId String "12345" 預熱素材上傳後的id,在視頻直播場景爲必傳內容
 rect Int Array [0,0,1080,1920] 【暫不支持】 背景起始位置和大小,以1080*1920分辨率畫布爲參考,左上角爲(0,0),當前不支持自定義,默認短邊撑滿,長邊等比例縮放形式顯示
 cycle Boolean false 針對視頻有效,false:單次播放,true:循環播放
 start Integer 0 背景開始時間,以ms爲單位
 duration Integer -1 背景持續時間,以ms爲單位,-1爲默認值,表示隨視頻一直存在
 play_offset Integer 1 視頻直播場景生效,針對視頻生效,該背景視頻從背景視頻本身的開始播放時間,以ms爲單位
 volume Integer 0 背景視頻音量,數值越大聲音越大,支持範圍 [0, 100],標準音量。注:最低版本要求:0.0.13。
background-musics Object Array 包含內容如下 背景音樂
 url String "https://xxx/bgm.mp3" 背景音樂url
 volume Integer 100 音量,數值越大聲音越大,支持範圍 [0, 100],標準音量100
 duration Integer -1 持續時間,單位毫秒,-1爲默認值,表示隨視頻一直存在。只要duration 時間到,不論是否循環均會停止/消失
 start Integer 0 開始時間,單位毫秒。0爲默認值,表示從視頻第0毫秒開始播放背景音樂。
 cycle Boolean True false:單次播放,true:循環播放
foregrounds Object Array 包含內容如下
 type Integer 0 0:圖片,支持jpg、png格式;1:視頻,支持mp4格式
 name String "前景"
 url String "https://xxx/fg.png" 前景文件url,圖片支持png或jpg ,視頻支持mp4格式。在視頻直播場景,該字段爲爲空,使用fileid字段
 fileId String "12345" 預熱素材上傳後的id,在視頻直播場景爲必傳內容
 rect Int Array [0,0,1080,1920] 起始位置和大小,以1080*1920分辨率畫布爲參考
 rotation Float 0.0 旋轉角度,取值[0.0,360.0],畫布坐標系Y軸的反方向爲0度,順時針方向的夾角爲旋轉角,旋轉時以圖片中心點爲錨點
 cycle Boolean False 針對視頻有效,false:單次播放,true:循環播放,前景視頻單次播放完成後,如未達到指定持續時間節點,前景視頻停留在最後一幀
 z_position Integer 2 圖層順序,各個 zposition 不可重複,數字越大顯示越靠前。注:最低版本要求:0.0.6(必須字段)。
 start Integer 0 前景開始時間,以ms爲單位
 play_offset Integer 1 視頻直播場景生效,針對視頻生效,該背景視頻從背景視頻本身的開始播放時間,以ms爲單位
 duration Integer -1 前景持續時間,以ms爲單位,-1爲默認值,表示隨視頻一直存在
 volume Integer 0 前景視頻音量,數值越大聲音越大,支持範圍 [0, 100],標準音量。注:最低版本要求:0.0.13。
foreground-texts Object Array 包含內容如下 前景文字
 text String "前景文字" 前景文字內容
 scale Float 1.0 文字縮放比例,取值範圍0~+∞,默認爲1,原始參考尺寸爲font_size。
 duration Integer -1 持續時間,單位毫秒,-1爲默認值,表示隨視頻一直存在。只要duration 時間到,不論是否循環均會停止/消失
 start Integer 0 開始時間,單位毫秒。0爲默認值,表示從視頻第0毫秒開始播放前景文字。
 position Object 包含內容如下 前景文字起始位置,以1080*1920分辨率大小畫布的左上角爲原點,向右爲x方向,向下爲y方向
  x Integer 0 x方向坐標值
  y Integer 0 y方向坐標值
 rgba Int Array [100,100,100,100] 前景文字顔色,按照rgba形式傳入,取值範圍 0~255 【a通道暫不支持】
 font_size Integer 20 前景文字字體大小設置
 font_family String "Noto Sans S Chinese Black" 字體名稱,支持的字體見json支持字體列表
 stroke_width Float 2 描邊寬度,取值範圍0~+∞,默認爲0,表示描邊寬度
 stroke_rgba Int Array [100,100,100,100] 前景文字描邊顔色,按照rgba形式傳入,取值範圍 0~255 【a通道暫不支持】
 background_rgba Int Array [100,100,100,100] 前景文字背景(字體底色)顔色, 取值範圍0~255。a通道爲0時表示全透明。注:最低版本要求:0.0.10。
 opacity Float 0.5 前景文字圖層透明度, 取值範圍0~1。0表示全透明,1表示不透明。注:最低版本要求:0.0.10。
 z_position Integer 2 圖層順序,各個 zposition 不可重複,數字越大顯示越靠前。注:最低版本要求:0.0.8(必須字段)。
 rotation Float 0.0 旋轉角度,取值[0.0,360.0],畫布坐標系Y軸的反方向爲0度,順時針方向的夾角爲旋轉角,旋轉時以圖片中心點爲錨點。注:最低版本要求:0.0.14。
title Object Array 包含內容如下 標題文字 ,其圖層在數字人,背景,前景文字的上層。注:最低版本要求:0.0.10。
 text String "標題文字" 標題文字內容
 scale Float 1.0 文字縮放比例,取值範圍0~+∞,默認爲1,原始參考尺寸爲font_size。
 position Object 包含內容如下 標題文字起始位置,以1080*1920分辨率大小畫布的左上角爲原點,向右爲x方向,向下爲y方向
  x Integer 0 x方向坐標值
  y Integer 0 y方向坐標值
 rgba Int Array [100,100,100,100] 標題文字顔色,按照rgba形式傳入,取值範圍 0~255 【a通道暫不支持】
 font_size Integer 20 標題文字字體大小設置。單位爲px。
 font_family String "Noto Sans S Chinese Black" 字體名稱,支持的字體見json支持字體列表
 stroke_rgba Int Array [100,100,100,100] 標題文字描邊顔色,按照rgba形式傳入,取值範圍 0~255 【a通道暫不支持】
 stroke_width Float 2 描邊寬度,取值範圍0~+∞,默認爲0,表示描邊寬度
 background_rgba Int Array [100,100,100,100] 標題文字背景(字體底色)顔色, 取值範圍0~255。a通道爲0時表示全透明。【a通道暫不支持】
 opacity Float 0.5 標題文字圖層透明度, 取值範圍0~1。0表示全透明,1表示不透明
 rotation Float 0.0 旋轉角度,取值[0.0,360.0],畫布坐標系Y軸的反方向爲0度,順時針方向的夾角爲旋轉角,旋轉時以圖片中心點爲錨點。注:最低版本要求:0.0.14。
effects Object 包含內容如下
 version String "1.0" 特效引擎版本
 beautify Object 包含內容如下 美顔
  whitenStrength Float 0.3 [0,1.0] 美白, 默認值 0.30, 0.0 不做美白
  whiten_mode Integer 0 美白模式:0(偏粉白), 1(自然白), 2(只有皮膚區域自然白)
  reddenStrength Float 0.36 [0,1.0]紅潤, 默認值 0.36, 0.0 不做紅潤
  smoothStrength Float 0.74 [0,1.0]磨皮, 默認值 0.74, 0.0 不做磨皮
  smooth_mode Integer 0 磨皮模式:0(臉部區域磨皮), 1(全圖磨皮), 2(臉部區域精細磨皮)
  shrinkRatio Float 0.11 [0,1.0]瘦臉, 默認值 0.11, 0.0 不做瘦臉效果
  enlargeRatio Float 0.13 [0,1.0]大眼, 默認值 0.13, 0.0 不做大眼效果
  smallRatio Float 0.10 [0,1.0]小臉, 默認值 0.10, 0.0 不做小臉效果
  narrowFace Float 0.0 [0,1.0] 窄臉, 默認值 0.0, 0.0 不做窄臉
  roundEyesRatio Float 0.0 [0,1.0] 圓眼, 默認值 0.0, 0.0不做圓眼
  thinFaceShapeRatio Float 0.0 [0,1.0]瘦臉型, 默認值 0.0, 0.0 不做瘦臉型效果
  chinLength Float 0.0 [-1, 1]下巴長短, 默認值爲 0.0,[-1, 0]爲短下巴,[0, 1]爲長下巴
  hairlineHeightRatio Float 0.0 [-1, 1]髮際綫, 默認值爲 0.0,[-1, 0] 爲低髮際綫,[0, 1]爲高髮際綫
  appleMusle Float 0.0 [0, 1.0]蘋果肌,默認值爲 0.0,0.0 不做蘋果肌
  narrowNoseRatio Float 0.0 [0, 1.0]瘦鼻,瘦鼻翼,默認值爲 0.0,0.0 不做瘦鼻
  noseLengthRatio Float 0.0 [-1, 1]長鼻, 默認值爲 0.0, [-1, 0]爲短 鼻,[0, 1]爲長鼻
  profileRhinoplasty Float 0.0 [0, 1.0]側臉隆鼻,默認值爲 0.0,0.0 不做側臉隆鼻效果
  mouthSize Float 0.0 [-1, 1]嘴巴大小,默認值爲 0.0,[-1, 0]爲放大嘴巴,[0, 1]爲縮小嘴巴
  philtrumLengthRatio Float 0.0 [-1, 1]人中長短, 默認值爲 0.0,[-1, 0]爲長人中,[0, 1]爲短人中
  eyeDistanceRatio Float 0.0 [-1, 1]調整眼距,默認值爲 0.0,[-1, 0]爲减小眼距,[0, 1]爲增加眼距
  eyeAngleRatio Float 0.0 [-1, 1]眼睛角度,默認值爲 0.0,[-1, 0]爲左眼逆時針旋轉,[0, 1]爲 左眼順時針旋轉,右眼與左眼相對
  openCanthus Float 0.0 [0, 1.0]開眼角,默認值爲 0.0, 0.0 不做開眼角
  shrinkJawbone Float 0.0 [0, 1.0]瘦下頷骨比例,默認值 0.0, 0.0 不做瘦顴骨
  shrinkRoundFace Float 0.0 [0, 1.0]圓臉瘦臉,默認值 0.0, 0.0 不做瘦臉
  shrinkLongFace Float 0.0 [0, 1.0]長臉瘦臉,默認值 0.0, 0.0 不做瘦臉
  shrinkGoddessFace Float 0.0 [0, 1.0]女神瘦臉,默認值 0.0, 0.0 不做瘦臉
  shrinkNaturalFace Float 0.0 [0, 1.0]自然瘦臉,默認值 0.0, 0.0 不做瘦臉
  shrinkWholeHead Float 0.0 [0, 1.0]整體縮放小頭,默認值 0.0, 0.0 不做整體縮放小頭效果
  contrastStrength Float 0.05 [0,1.0]對比度, 默認值 0.05, 0.0 不做對比度處理
  saturationStrength Float 0.1 [0,1.0]飽和度, 默認值 0.10, 0.0 不做飽和度處理
  sharpen Float 0.0 [0, 1.0]銳化, 默認值 0.0, 0.0 不做銳化
  clear Float 0.0 [0, 1.0]清晰强度,默認值 0.0,0.0 不做清晰
  bokehStrength Float 0.0 [0, 1.0]背景虛化强度, 默認值 0.0, 0.0 不做背景虛化
  eyeHeight Float 0.0 [-1, 1]眼睛位置比例, 默認值 0.0, [-1, 0]爲向下移動眼睛,[0, 1]爲向上移動眼睛
  mouthCorner Float 0.0 [0, 1.0]嘴角上移比例, 默認值 0.0, 0.0 不做嘴角調整
  hairline Float 0.0 [-1, 1]新髮際綫高低比例, 默認值 0.0, [-1, 0]爲低髮際綫,[0, 1]爲高髮際綫
 packages Object Array 包含內容如下 美妝參數
  url String "https://xxx/res.zip" 美妝資源url,美妝資源包請聯繫客服
  strength Float 0.3 美妝强度
 filter Object 包含內容如下 濾鏡參數
  onlyFigure Boolean false 濾鏡效果是否只作用于數字人,true只對數字人濾鏡,false爲全域濾鏡
  url String "https://xxx/res.zip" 濾鏡資源url,美妝資源包請聯繫客服
  strength Float 0.3 濾鏡强度
# json支持字體列表
語言 字體名稱
中文 Noto Sans S Chinese Black
中文 Noto Sans S Chinese Bold
中文 Noto Sans S Chinese DemiLight
中文 Noto Sans S Chinese Light
中文 Noto Sans S Chinese Medium
中文 Noto Sans S Chinese Regular
中文 Noto Sans S Chinese Thin
中文 倉耳漁陽體 W03
中文 站酷酷黑
中文 站酷快樂體2016修訂版
中文 站酷慶科黃油體
中文 站酷文藝體
中文 站酷小薇LOGO體
中文 得意黑
中文 釘釘進步體
中文 阿裏媽媽東方大楷
中文 阿裏媽媽數黑體
中文 字魂扁桃體
中文 包圖小白體
中文 龐門正道粗書體
中文 楊任東竹石體-Bold
中文 優設標題黑
中文 Gen Jyuu Gothic Normal
中文 字制區喜脉體
中文 文道潮黑
中文 Alibaba-PuHuiTi-Bold
中文 Alibaba-PuHuiTi-Heavy
中文 Alibaba-PuHuiTi-Light
中文 Alibaba-PuHuiTi-Medium
中文 Alibaba-PuHuiTi-Regular
阿拉伯語 mastollehregular-2oaxk
韓語 HANDotumLVT
韓語 HANDotumLVT-bold
日語 SourceHanSansJP-Bold
日語 SourceHanSansJP-ExtraLight
日語 SourceHanSansJP-Heavy
日語 SourceHanSansJP-Light
日語 SourceHanSansJP-Medium
日語 SourceHanSansJP-Normal
日語 SourceHanSansJP-Regular
# json示例
{
	"version": "0.0.13",
	"video_format": "MP4",
	"resolution": [1080, 1920],
	"bit_rate": 8,
	"frame_rate": 25,
	"watermark": {
		"show": true,
		"content": "內部測試"
	},
	"digital_role": {
		"id": 4051,
		"face_feature_id": "0325_nina_s3_beauty",
		"name": "Nina",
		"url": "https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/materials/77/0325_nina_s3_beauty_20230523213912566.zip",
		"position": {
			"x": 0,
			"y": 0
		},
		"scale": 1.0,
		"z_position": 1,
		"rotation": 0.0
	},
	"tts_config": {
		"id": "xiaoyue",
		"name": "曉月",
		"vendor_id": 3,
		"language": "zh-CN",
		"pitch_offset": 0.0,
		"speed_ratio": 1,
		"volume": 100
	},
	"tts_query": {
		"content": "您好,尊貴的客戶",
		"ssml": false
	},
	"audios": [{
		"url": "https://dhpoc.softsugar.com/adapter/static/9b158cc9-8e42-4d09-b928-49dd9941d922.mp3"
	}, {
		"url": "https://dhpoc.softsugar.com/adapter/static/9b158cc9-8e42-4d09-b928-49dd9941d922.mp3"
	}],
	"subtitle": {
		"url": "https://aigc.blob.core.chinacloudapi.cn/audio/tts-srt/823v6j88s1k7aobpe7wmqm83q_de347214-96f2-4246-b283-17f40fe6abba.srt",
		"position": {
			"x": 100,
			"y": 300
		},
		"rgba": [100, 200, 100, 100],
		"font_size": 20,
    "stroke_width": 5.0,
		"stroke_rgba": [255, 0, 0, 0],
		"opacity": 0.5,
		"background_rgba": [0, 255, 0, 200],
		"subtitle_max_len": 8,
		"subtitle_cut_by_punc": "True",
		"font_family": "Noto Sans S Chinese Black"
	},
	"backgrounds": [{
		"type": 0,
		"name": "背景",
		"url": "https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/test/background.png",
		"rect": [0, 0, 1080, 1920],
		"cycle": false,
		"start": 0,
		"duration": -1
	}],
	"background-musics": [{
		"url": "https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/mayahui/%E7%BE%A4%E6%98%9F%20-%20%E5%96%9C%E6%B4%8B%E6%B4%8B.mp3",
		"volume": 100,
		"cycle": false
	}],
	"foregrounds": [{
		"type": 0,
		"name": "前景",
		"url": "http://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/test/frontgroud.png",
		"rect": [0, 0, 1080, 1920],
		"rotation": 0.0,
		"z_position": 0,
		"cycle": false,
		"start": 0,
		"duration": -1
	}],
	"foreground-texts": [{
		"text": "前景",
		"font_size": 20,
		"font_family": "Noto Sans S Chinese Black",
    "z_position": 10,
    "stroke_width": 5.0,
		"stroke_rgba": [255, 0, 0, 0],
    "opacity": 0.5,
		"position": {
			"x": 0,
			"y": 0
		},
    "background_rgba": [0, 255, 0, 200],
		"rgba": [100, 200, 100, 100]
	}],
  "title": {
		"text": "這是標題",
		"rgba": [100, 255, 255, 255],
		"position": {
			"x": 540,
			"y": 200
		},
		"font_size": 50,
		"font_family": "Noto Sans S Chinese Black",
		"stroke_width": 5.0,
		"stroke_rgba": [255, 0, 0, 0],
		"scale": 1.0,
		"opacity": 0.5,
		"background_rgba": [0, 255, 0, 200]
	},
	"effects": {
		"version": "1.0",
		"beautify": {
			"whitenStrength": 0.30,
			"whiten_mode": 0,
			"reddenStrength": 0.36,
			"smoothStrength": 0.74,
			"smooth_mode": 0,
			"shrinkRatio": 0.11,
			"enlargeRatio": 0.13,
			"smallRatio": 0.10,
			"narrowFace": 0.0,
			"roundEyesRatio": 0.0,
			"thinFaceShapeRatio": 0.0,
			"chinLength": 0.0,
			"hairlineHeightRatio": 0.0,
			"appleMusle": 0.0,
			"narrowNoseRatio": 0.0,
			"noseLengthRatio": 0.0,
			"profileRhinoplasty": 0.0,
			"mouthSize": 0.0,
			"philtrumLengthRatio": 0.0,
			"eyeDistanceRatio": 0.0,
			"eyeAngleRatio": 0.0,
			"openCanthus": 0.0,
			"brightEyeStrength": 0.0,
			"removeDarkCircleStrength": 0.0,
			"removeNasolabialFoldsStrength": 0.0,
			"whiteTeeth": 0.0,
			"shrinkCheekbone": 0.0,
			"thinnerHead": 0.0,
			"openExternalCanthus": 0.0,
			"shrinkJawbone": 0.0,
			"shrinkRoundFace": 0.0,
			"shrinkLongFace": 0.0,
			"shrinkGoddessFace": 0.0,
			"shrinkNaturalFace": 0.0,
			"shrinkWholeHead": 0.0,
			"contrastStrength": 0.05,
			"saturationStrength": 0.10,
			"sharpen": 0.0,
			"clear": 0.0,
      "eyeHeight": 0.0,
			"mouthCorner": 0.05,
			"hairline": 0.10,
			"bokehStrength": 0.0
		},
		"packages": [{
			"url": "https://xxx/xxx.zip",
			"strength": 0.3
		}, {
			"url": "https://xxx/xxx.model",
			"strength": 0.5
		}],
		"filter": {
			"onlyFigure": false,
			"url": "https://xxx/xxx.model",
			"strength": 0.5
		}
	}
}

# 批量創建視頻合成任務

# 接口描述

根據用戶上傳的指定內容調用算法能力進行批量視頻合成,最終返回mp4格式的視頻文件列表供用戶下載。PaaS平臺支持7天在綫存儲,需要及時轉存,7天后生成內容將無法下載。

# 請求地址

POST /api/2dvh/v1/material/video/batchCreate

# 請求頭

Content-Type: application/json

# 請求參數

JSON數組格式,數組中對象的字段定義如下:

字段 類型 必填 描述
param String True 視頻生成參數(該參數爲json轉義後的字符串)
videoRequestId String True 視頻合成id,需唯一
videoName String True 視頻名稱
thumbnailUrl String False 縮略圖Url

# 請求樣例

[
  {
    "param": "video config",
    "videoName": "name",
    "videoRequestId": "aaa"
  },
  {
    "param": "video config",
    "videoName": "name",
    "videoRequestId": "bbb"
  }
]

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False data object ,异常時通常爲空
  - videoRequestId String True 視頻合成id,需唯一
  - taskId Long True 任務id
  - description String True 任務派發結果描述

# 響應樣例

{
  "code": 0,
  "message": "success",
  "data": [
    {
      "videoRequestId": "aaa",
      "taskId": 26,
      "description": "隊列等待中"
    },
    {
      "videoRequestId": "bbb",
      "taskId": 27,
      "description": "隊列等待中"
    }
  ]
}

# 創建接管視頻合成任務

# 接口描述

根據用戶上傳的指定內容調用算法能力進行接管視頻合成,最終返回mp4/webm格式的視頻文件供用戶下載。PaaS平臺支持7天在綫存儲,需要及時轉存,7天后生成內容將無法下載。

# 請求地址

POST /api/2dvh/v1/material/video/takeover/create

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
param String True 創建接管視頻合成任務需要傳入正確的param信息,其中包括視頻合成參數(該參數爲json轉義後的字符串),視頻合成參數定義參見視頻合成任務json定義,其中人物,前景,背景只支持field id。
videoName String True 視頻名稱
thumbnailUrl String False 縮略圖url

# 請求樣例

{
  "videoName": "xxx",
  "param": "{\"version\":\"0.0.13\",\"video_format\":\"MP4\",\"resolution\":[1080,1920],\"bit_rate\":8,\"frame_rate\":25,\"watermark\":{\"show\":true,\"content\":\"內部測試\"},\"digital_role\":{\"id\":4051,\"face_feature_id\":\"\",\"name\":\"Nina\",\"url\":\"\",\"fileId\":\"12345\",\"position\":{\"x\":0,\"y\":0},\"scale\":1.0,\"z_position\":1,\"rotation\":0.0,\"start_frame_index\":123},\"tts_config\":{\"id\":\"xiaoyue\",\"name\":\"曉月\",\"vendor_id\":3,\"language\":\"zh-CN\",\"pitch_offset\":0.0,\"speed_ratio\":1,\"volume\":100},\"tts_query\":{\"content\":\"您好,尊貴的客戶\",\"ssml\":false},\"audios\":[{\"url\":\"https://dhpoc.softsugar.com/adapter/static/9b158cc9-8e42-4d09-b928-49dd9941d922.mp3\"},{\"url\":\"https://dhpoc.softsugar.com/adapter/static/9b158cc9-8e42-4d09-b928-49dd9941d922.mp3\"}],\"backgrounds\":[{\"type\":0,\"name\":\"背景\",\"url\":\"\",\"fileId\":\"12345\",\"rect\":[0,0,1080,1920],\"cycle\":false,\"start\":0,\"play_offset\":123,\"duration\":-1}],\"foregrounds\":[{\"type\":0,\"name\":\"前景\",\"url\":\"\",\"fileId\":\"12345\",\"rect\":[0,0,1080,1920],\"rotation\":0.0,\"z_position\":0,\"cycle\":false,\"play_offset\":123,\"start\":0,\"duration\":-1}],\"foreground-texts\":[{\"text\":\"前景\",\"font_size\":20,\"font_family\":\"NotoSansSChineseBlack\",\"z_position\":10,\"stroke_width\":5.0,\"stroke_rgba\":[255,0,0,0],\"opacity\":0.5,\"position\":{\"x\":0,\"y\":0},\"background_rgba\":[0,255,0,200],\"rgba\":[100,200,100,100]}],\"title\":{\"text\":\"這是標題\",\"rgba\":[100,255,255,255],\"position\":{\"x\":540,\"y\":200},\"font_size\":50,\"font_family\":\"NotoSansSChineseBlack\",\"stroke_width\":5.0,\"stroke_rgba\":[255,0,0,0],\"scale\":1.0,\"opacity\":0.5,\"background_rgba\":[0,255,0,200]},\"effects\":{\"version\":\"1.0\",\"beautify\":{\"whitenStrength\":0.30,\"whiten_mode\":0,\"reddenStrength\":0.36,\"smoothStrength\":0.74,\"smooth_mode\":0,\"shrinkRatio\":0.11,\"enlargeRatio\":0.13,\"smallRatio\":0.10,\"narrowFace\":0.0,\"roundEyesRatio\":0.0,\"thinFaceShapeRatio\":0.0,\"chinLength\":0.0,\"hairlineHeightRatio\":0.0,\"appleMusle\":0.0,\"narrowNoseRatio\":0.0,\"noseLengthRatio\":0.0,\"profileRhinoplasty\":0.0,\"mouthSize\":0.0,\"philtrumLengthRatio\":0.0,\"eyeDistanceRatio\":0.0,\"eyeAngleRatio\":0.0,\"openCanthus\":0.0,\"brightEyeStrength\":0.0,\"removeDarkCircleStrength\":0.0,\"removeNasolabialFoldsStrength\":0.0,\"whiteTeeth\":0.0,\"shrinkCheekbone\":0.0,\"thinnerHead\":0.0,\"openExternalCanthus\":0.0,\"shrinkJawbone\":0.0,\"shrinkRoundFace\":0.0,\"shrinkLongFace\":0.0,\"shrinkGoddessFace\":0.0,\"shrinkNaturalFace\":0.0,\"shrinkWholeHead\":0.0,\"contrastStrength\":0.05,\"saturationStrength\":0.10,\"sharpen\":0.0,\"clear\":0.0,\"eyeHeight\":0.0,\"mouthCorner\":0.05,\"hairline\":0.10,\"bokehStrength\":0.0}}}"
}

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Integer False 任務id

# 響應樣例

{

    "code": 0,

    "message": "success",

    "data": 1

}
# json參數說明

同視頻合成任務參數,請參考視頻合成任務json參數說明

# json示例
{
	"version": "0.0.13",
	"video_format": "MP4",
	"resolution": [1080, 1920],
	"bit_rate": 8,
	"frame_rate": 25,
	"watermark": {
		"show": true,
		"content": "內部測試"
	},
	"digital_role": {
		"id": 4051,
		"face_feature_id": "",
		"name": "Nina",
		"url": "",
        "fileId": "12345",
		"position": {
			"x": 0,
			"y": 0
		},
		"scale": 1.0,
		"z_position": 1,
		"rotation": 0.0,
        "start_frame_index":123
	},
	"tts_config": {
		"id": "xiaoyue",
		"name": "曉月",
		"vendor_id": 3,
		"language": "zh-CN",
		"pitch_offset": 0.0,
		"speed_ratio": 1,
		"volume": 100
	},
	"tts_query": {
		"content": "您好,尊貴的客戶",
		"ssml": false
	},
	"audios": [{
		"url": "https://dhpoc.softsugar.com/adapter/static/9b158cc9-8e42-4d09-b928-49dd9941d922.mp3"
	}, {
		"url": "https://dhpoc.softsugar.com/adapter/static/9b158cc9-8e42-4d09-b928-49dd9941d922.mp3"
	}],
	"backgrounds": [{
		"type": 0,
		"name": "背景",
		"url": "",
        "fileId": "12345",
		"rect": [0, 0, 1080, 1920],
		"cycle": false,
		"start": 0,
        "play_offset": 123,
		"duration": -1
	}],
	"foregrounds": [{
		"type": 0,
		"name": "前景",
		"url": "",
        "fileId": "12345",
		"rect": [0, 0, 1080, 1920],
		"rotation": 0.0,
		"z_position": 0,
		"cycle": false,
        "play_offset": 123,
		"start": 0,
		"duration": -1
	}],
	"foreground-texts": [{
		"text": "前景",
		"font_size": 20,
		"font_family": "Noto Sans S Chinese Black",
		"z_position": 10,
		"stroke_width": 5.0,
		"stroke_rgba": [255, 0, 0, 0],
		"opacity": 0.5,
		"position": {
			"x": 0,
			"y": 0
		},
    "background_rgba": [0, 255, 0, 200],
		"rgba": [100, 200, 100, 100]
	}],
	"title": {
		"text": "這是標題",
		"rgba": [100, 255, 255, 255],
		"position": {
			"x": 540,
			"y": 200
		},
		"font_size": 50,
		"font_family": "Noto Sans S Chinese Black",
		"stroke_width": 5.0,
		"stroke_rgba": [255, 0, 0, 0],
		"scale": 1.0,
		"opacity": 0.5,
		"background_rgba": [0, 255, 0, 200]
	},
	"effects": {
		"version": "1.0",
		"beautify": {
			"whitenStrength": 0.30,
			"whiten_mode": 0,
			"reddenStrength": 0.36,
			"smoothStrength": 0.74,
			"smooth_mode": 0,
			"shrinkRatio": 0.11,
			"enlargeRatio": 0.13,
			"smallRatio": 0.10,
			"narrowFace": 0.0,
			"roundEyesRatio": 0.0,
			"thinFaceShapeRatio": 0.0,
			"chinLength": 0.0,
			"hairlineHeightRatio": 0.0,
			"appleMusle": 0.0,
			"narrowNoseRatio": 0.0,
			"noseLengthRatio": 0.0,
			"profileRhinoplasty": 0.0,
			"mouthSize": 0.0,
			"philtrumLengthRatio": 0.0,
			"eyeDistanceRatio": 0.0,
			"eyeAngleRatio": 0.0,
			"openCanthus": 0.0,
			"brightEyeStrength": 0.0,
			"removeDarkCircleStrength": 0.0,
			"removeNasolabialFoldsStrength": 0.0,
			"whiteTeeth": 0.0,
			"shrinkCheekbone": 0.0,
			"thinnerHead": 0.0,
			"openExternalCanthus": 0.0,
			"shrinkJawbone": 0.0,
			"shrinkRoundFace": 0.0,
			"shrinkLongFace": 0.0,
			"shrinkGoddessFace": 0.0,
			"shrinkNaturalFace": 0.0,
			"shrinkWholeHead": 0.0,
			"contrastStrength": 0.05,
			"saturationStrength": 0.10,
			"sharpen": 0.0,
			"clear": 0.0,
			"eyeHeight": 0.0,
			"mouthCorner": 0.05,
			"hairline": 0.10,
			"bokehStrength": 0.0
		}
	}
}

# 創建TTS個人音色模型生成任務(QID)

# 接口描述

TTS個人音色模型生成( QID)服務可根據用戶上傳的真人采集或錄製的語音素材文件,以及聲音複刻同意文件,通過算法訓練産出發音效果與聲音素材提供者一致的數字人TTS音色模型。爲保證訓練效果,請在采集時遵照商湯數字人音色複製采集製作規範,內容包括環境要求、設備要求、發音要求、授權要求、朗讀脚本,具體參考:采集規範 (opens new window),PaaS平臺支持7天在綫存儲,需要及時轉存,7天后生成內容將無法下載。

# 請求地址

POST /api/2dvh/v1/material/voice/clone/qid/create

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
audioUrl String True 訓練音頻文件 URL。素材支持格式:wav, mp3, m4a, mp4, mov, aac
audioLanguage String True 音頻文件中使用的主要語言。zh-CN 中文普通話,en-US 美式英文。遵循 BCP 47 標準
consent Object True 用戶同意聲明信息
  - audioUrl String True 用戶同意音頻文件 URL。用戶同意文件應與音頻文件在相同環境下錄製幷使用同一種語言。
中文的用戶同意聲明文本爲:”我(發音人姓名)確認我的聲音將會被(公司名稱)使用于創建合成版本語音。”。
English: "I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."
Japanese: "私(姓名を記入)は自身の音聲を(會社名を記入)が使用し、合成音聲を作り使用されることに同意します。"
Korean: "나는 [본인의 이름을 말씀하세요] 내 목소리의 녹음을 이용해 합성 버전을 만들어 사용된다는 것을 [회사 이름을 말씀하세요]알고 있습니다."
素材支持格式:wav, mp3, m4a, mp4, mov, aac
  - speakerName String True 用戶同意音頻文件中使用的發音人姓名,必須與音頻文件中的發音人姓名保持一致。長度限制不大于64字符
  - companyName String True 用戶同意文件中使用的公司名稱,必須與音頻文件中的公司名稱保持一致。長度限制不大于64字符
taskType String True 訓練算法類型。TTS3,TTS6,TTS7,TTS8,TTS101。默認填寫TTS3。更多需求請諮詢技術支持
voice Object True 發音人信息
  - name String True 發音人名稱。長度限制不大于64字符
  - gender Integer True 發音人性別 (1: Male, 2 : Female)
musicSep Boolean False 是否進行音頻背景音樂消除(聲源分離)
trainMode String False 訓練模式,僅對TTS3有效。common: 常規訓練模式,默認爲 common模式;backend_only: 極速訓練模式,大幅度壓縮模型訓練時長,效果也會有影響

# 請求樣例

{
  "audioUrl": "http://oss.com/abc/object.mp3",
  "audioLanguage": "zh-CN",
  "consent": {
      "audioUrl":"http://oss.com/abc/xx.mp3",
      "speakerName": "xiaowang",
      "companyName": "XXXX"
  },
  "taskType": "TTS3",
  "voice": {
    "name": "xiaotang0",
    "gender": 2
  },
  "musicSep": false,
  "trainMode": "common"
}

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 任務id

# 響應樣例

{
    "code": 0,
    "message": "success",
    "data": 11890
}
# TTS音色訓練傳入音頻時間要求
訓練算法類型 時間要求
TTS3 至少5分鐘,20分鐘以上效果比較好
TTS6 30-90秒
TTS7 30-300秒
TTS8 30-300秒
TTS101 至少5分鐘,20分鐘以上效果比較好
# TTS語言標準(BCP 47 標準)
代碼 語言(地區)
en-US 英語(美國)
zh-CN 中文(中國)
af-ZA 南非荷蘭語(南非)
am-ET 阿姆哈拉語(埃塞俄比亞)
ar-EG 阿拉伯語(埃及)
ar-SA 阿拉伯語(沙特阿拉伯)
az-AZ 阿塞拜疆語(阿塞拜疆)
bg-BG 保加利亞語(保加利亞)
bn-BD 孟加拉語(孟加拉國)
bn-IN 孟加拉語(印度)
bs-BA 波斯尼亞語(波斯尼亞和黑塞哥維那)
ca-ES 加泰羅尼亞語(西班牙)
cs-CZ 捷克語(捷克)
cy-GB 威爾士語(英國)
da-DK 丹麥語(丹麥)
de-AT 德語(奧地利)
de-CH 德語(瑞士)
de-DE 德語(德國)
el-GR 希臘語(希臘)
en-AU 英語(澳大利亞)
en-CA 英語(加拿大)
en-GB 英語(英國)
en-IE 英語(愛爾蘭)
en-IN 英語(印度)
es-ES 西班牙語(西班牙)
es-MX 西班牙語(墨西哥)
et-EE 愛沙尼亞語(愛沙尼亞)
eu-ES 巴斯克語(西班牙)
fa-IR 波斯語(伊朗)
fi-FI 芬蘭語(芬蘭)
fil-PH 菲律賓語(菲律賓)
fr-BE 法語(比利時)
fr-CA 法語(加拿大)
fr-CH 法語(瑞士)
fr-FR 法語(法國)
ga-IE 愛爾蘭語(愛爾蘭)
gl-ES 加利西亞語(西班牙)
he-IL 希伯來語(以色列)
hi-IN 印地語(印度)
hr-HR 克羅地亞語(克羅地亞)
hu-HU 匈牙利語(匈牙利)
hy-AM 亞美尼亞語(亞美尼亞)
id-ID 印度尼西亞語(印度尼西亞)
is-IS 冰島語(冰島)
it-IT 意大利語(意大利)
ja-JP 日語(日本)
jv-ID 爪哇語(印度尼西亞)
ka-GE 格魯吉亞語(格魯吉亞)
kk-KZ 哈薩克語(哈薩克斯坦)
km-KH 高棉語(柬埔寨)
kn-IN 卡納達語(印度)
ko-KR 韓語(韓國)
lo-LA 老撾語(老撾)
lt-LT 立陶宛語(立陶宛)
lv-LV 拉脫維亞語(拉脫維亞)
mk-MK 馬其頓語(馬其頓)
ml-IN 馬拉雅拉姆語(印度)
mn-MN 蒙古語(蒙古)
ms-MY 馬來語(馬來西亞)
mt-MT 馬耳他語(馬耳他)
my-MM 緬甸語(緬甸)
nb-NO 挪威語(博克馬爾,挪威)
ne-NP 尼泊爾語(尼泊爾)
nl-BE 荷蘭語(比利時)
nl-NL 荷蘭語(荷蘭)
pl-PL 波蘭語(波蘭)
ps-AF 普什圖語(阿富汗)
pt-BR 葡萄牙語(巴西)
pt-PT 葡萄牙語(葡萄牙)
ro-RO 羅馬尼亞語(羅馬尼亞)
ru-RU 俄語(俄羅斯)
si-LK 僧伽羅語(斯裏蘭卡)
sk-SK 斯洛伐克語(斯洛伐克)
sl-SI 斯洛文尼亞語(斯洛文尼亞)
so-SO 索馬裏語(索馬裏)
sq-AL 阿爾巴尼亞語(阿爾巴尼亞)
sr-RS 塞爾維亞語(塞爾維亞)
su-ID 巽他語(印度尼西亞)
sv-SE 瑞典語(瑞典)
sw-KE 斯瓦希裏語(肯尼亞)
ta-IN 泰米爾語(印度)
te-IN 泰盧固語(印度)
th-TH 泰語(泰國)
tr-TR 土耳其語(土耳其)
uk-UA 烏克蘭語(烏克蘭)
ur-PK 烏爾都語(巴基斯坦)
uz-UZ 烏茲別克語(烏茲別克斯坦)
vi-VN 越南語(越南)
zh-HK 中文(香港)
zh-TW 中文(臺灣)
zu-ZA 祖魯語(南非)

# 創建TTS個人音色模型生成任務(舊接口,不推薦使用)

# 接口描述

TTS個人音色模型生成服務可根據用戶上傳的真人采集或錄製的語音素材文件通過算法訓練産出發音效果與聲音素材提供者一致的數字人TTS音色模型。爲保證訓練效果,訓練音頻時長不得短于5分鐘,請在采集時遵照商湯數字人音色複製采集製作規範,內容包括環境要求、設備要求、發音要求、授權要求、朗讀脚本,具體參考:采集規範 (opens new window),PaaS平臺支持7天在綫存儲,需要及時轉存,7天后生成內容將無法下載。

# 請求地址

POST /api/2dvh/v1/material/voice/clone/create

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
url String True 訓練音頻文件URL,時長不得短于5分鐘
voice Object True 語音參數
  - name String True 發音人名稱
  - gender Integer True 發音人性別(1: Male,2 :Female)
  - language String True 發音人語言(當前僅支持zh-CN:中文普通話)
musicSep Boolean False 是否進行音頻背景音消除
sampleAudioMsg String False 示例音頻內容文字。默認不生成示例音頻。不超過500字。
trainMode String False 訓練模式,common: 常規訓練模式,默認爲 common模式;backend_only: 極速訓練模式,大幅度壓縮模型訓練時長,效果也會有影響。

# 請求樣例

{
  "url": "http://oss.com/abc/object.zip",
  "voice": {
    "name": "xiaotang0",
    "gender": 2,
    "language": "zh-CN"
  },
  "sampleAudioMsg": "我是商湯數字人!",
  "musicSep": true,
  "trainMode": "common"
}

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 任務id

# 響應樣例

{
    "code": 0,
    "message": "success",
    "data": 11890
}

# 創建人物形象模型生成任務

# 接口描述

根據用戶上傳的一個或多個視頻及指定內容調用算法能力進行人物形象模型生成,支持一次訓練産出一個或多個模型文件,算法最終返回人物形象模型的壓縮包和縮略圖文件供用戶下載。上傳視頻內容請參考采集規範 (opens new window)。PaaS平臺支持7天在綫存儲,需要及時轉存,7天后生成內容將無法下載。 若人物模型生成的效果不佳,請參考文檔上述的case 應對方案進行訓練參數調整。

支持普通數字人訓練,支持精品數字人訓練。

# 請求地址

POST /api/2dvh/v1/material/2davatar/model/multi/create

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
materialName String True 人物模型素材名稱,一次訓練任務僅支持同一命名
videoUrl String True 基礎base視頻素材下載地址 ,基礎視頻時長要求必須在6min以上
param String True 創建多視頻人物模型生成任務需要傳入正確的param信息,其中包括各類參數(該參數爲json轉義後的字符串),請參考下面的參數說明和 json 示例

# param參數說明

字段 類型 必填 描述
personal String True 基礎視頻參數,可被輔助視頻覆蓋。如果輔助視頻未填寫,將使用基礎視頻參數進行處理。
  - segmentStyle Integer True 背景分割方式:0:不分割,1:綠幕分割,2:普通分割,3:sdk做綠幕分割後處理(視頻合成時gpu後處理)
  - removeGreenEdge Boolean False 當segmentStyle=2時,設置有效,默認爲false,去除人物邊緣綠邊功能
  - greenParamsRefinethHBgr Integer False 當segmentStyle=1或 3時,設置有效, 默認 160,範圍0-255; refine alpha 高閾值 (對于背景爲紅綠藍),用于調整背景保留程度,值越大背景保留程度越大
  - greenParamsRefinethLBgr Integer False 當segmentStyle=1 或 3時,設置有效, 默認 40, 範圍0-255; refine alpha 低閾值 (對于背景爲紅綠藍),用于調整人體/物體邊緣保留寬度,值越大保留越多
  - greenParamsBlurKs Integer False 當segmentStyle=1或 3時,設置有效, 默認 3,平滑度; 去噪點的blur係數,大于等于0,平滑度越大越平滑,對邊緣有影響,若邊緣出現黑邊异色可以將該值升高,若邊緣出現內蝕可以該值適當降低
  - greenParamsColorbalance Integer False 當segmentStyle=1 或 3時, 設置有效,默認100, 去綠程度,範圍0-100,取值越大,去綠程度越高
  - greenParamsSpillByalpha Double False 當segmentStyle=1和3時,設置有效, 默認 0.5,去綠色彩平衡,範圍[-1.0 ~ 1.0],0 ~ 1 是减少偏色,-1 ~ 0 是增强色彩,小于0.5黃色會偏色,大于0.5青藍色會偏色,若使用藍幕分割,則默認值需要改爲 0.0
  - greenParamsSamplePointBgr int[] False 當segmentStyle=1 或 3時,設置有效,采樣顔色,由三個數值組成,各自取值範圍0-255,例如[0, 255, 0] ,若使用藍幕分割,則默認值需要改爲 [255, 0, 0]
  - assetStart Float False 裁剪視頻素材起始時間(秒)(精品數字人該參數無效)
  - assetEnd Float False 裁剪視頻素材終止時間(秒)(精品數字人該參數無效)
  - assetScale Float False 視頻素材縮放比例(默認1.0)
  - actionChange Object False 精品數字人相關參數。此組參數support=true時有效。表示訓練的數字人類型爲精品數字人。
actionChange部分與actionEdit部分互斥,請避免同時這兩組參數均爲true。
  -   - support Boolean True 是否支持精品數字人,true爲精品數字人。
  -   - staticRangeStart Float True 靜態素材開始時間(秒)(僅支持精品數字人)
  -   - staticRangeEnd Float True 靜態素材結束時間(秒)(僅支持精品數字人)
  -   - dynamicRangeStart Float True 動態素材開始時間(秒)(僅支持精品數字人)
  -   - dynamicRangeEnd Float True 動態素材結束時間(秒)(僅支持精品數字人)
  -   - gap Integer False 切出點最大間隔幀數(默認75)
  - actionEdit Object False 動作編輯數字人相關參數,此組參數support=true時有效,表示訓練的數字人類型爲動作編輯數字人。
actionChange部分與actionEdit部分互斥,請避免同時這兩組參數均爲true。
  -   - support Boolean True 是否支持支持動作編輯,true支持。
  -   - videoPath String True 動態素材文件地址
  -   - gap Integer False 切出點最大間隔幀數(默認25)
  -   - actionList Array True 動作列表
  -   -   - name String True 動作名稱
  -   -   - clipRangeStart Float True 開始時間(秒)
  -   -   - clipRangeEnd Float True 結束時間(秒)
  -   -   - description String False 動作的文字描述
persistent Object True 模型全域參數,不可被輔助視頻參數覆蓋。
  - avatarType Integer False 數類型,默認爲0.(0:數字人,1:動靜數字人,2:動作編輯數字人,3:快速數字人
  - videoCrfQuality Integer True 視頻編碼質量的參數crf, 參數越小質量越好但文件越大,默認23,允許範圍0-51,建議14-28
  - stage1Config Array True 人物模型口型訓練配置,默認爲0表示生成原始口型模型 ; 1 表示生成通用口型模型 ,後續用戶可根據實際效果選擇手動切換兩種口型模型
  - dev Object False 視頻素材模型訓練配置
  -   - stage2 Object False 視頻素材模型訓練配置
  -   -   - config Integer True 視頻素材模型訓練配置,模型尺寸,默認爲0,表示2k精度模型;1表示4k精度模型
override Array False 輔助視頻信息。(精品數字人該組參數無效,動作編輯數字人該組參數無效)
  - videoUrl String True 輔助視頻地址,如果輔助視頻未配置則personal中參數
  - segmentStyle Integer False 背景分割方式:0:不分割,1:綠幕分割,2:普通分割,3:sdk做綠幕分割後處理(視頻合成時gpu後處理)
  - removeGreenEdge Boolean False 當segmentStyle=2時,設置有效,默認爲false,去除人物邊緣綠邊功能
  - greenParamsRefinethHBgr Integer False 當segmentStyle=1或 3時,設置有效, 默認 160,範圍0-255; refine alpha 高閾值 (對于背景爲紅綠藍),用于調整背景保留程度,值越大背景保留程度越大
  - greenParamsRefinethLBgr Integer False 當segmentStyle=1 或 3時,設置有效, 默認 40, 範圍0-255; refine alpha 低閾值 (對于背景爲紅綠藍),用于調整人體/物體邊緣保留寬度,值越大保留越多
  - greenParamsBlurKs Integer False 當segmentStyle=1或 3時,設置有效, 默認 3,平滑度; 去噪點的blur係數,大于等于0,平滑度越大越平滑,對邊緣有影響,若邊緣出現黑邊异色可以將該值升高,若邊緣出現內蝕可以該值適當降低
  - greenParamsColorbalance Integer False 當segmentStyle=1 或 3時, 設置有效,默認100, 去綠程度,範圍0-100,取值越大,去綠程度越高
  - greenParamsSpillByalpha Double False 當segmentStyle=1和3時,設置有效, 默認 0.5,去綠色彩平衡,範圍[-1.0 ~ 1.0],0 ~ 1 是减少偏色,-1 ~ 0 是增强色彩,小于0.5黃色會偏色,大于0.5青藍色會偏色,若使用藍幕分割,則默認值需要改爲 0.0
  - greenParamsSamplePointBgr int[] False 當segmentStyle=1 或 3時,設置有效,采樣顔色,由三個數值組成,各自取值範圍0-255,例如[0, 255, 0] ,若使用藍幕分割,則默認值需要改爲 [255, 0, 0]
  - assetStart Float False 裁剪視頻素材起始時間(秒)
  - assetEnd Float False 裁剪視頻素材終止時間(秒)
  - assetScale Float False 視頻素材縮放比例(默認1.0)

# 請求樣例

{
  "materialName": "534",
  "videoUrl": "https://xxx/materials/33/demo_20230228104258028_20230720185601860.mp4",
  "param": "{\"personal\":{\"segmentStyle\":1,\"removeGreenEdge\":false,\"greenParamsRefinethHBgr\":180,\"greenParamsRefinethLBgr\":50,\"greenParamsBlurKs\":3,\"greenParamsColorbalance\":90,\"greenParamsSpillByalpha\":0.4,\"greenParamsSamplePointBgr\":[0,255,0],\"assetStart\":0.1,\"assetEnd\":0.6,\"assetScale\":1},\"persistent\":{\"videoCrfQuality\":23,\"stage1Config\":[0,1],\"dev\":{\"stage2\":{\"config\":1}}},\"override\":[{\"videoUrl\":\"https://aigc-video-saas.oss-cn-hangzhou.aliyuncs.com/AIGC/online/vendor/24/customization/1700120490581/package_1700120490581.mp4\",\"segmentStyle\":1,\"removeGreenEdge\":false,\"greenParamsRefinethHBgr\":180,\"greenParamsRefinethLBgr\":50,\"greenParamsBlurKs\":3,\"greenParamsColorbalance\":90,\"greenParamsSpillByalpha\":0.4,\"greenParamsSamplePointBgr\":[0,255,0],\"assetStart\":0.1,\"assetEnd\":0.6,\"assetScale\":1},{\"videoUrl\":\"https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/demo.mp4\",\"segmentStyle\":1,\"removeGreenEdge\":false,\"greenParamsRefinethHBgr\":180,\"greenParamsRefinethLBgr\":50,\"greenParamsBlurKs\":3,\"greenParamsColorbalance\":90,\"greenParamsSpillByalpha\":0.4,\"greenParamsSamplePointBgr\":[0,255,0],\"assetStart\":0.1,\"assetEnd\":0.6,\"assetScale\":1}]}"
}

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 任務id

# 響應樣例

{
    "code": 0,
    "message": "success",
    "data": 1
}

# 創建人物形象模型生成任務(舊接口)

# 接口描述

注意:該接口僅支持普通數字人模型生成任務,該接口不進行新內容更新。建議使用創建人物形象模型生成接口。

根據用戶上傳的指定內容調用算法能力進行人物形象模型生成,最終返回人物形象模型的壓縮包和縮略圖文件供用戶下載。上傳內容請參考采集規範 (opens new window)。PaaS平臺支持7天在綫存儲,需要及時轉存,7天后生成內容將無法下載。

# 請求地址

POST /api/2dvh/v1/material/2davatar/model/create

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
materialName String True 人物模型素材名稱
videoUrl String True 視頻素材下載地址
segmentStyle Integer True 背景分割方式:0:不分割,1:綠幕分割,2:普通分割,3:sdk做綠幕分割後處理(視頻合成時gpu後處理)
removeGreenEdge Boolean False 當segmentStyle=2時,設置有效,默認爲false,去除人物邊緣綠邊功能
greenParamsRefinethHBgr Integer False 當segmentStyle=1或 3時,設置有效, 默認 160,範圍0-255; refine alpha 高閾值 (對于背景爲紅綠藍),用于調整背景保留程度,值越大背景保留程度越大
greenParamsRefinethLBgr Integer False 當segmentStyle=1 或 3時,設置有效, 默認 40, 範圍0-255; refine alpha 低閾值 (對于背景爲紅綠藍),用于調整人體/物體邊緣保留寬度,值越大保留越多
greenParamsBlurKs Integer False 當segmentStyle=1或 3時,設置有效, 默認 3,平滑度; 去噪點的blur係數,大于等于0,平滑度越大越平滑,對邊緣有影響,若邊緣出現黑邊异色可以將該值升高,若邊緣出現內蝕可以該值適當降低
greenParamsColorbalance Integer False 當segmentStyle=1 或 3時, 設置有效,默認100, 去綠程度,範圍0-100,取值越大,去綠程度越高
greenParamsSpillByalpha Double False 當segmentStyle=1和3時,設置有效, 默認 0.5,去綠色彩平衡,範圍[-1.0 ~ 1.0],0 ~ 1 是减少偏色,-1 ~ 0 是增强色彩,小于0.5黃色會偏色,大于0.5青藍色會偏色,若使用藍幕分割,則默認值需要改爲 0.0
greenParamsSamplePointBgr int[] False 當segmentStyle=1 或 3時,設置有效,采樣顔色,由三個數值組成,各自取值範圍0-255,例如[0, 255, 0] ,若使用藍幕分割,則默認值需要改爲 [255, 0, 0]
videoCrfQuality Integer False 視頻編碼質量的參數crf, 參數越小質量越好但文件越大,默認23,允許範圍0-51,建議14-28
assetStart Float False 裁剪視頻素材起始時間(秒)
assetEnd Float False 裁剪視頻素材終止時間(秒)
assetScale Float False 視頻素材縮放比例(默認1.0)
devStage2Config Integer False 視頻素材模型訓練配置,模型尺寸,默認爲0,表示2k精度模型;1表示4k精度模型
stage1Template Integer False 人物模型口型訓練配置,默認爲0表示生成原始口型模型 ; 1 表示生成通用口型模型 ,後續用戶可根據實際效果選擇手動切換兩種口型模型

# 請求樣例

當segmentStyle=0的示例

{
  "materialName": "534",
  "segmentStyle": 1,
  "assetScale": 1,
  "videoCrfQuality": 21,
  "stage1Template": 0,
  "devStage2Config": 0,
  "videoUrl": "https://xxx/materials/33/demo_20230228104258028_20230720185601860.mp4"
}

當segmentStyle=1的示例

{
  "materialName": "534",
  "segmentStyle": 1,
  "assetScale": 1,
  "devStage2Config": 0,
  "greenParamsRefinethHBgr": 167,
  "greenParamsRefinethLBgr": 17,
  "greenParamsBlurKs": 7,
  "greenParamsColorbalance": 97,
  "greenParamsSpillByalpha": 0.3,
  "greenParamsSamplePointBgr": [
    7,
    275,
    7
  ],
  "videoCrfQuality": 21,
  "stage1Template": 0,
  "videoUrl": "https://xxx/materials/33/demo_20230228104258028_20230720185601860.mp4"
}

當segmentStyle=2的示例,僅greenParamsSpillByalpha可變更取值,其他參數將按照默認值傳入

{
  "materialName": "534",
  "segmentStyle": 2,
  "devStage2Config": 0,
  "stage1Template": 0,
  "removeGreenEdge" : true,
  "assetScale": 1,
  "greenParamsSpillByalpha": 0.3,
  "videoCrfQuality": 21,
  "videoUrl": "https://xxx/materials/33/demo_20230228104258028_20230720185601860.mp4"
}

當segmentStyle=3的示例

{
  "materialName": "534",
  "segmentStyle": 3,
  "assetScale": 1,
  "devStage2Config": 0,
  "stage1Template": 0,
  "greenParamsRefinethHBgr": 167,
  "greenParamsRefinethLBgr": 17,
  "greenParamsBlurKs": 7,
  "greenParamsColorbalance": 97,
  "greenParamsSpillByalpha": 0.3,
  "greenParamsSamplePointBgr": [
    7,
    275,
    7
  ],
  "videoCrfQuality": 21,
  "videoUrl": "https://xxx/materials/33/demo_20230228104258028_20230720185601860.mp4"
}

# 參數說明

通常情况下,默認參數即可適配大部分場景,但因場景表現不同出現效果問題時,參數也需要針對調整,下面就一些典型場景提供對應的參數建議。

1)通用場景參數(默認)

此場景爲適配大多數場景參數,即上述提供的默認參數取值。

2)數字人畫面不清晰調整參數

方法1:將視頻編碼質量參數(videoCrfQuality)調小,當設置值爲14時,數字人素材與原始人物素材清晰度對齊,此方法可能會輕微增大素材大小;

方法2:合成視頻或創建直播的輸入請求中適當添加銳化sharp值,具體可參考 json 定義說明中 beautify 對象下的 sharpen 取值調大;

方法3:選擇4k版本訓練數字人

3)人物邊緣出現黑邊且有輕微反綠調整參數(出現頻率高,尤其是白衣服場景易出現

請參考下面的參數進行人物模型更新(rebuilding),同時調低背景保留程度與人物邊緣保留寬度,此方法主要適配綠幕分割場景。參考取值如下:

{
  "materialName": "534",
  "segmentStyle": 1,
  "removeGreenEdge": false ,
  "assetScale": 1,
  "devStage2Config":0,
  "stage1Template": 0,
  "greenParamsRefinethHBgr": 90,
  "greenParamsRefinethLBgr": 10,
  "greenParamsBlurKs": 3,
  "greenParamsColorbalance": 100,
  "greenParamsSpillByalpha": -0.3,
  "greenParamsSamplePointBgr": [
    0,
    275,
    0
  ],
  "videoCrfQuality": 21,
  "videoUrl": "https://xxx/materials/33/demo_20230228104258028_20230720185601860.mp4"
}

5)人物邊緣有綠邊或整體泛綠調整參數

可以調小去綠平衡參數,參數越小去綠力度越高,也更容易偏色,例如將檸檬黃色摳除綠元素而變成橙色,建議最小設爲-0.3。此方法可增强色彩,適合畫面中沒有黃色時,同時支持綠幕分割與普通分割。參考取值如下:

{
  "materialName": "534",
  "segmentStyle": 2,
  "removeGreenEdge": true ,
  "devStage2Config": 0,
  "stage1Template": 0,
  "greenParamsSpillByalpha": -0.3,
  "videoCrfQuality": 21,
  "videoUrl": "https://xxx/materials/33/demo_20230228104258028_20230720185601860.mp4"
}

6)人物說話臉頰幅度大且在臉頰或脖子位置出現灰邊調整參數

此種情况發生原因爲初始素材分割結果與驅動後的數字人臉頰邊緣不匹配,需要選擇綠幕分割後處理(segmentStyle=3)方式訓練,主要適合綠幕分割處理的數字人。

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 任務id

# 響應樣例

{
    "code": 0,
    "message": "success",
    "data": 1
}

# 創建人物形象模型更新任務

# 接口描述

2D數字人展示的動作片段是從訓練視頻中抽取的,默認情况下是從說話的第一秒到3分半的時長。如果對2D數字人的動作片段不滿意,可以通過此接口進行動作片段修改,調整展示的動作時長和內容。需要注意的是使用人物形象模型更新功能時,建議背景分割方式與原模型文件生成時選擇的背景分割方式一致,變更分割方式可能會引起效果异常問題。 PaaS平臺支持7天在綫存儲,需要及時轉存,7天后生成內容將無法下載。

# 請求地址

POST /api/2dvh/v1/material/2davatar/model/rebuilding/video

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
materialName String True 人物模型素材名稱
videoUrl String True 視頻素材下載地址
modelUrl String True 已生成的原模型文件下載地址
segmentStyle Integer True 背景分割方式:0:不分割,1:綠幕分割,2:普通分割,3:sdk做綠幕分割後處理(視頻合成時gpu後處理)
removeGreenEdge Boolean False 當segmentStyle=2時,設置有效,默認爲false,去除人物邊緣綠邊功能
greenParamsRefinethHBgr Integer False 當segmentStyle=1或 3時,設置有效, 默認 160,範圍0-255; refine alpha 高閾值 (對于背景爲紅綠藍),用于調整背景保留程度,值越大背景保留程度越大
greenParamsRefinethLBgr Integer False 當segmentStyle=1 或 3時,設置有效, 默認 40, 範圍0-255; refine alpha 低閾值 (對于背景爲紅綠藍),用于調整人體/物體邊緣保留寬度,值越大保留越多
greenParamsBlurKs Integer False 當segmentStyle=1或 3時,設置有效, 默認 3,平滑度; 去噪點的blur係數,大于等于0,平滑度越大越平滑,對邊緣有影響,若邊緣出現黑邊异色可以將該值升高,若邊緣出現內蝕可以該值適當降低
greenParamsColorbalance Integer False 當segmentStyle=1 或 3時, 設置有效,默認100, 去綠程度,範圍0-100,取值越大,去綠程度越高
greenParamsSpillByalpha Double False 當segmentStyle=1和3時,設置有效, 默認 0.5,去綠色彩平衡,範圍[-1.0 ~ 1.0],0 ~ 1 是减少偏色,-1 ~ 0 是增强色彩,小于0.5黃色會偏色,大于0.5青藍色會偏色,若使用藍幕分割,則默認值需要改爲 0.0
greenParamsSamplePointBgr int[] False 當segmentStyle=1 或 3時,設置有效,采樣顔色,由三個數值組成,各自取值範圍0-255,例如[0, 255, 0] ,若使用藍幕分割,則默認值需要改爲 [255, 0, 0]
videoCrfQuality Integer False 視頻編碼質量的參數crf, 參數越小質量越好但文件越大,默認23,允許範圍0-51,建議14-28
assetStart Float False 裁剪視頻素材起始時間(秒)
assetEnd Float False 裁剪視頻素材終止時間(秒)
assetScale Float False 視頻素材縮放比例(默認1.0)
actionChange Object False 動靜切換參數
  - support Boolean True 是否支持素材動作切換
  - staticRangeStart Float True 靜態素材開始時間(秒)
  - staticRangeEnd Float True 靜態素材結束時間(秒)
  - dynamicRangeStart Float True 動態素材開始時間(秒)
  - dynamicRangeEnd Float True 動態素材結束時間(秒)
  - gap Integer False 切出點最大間隔幀數(默認75)
actionEdit Object False 動作列表相關參數,此組參數support=true時有效
  - support Boolean True 是否支持支持動作編輯,true支持。
  - videoPath String True 動態素材文件地址
  - gap Integer False 切出點最大間隔幀數(默認25)
  - actionList Array True 動作列表
  -   - name String True 動作名稱
  -   - clipRangeStart Float True 開始時間(秒)
  -   - clipRangeEnd Float True 結束時間(秒)
  -   - description String False 動作的文字描述

# 請求樣例

{
  "materialName": "2d任務A",
  "videoUrl": "https://xxx.oss-cn-hangzhou.aliyuncs.com/xxx/audio1.mp4",
  "modelUrl": "https://xxx.oss-cn-hangzhou.aliyuncs.com/xxx/model1.zip",
  "assetStart": 0.0,
  "assetEnd": 120.0,
  "assetScale": 1.0,
  "segmentStyle": 1,
  "devStage2Config": 0,
  "stage1Template": 0,
  "greenParamsRefinethHBgr": 167,
  "greenParamsRefinethLBgr": 17,
  "greenParamsBlurKs": 7,
  "segmentGreenUseGpu":false,
  "greenParamsColorbalance": 97,
  "greenParamsSpillByalpha": 0.3,
  "greenParamsSamplePointBgr": [
    7,
    275,
    7
  ],
  "videoCrfQuality": 21
}

# 參數說明

通常情况下,默認參數即可適配大部分場景,但因場景表現不同出現效果問題時,參數也需要針對調整,下面就一些典型場景提供對應的參數建議。

1)通用場景參數(默認)

此場景爲適配大多數場景參數,即上述提供的默認參數取值。

2)數字人畫面不清晰調整參數

方法1:將視頻編碼質量參數(videoCrfQuality)調小,當設置值爲14時,數字人素材與原始人物素材清晰度對齊,此方法可能會輕微增大素材大小;

方法2:合成視頻或創建直播的輸入請求中適當添加銳化sharp值,具體可參考 json 定義說明中 beautify 對象下的 sharpen 取值調大;

方法3:選擇4k版本訓練數字人,但更新時不支持修改分辨率

3)人物邊緣出現黑邊且有輕微反綠調整參數(出現頻率高,尤其是白衣服場景易出現

請參考下面的參數進行人物模型更新(rebuilding),同時調低背景保留程度與人物邊緣保留寬度,此方法主要適配綠幕分割場景。參考取值如下:

{
  "materialName": "534",
  "segmentStyle": 1,
  "removeGreenEdge": false ,
  "assetScale": 1,
  "greenParamsRefinethHBgr": 90,
  "greenParamsRefinethLBgr": 10,
  "greenParamsBlurKs": 3,
  "greenParamsColorbalance": 100,
  "greenParamsSpillByalpha": -0.3,
  "greenParamsSamplePointBgr": [
    0,
    275,
    0
  ],
  "videoCrfQuality": 21,
  "videoUrl": "https://xxx/materials/33/demo_20230228104258028_20230720185601860.mp4"
}

5)人物邊緣有綠邊或整體泛綠調整參數

可以調小去綠平衡參數,參數越小去綠力度越高,也更容易偏色,例如將檸檬黃色摳除綠元素而變成橙色,建議最小設爲-0.3。此方法可增强色彩,適合畫面中沒有黃色時,同時支持綠幕分割與普通分割。參考取值如下:

{
  "materialName": "534",
  "segmentStyle": 2,
  "removeGreenEdge": true ,
  "greenParamsSpillByalpha": -0.3,
  "videoCrfQuality": 21,
  "videoUrl": "https://xxx/materials/33/demo_20230228104258028_20230720185601860.mp4"
}

6)人物說話臉頰幅度大且在臉頰或脖子位置出現灰邊調整參數

此種情况發生原因爲初始素材分割結果與驅動後的數字人臉頰邊緣不匹配,需要選擇綠幕分割後處理(segmentStyle=3)方式訓練,主要適合綠幕分割處理的數字人。

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 任務id

# 響應樣例

{
    "code": 0,
    "message": "success",
    "data": 1
}

# 創建圖片綠幕分割效果預覽任務

# 接口描述

圖片綠幕分割效果預覽

# 請求地址

POST /api/2dvh/v1/material/2davatar/model/green/segment/image/create

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
materialName String True 圖片綠幕分割效果預覽任務名稱
url String True 圖片素材下載地址
param String True 圖片綠幕分割效果預覽任務需要傳入正確的param信息,其中包括各類參數(該參數爲json轉義後的字符串),請參考下面的參數說明和 json 示例

# param參數說明

字段 類型 必填 描述
greenParamsRefinethHBgr Integer False 默認 160,範圍70-220。refine alpha 高閾值 (對于背景爲紅綠藍),用于調整背景保留程度,值越大背景保留程度越大
greenParamsRefinethLBgr Integer False 默認 40, 範圍10-80。refine alpha 低閾值 (對于背景爲紅綠藍),用于調整人體/物體邊緣保留寬度,值越大保留越多
greenParamsBlurKs Integer False 默認 3,範圍:1-24。平滑度; 去噪點的blur係數,大于等于0,平滑度越大越平滑,對邊緣有影響,若邊緣出現黑邊异色可以將該值升高,若邊緣出現內蝕可以該值適當降低。
greenParamsColorbalance Integer False 默認100, 去綠程度,範圍0-100,取值越大,去綠程度越高
greenParamsSpillByalpha Double False 默認 0.5,去綠色彩平衡,範圍[-1.0 ~ 1.0],0 ~ 1 是减少偏色,-1 ~ 0 是增强色彩,小于0.5黃色會偏色,大于0.5青藍色會偏色,若使用藍幕分割,則默認值需要改爲 0.0
greenParamsSamplePointBgr int[] False 設置有效,采樣顔色,由三個數值組成,各自取值範圍0-255,例如[0, 255, 0] ,若使用藍幕分割,則默認值需要改爲 [255, 0, 0]
greenParamsSampleBackground object False 背景參數,請參考下面的參數說明和 json 示例
# greenParamsSampleBackground參數說明
字段 類型 必填 描述
color int[] False 默認 [0,255,0], rgb顔色值,範圍0-255

# 請求樣例

{
  "materialName": "534",
  "url": "https://xxx/materials/33/demo_20230228104258028_20230720185601860.mp4",
  "param": "{\"green_params_refineth_h_bgr\":230,\"green_params_refineth_l_bgr\":70,\"green_params_blur_ks\":3,\"green_params_colorbalance\":100,\"green_params_spill_byalpha\":0,\"green_params_sample_point_bgr\":[0,255,0],\"green_params_sample_background\":{\"color\":[0,100,255]}}"
}

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 任務信息
  - id Long True 任務id
  - url String True 圖片地址

# 響應樣例

{
  "code": 0,
  "message": "success",
  "data": 1
}

# 視頻綠幕分割效果預覽

# 接口描述

視頻綠幕分割效果預覽

# 請求地址

POST /api/2dvh/v1/material/2davatar/model/green/segment/video/create

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
materialName String True 視頻綠幕分割效果預覽任名稱
url String True 基礎base視頻素材下載地址 ,基礎視頻時長要求必須在6min以上
param String True 視頻綠幕分割效果預覽任務需要傳入正確的param信息,其中包括各類參數(該參數爲json轉義後的字符串),請參考下面的參數說明和 json 示例

# param參數說明

字段 類型 必填 描述
greenParamsRefinethHBgr Integer False 默認 160,範圍70-220。refine alpha 高閾值 (對于背景爲紅綠藍),用于調整背景保留程度,值越大背景保留程度越大
greenParamsRefinethLBgr Integer False 默認 40, 範圍10-80。refine alpha 低閾值 (對于背景爲紅綠藍),用于調整人體/物體邊緣保留寬度,值越大保留越多
greenParamsBlurKs Integer False 默認 3,範圍:1-24。平滑度; 去噪點的blur係數,大于等于0,平滑度越大越平滑,對邊緣有影響,若邊緣出現黑邊异色可以將該值升高,若邊緣出現內蝕可以該值適當降低
greenParamsColorbalance Integer False 默認100, 去綠程度,範圍0-100,取值越大,去綠程度越高
greenParamsSpillByalpha Double False 默認 0.5,去綠色彩平衡,範圍[-1.0 ~ 1.0],0 ~ 1 是减少偏色,-1 ~ 0 是增强色彩,小于0.5黃色會偏色,大于0.5青藍色會偏色,若使用藍幕分割,則默認值需要改爲 0.0
greenParamsSamplePointBgr int[] False 設置有效,采樣顔色,由三個數值組成,各自取值範圍0-255,例如[0, 255, 0] ,若使用藍幕分割,則默認值需要改爲 [255, 0, 0]
greenParamsSampleBackground object False 背景參數,請參考下面的參數說明和 json 示例
# greenParamsSampleBackground參數說明
字段 類型 必填 描述
color int[] False 默認 [0,255,0], rgb顔色值,範圍0-255

# 請求樣例

{
  "materialName": "534",
  "url": "https://xxx/materials/33/demo_20230228104258028_20230720185601860.mp4",
  "param": "{\"green_params_refineth_h_bgr\":230,\"green_params_refineth_l_bgr\":70,\"green_params_blur_ks\":3,\"green_params_colorbalance\":100,\"green_params_spill_byalpha\":0,\"green_params_sample_point_bgr\":[0,255,0],\"green_params_sample_background\":{\"color\":[0,100,255]}}"
}

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 任務id

# 響應樣例

{
  "code": 0,
  "message": "success",
  "data": 1
}

# 創建視頻人物換臉任務(內部測試)

# 接口描述

根據用戶上傳的視頻內容和模板圖片調用算法能力進行視頻人物換臉處理,最終返回處理後的視頻文件和縮略圖供用戶下載。

# 請求地址

POST /api/2dvh/v1/material/face/swap/create

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
facePhotoUrl String True 換臉使用的模板面部圖片
videoUrl String True 換臉使用的原始視頻文件
materialName String True 換臉任務名稱

# 請求樣例

{
  "facePhotoUrl": "facePhotoUrl",
  "videoUrl": "videoUrl",
  "materialName": "materialName"

}

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 任務id

# 響應樣例

{
  "code": 0,
  "message": "success",
  "data": 1
}

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 任務id

# 響應樣例

{
    "code": 0,
    "message": "success",
    "data": 1
}

# 內容預熱(口水話/開播脚本適用)(直播場景適用)

# 接口描述

針對口水話場景,開播脚本場景,提前進行文本請求/語音請求,得到一個id,在直播開播時直接使用,可在直播場景下提升開播/回復速度。

# 請求地址

POST /api/2dvh/v1/material/voice/content/repository/create

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
materialName String True 快速問答庫名稱
param String True 快速問答庫json,請參考下面的參數說明和 json 示例
thumbnailUrl String False 縮略圖Url

# param參數說明

字段 類型 必填 描述
type String True 需填值"quick_response"或"startup_script"。
"quick_response"表示在互動數字人場景中的口水話功能中使用。
"startup_script"表示在直播場景中的開播脚本中使用。
desc String False 描述
digital_role Object False 數字人
  - face_feature_id String True 數字人face feature id
  - name String True 數字人名稱
tts_config Object True tts配置
  - qid String False 有text必填
  - name String False 發音人名稱
  - pitch_offset Float False 音調,數值越大越尖銳,越低越低沉,支持範圍 [-60, 60]
  - speed_ratio Float False 語速,數值越大語速越慢,支持範圍 [0.5, 2]
  - volume Integer False 音量,數值越大聲音越大,支持範圍 [1, 400]
voice_content Array True 適用于數字人脚本和口水詞的文本及音頻預熱。
  - tts_query Object False 預熱內容的請求文本。TTS文本和音頻文件只支持一個,同時存在時TTS優先。預熱內容要麽全部是TTS請求,要麽全部是音頻請求,不能混用
  -   - content String False 預熱內容的文本內容
  -   - ssml Boolean False 是否使用ssml請求
  - audio String False 預熱內容的音頻接管文件地址。TTS文本和音頻文件只支持一個,同時存在時TTS優先。預熱內容要麽全部是TTS請求,要麽全部是音頻請求,不能混用

# 請求樣例

{
  "materialName": "534",
  "url": "https://xxx/materials/33/demo_20230228104258028_20230720185601860.jpg",
  "param": "{\"type\":\"quick_response\",\"desc\":\"123\",\"digital_role\":{\"face_feature_id\":\"1510a3ae060e4d7ea523684eb72b3447_s1test\",\"name\":\"小李\"},\"tts_config\":{\"qid\":\"EAdUVf:AEA_Z10Mqp9GYwDGPMTSiszE7NKMqrCg\",\"name\":\"xiaoxuan\",\"pitch_offset\":0,\"speed_ratio\":1,\"volume\":400},\"voice_content\":[{\"tts_query\":{\"content\":\"感謝你的提問,這個問題我想一下回答你。\",\"ssml\":false},\"audio\":\"\"},{\"tts_query\":{\"content\":\"這是一個好問題,我需要仔細思考一下,才能給出一個準確的答案。\",\"ssml\":false},\"audio\":\"\"},{\"tts_query\":{\"content\":\"好的,這位同學,請稍等。\",\"ssml\":false}}]}"
}

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 任務id

# 響應樣例

{
  "code": 0,
  "message": "success",
  "data": 1
}

# 素材預熱(前景,背景,數字人資源適用)(直播場景&視頻直播場景適用)

# 接口描述

用戶可通過此接口提前將視頻合成的素材上傳到paas平臺,平臺做素材預熱,可提升視頻合成速度。

注:目前不支持取消及重新生成。

# 請求地址

POST /api/2dvh/v1/material/file/warming

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
materialName String True 素材預熱任務名稱
param String True 素材預熱任務json爲預熱內容數組,請參考下面的參數說明和 json 示例

# param參數說明

字段 類型 必填 描述
fileId String True 素材文件ID
fileUrl String True 素材文件URL

# 請求樣例

{
  "materialName": "XX場景預熱",
  "param": "[{\"fileId\":\"9b158cc9-8e42-4d09-b928-49dd9941d921\",\"fileUrl\":\"https://xxx/xxx.png\"},{\"fileId\":\"9b158cc9-8e42-4d09-b928-49dd9941d922\",\"fileUrl\":\"https://xxx/xxx.jpg\"}]"
}

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 任務id

# 響應樣例

{
  "code": 0,
  "message": "success",
  "data": 134
}

# 獲取指定任務信息

# 接口描述

根據用戶傳入的任務ID查詢任務的對應信息,以及當前的任務所處狀態。

# 請求地址

POST /api/2dvh/v1/task/info

# 請求頭

Content-Type: application/json

# 請求參數

JSON數組格式,數組中對象的字段定義如下:

字段 類型 必填 描述
ids Long[] True 任務id列表

# 請求樣例

{
    "ids": [7,27]
}

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 任務信息
  - id Long True 任務id
  - materialId Integer True 素材 id
  - materialName String True 素材名稱
  - algoType Integer True 任務類型(11:TTS音色模型生成,12:人物形象模型生成,14:視頻合成,20:視頻人物換臉,18:人物形象模型更新,25:音色轉換, 32:圖片綠幕分割預覽,33:視頻綠幕分割預覽,41:TTS V3音色模型生成 ,42:口水話(快速答覆庫),43:文件預熱 )
  - algoSubType1 String True 人物模型:模型規格:2K/4K,視頻合成:使用人物模型規格:2K/4K
  - algoSubType2 String False 視頻合成:結果物格式:webm/mp4
  - algoSubType3 String False 視頻合成:結果物幀率
  - status Integer True 任務狀態,0:未開始,1:Dispatcher隊列等待中,2:算法正在處理,3:已取消,5:已完成,9:异常
  - extendParam String False 擴展參數
  - productParam String True 任務結果json串,不同任務格式不同。
  - startTime String True 算法開始時間(yyyy-MM-dd HH:mm:ss)
  - endTime String True 算法截止時間(yyyy-MM-dd HH:mm:ss)
# case1: 視頻合成
字段 類型 必填 描述
duration Integer True 合成視頻時長(單位:毫秒)
lastFrameIndex Integer True 視頻結尾幀
algoSubType1 String True 視頻合成:使用人物模型規格:2K/4K
algoSubType2 String True 視頻合成:結果物格式:webm/mp4
algoSubType3 String True 視頻合成:結果物幀率
thumbPath String True 縮略圖下載地址(7天有效)
videoPath String True 視頻下載地址(7天有效)
# case1 返回樣例:
{
    "code": 0,
    "message": "success",
    "data": [
        {
            "id": 913318,
            "materialId": 854513,
            "materialName": "913288",
            "productParam": "{\"duration\": 880, \"thumbPath\": \"https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/116/xxxx/thumb.png\", \"videoPath\": \"https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/116/xxxx/video.mp4\"}",
            "extendParam": null,
            "startTime": "2024-05-27 16:38:54",
            "endTime": "2024-05-27 16:39:03",
            "status": 5,
            "message": "{\"time_info\": {\"parse_json\": {\"avg\": 15, \"end\": \"2024-05-27 16:38:52.913\", \"sum\": 15, \"start\": \"2024-05-27 16:38:52.897\"}, \"preprocess\": {\"avg\": 342, \"end\": \"2024-05-27 16:38:56.134\", \"sum\": 342, \"start\": \"2024-05-27 16:38:55.792\"}, \"postprocess\": {\"avg\": 380, \"end\": \"2024-05-27 16:39:02.351\", \"sum\": 380, \"start\": \"2024-05-27 16:39:01.971\"}, \"main_process\": {\"avg\": 5837, \"end\": \"2024-05-27 16:39:01.971\", \"sum\": 5837, \"start\": \"2024-05-27 16:38:56.134\"}, \"audio_process\": {\"avg\": 123.91666412353516, \"sum\": 2974}, \"video_process\": {\"avg\": 9.47826099395752, \"sum\": 218}, \"wait_srt_stream\": {\"avg\": 0, \"sum\": 0}, \"send_task_response\": {\"start\": \"2024-05-27 16:39:02.775\"}, \"receive_task_from_agent\": {\"start\": \"2024-05-27 16:38:52.897\"}, \"st_mobile_change_package\": {\"avg\": 1832, \"end\": \"2024-05-27 16:38:54.745\", \"sum\": 1832, \"start\": \"2024-05-27 16:38:52.913\"}}, \"video_info\": {\"fps\": 25, \"format\": \"mp4\", \"digital_type\": \"2K\", \"last_frame_index\": 22}}",
            "algoType": 14,
            "algoId": "8216eaea6xxxxxx2e0798d21",
            "algoSubType1": "2K",
            "algoSubType2": "mp4",
            "algoSubType3": "25",
            "isDelete": 0
        }
    ]
}
# case2: 人物形象模型生成
字段 類型 必填 描述
thumbPath String True 基礎視頻生成人物模型縮略圖下載地址(7天有效)
multi Array True 模型結果
  - width String True 寬度
  - width String True 高度
  - pkgPath String True 人物形象下載地址 (7天有效),多視頻人物模型生成時無此字段返回
  - thumbPath String True 視頻生成人物模型縮略圖下載地址(7天有效)
  - faceFeatureId String True ff id
  - userJson String True 訓練參數
  - avatarResultJson String True 訓練結果
# case2 返回樣例:
{
    "code": 0,
    "message": "success",
    "data": [
        {
            "id": 908438,
            "materialId": 850297,
            "materialName": "蘇xxx",
            "productParam": "{\"multi\": [{\"common\": {\"pkgPath\": \"https://dwg-aigc-paas.oss-cn-hangzhou.x.com/x/116/xxxx/input_source/2/xx.zip\", \"userJson\": \"https://dwg-aigc-paas.oss-cnxxxx/input_source/2/xxx.json\", \"thumbPath\": \"https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/116/xxx/input_source/2/xxx.png\", \"faceFeatureId\": \"xxxxx\"}, \"origin\": {\"pkgPath\": \"https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/116/2bd5e869e94d4995967428fa7ad7cf49_s1/input_source/0/xxx.zip\", \"userJson\": \"https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/116/xxx/input_source/0/xxx.json\", \"thumbPath\": \"https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/116/xxx/input_source/0/xxx.png\", \"faceFeatureId\": \"2bd5e869e94dxxxxxa7ad7cf49_s1_0\"}, \"videoUrl\": \"https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/xxxxB.mp4\"}], \"thumbPath\": \"https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/116/xxx/input_source/0/xxx.png\"}",
            "extendParam": null,
            "startTime": "2024-05-22 18:14:21",
            "endTime": "2024-05-22 21:57:19",
            "status": 5,
            "message": "{}",
            "algoType": 12,
            "algoId": "2bd5exxxxxa7ad7cf49_s1",
            "algoSubType1": "4K",
            "algoSubType2": "multi",
            "algoSubType3": "normal",
            "isDelete": 0
        }
    ]
}
# case3: (多視頻)人物形象模型生成(/model/multi/create接口結果)
字段 類型 必填 描述
thumbPath String True 基礎視頻生成人物模型縮略圖下載地址(7天有效)
multi Array False 多視頻人物模型生結果,內容爲數組
  - videoUrl String True 原始視頻文件URL
  - orgin Object True 原始口型人物模型對象 (stage1Template參數爲0)
  -   - thumbPath String True 人物模型縮略圖下載地址(7天有效)
  -   - pkgPath String True 人物模型下載地址 (7天有效)
  -   - faceFeatureId String True Face Feature Id
  -   - userJson String True User Json 信息
  -   - avatarResultJson String True Avatar Result Json 信息
  - common Object True 通用口型人物模型對象 (stage1Template參數爲1 )
  -   - thumbPath String True 人物模型縮略圖下載地址(7天有效)
  -   - pkgPath String True 人物模型下載地址 (7天有效)
  -   - faceFeatureId String True Face Feature Id
  -   - userJson String True User Json 信息
  -   - avatarResultJson String True Avatar Result Json 信息
# case3 productParam 返回樣例:
{
	"multi": [{
		"common": {
			"pkgPath": "https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/xxx47_s1_input_source_2_result.zip",
			"userJson": "https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/ss_user.json",
			"thumbPath": "https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/xxlt.png",
			"faceFeatureId": "8c19c600a75addd9e666eca06413f47_s1_1",
                         "avatarResultJson": "https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/xxlt.Json"
		},
		"origin": {
			"pkgPath": "https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/aa_0_result.zip",
			"userJson": "https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/bbuser.json",
			"thumbPath": "https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/xx0_result.png",
			"faceFeatureId": "8c19c600a75a4f323e666eca06413f47_s1_0",
                         "avatarResultJson": "https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/xxlt.Json"
		},
		"videoUrl": "https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/xx.mp4"
	}],
	"thumbPath": "https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/xx.png"
}
# case4: 人物形象模型更新
字段 類型 必填 描述
thumbPath String True 人物模型縮略圖下載地址(7天有效)
pkgPath String True 人物模型下載地址 (7天有效)
modelInfo String True 人物模型:模型規格:2K/4K
# case4 返回樣例:
{
    "code": 0,
    "message": "success",
    "data": [
        {
            "id": 890212,
            "materialId": 833961,
            "materialName": "KURUMI",
            "productParam": "{\"pkgPath\": \"https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/116/xxxx/xxx.zip\", \"userJson\": \"https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/116/xxxx/xxxx.json\", \"modelInfo\": \"2K\", \"thumbPath\": \"https://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/download/116/xxx/xxxx.png\"}",
            "extendParam": null,
            "startTime": "2024-05-10 10:51:35",
            "endTime": "2024-05-10 11:50:24",
            "status": 5,
            "message": "{}",
            "algoType": 18,
            "algoId": "cut_bf9c19046exxxxxb9af791587_s1",
            "algoSubType1": "2K",
            "algoSubType2": null,
            "algoSubType3": "normal",
            "isDelete": 0
        }
    ]
}
# case5: TTS音色模型生成(舊)(不建議使用)
字段 類型 必填 描述
taskId String True 對應任務的ID
voice Object True 聲音信息
  - id String True 聲音ID
  - name String True 發音人名稱
  - gender Integer True 發音人性別。0 = Not known。1 = Male。2 = Female。9 = Not applicable
  - language String True 發音人語言。zh-CN中文普通話,en-US美式英文
  - vendor_id Integer True 聲音供應商ID
taskStatus Integer True 任務狀態。1 = 排隊中。2 = 任務進行中。3 = 已取消。5 = 已完成。 9 = 异常。
msg String True 任務狀態描述信息。
stage String True 任務子步驟。preprocess:數據預處理。label:數據標注。training:模型訓練。deployment:部署階段。
stageStatus Integer True 階段狀態。1 = 排隊中。2 = 任務進行中。5 = 已完成。 9 = 异常。
sampleAudioUrl String False 示例音頻的地址 (7天有效)
tenant String True 任務所屬租戶
updatedTime String True 任務信息更新時間RFC3339格式。
modelUrl String False 任務成功時返回模型下載地址,僅內網可用。暫不對外提供
# case6: 視頻人物換臉
字段 類型 必填 描述
thumbPath String True 縮略圖下載地址 (7天有效)
pkgPath String True 人物形象下載地址 (7天有效)
# case7: TTS -Qid音色模型生成
字段 類型 必填 描述
taskId String True 對應任務的ID
voice Object True 聲音信息
  - qid String True 聲音QID
  - name String True 發音人名稱
  - gender Integer True 發音人性別。0 = Not known。1 = Male。2 = Female。9 = Not applicable
  - languages String True 發音人支持的語言列表。zh-CN中文普通話,en-US美式英文,僅當任務完成時返回
taskType String True 聲音訓練算法類型
taskStatus Integer True 任務狀態。1 = 排隊中。2 = 任務進行中。3 = 已取消。5 = 已完成。 9 = 异常。
msg String True 任務狀態描述信息。
stage String True 任務子步驟。preprocess:數據預處理。label:數據標注。training:模型訓練。deployment:部署階段。
stageStatus Integer True 階段狀態。1 = 排隊中。2 = 任務進行中。5 = 已完成。 9 = 异常。
sampleAudioUrl String False 示例音頻的地址 (7天有效)
tenant String True 任務所屬租戶
updatedTime String True 任務信息更新時間RFC3339格式。

extendParam中人物形象模型參數信息

字段 類型 必填 描述
faceFeatureId String True Face Feature Id
# case7 返回樣例:
{
    "code": 0,
    "message": "success",
    "data": [
        {
            "id": 206216,
            "materialId": 1990411,
            "materialName": "TTS_yunynsent",
            "productParam": "{\"msg\":\"task is finished\",\"stage\":\"deployment\",\"voice\":{\"qid\":\"VQ1fQv:AEAygt1ixxxxxxdRPNLE11kg1TLXWSzMxNExLTksK\",\"name\":\"TTS6_yunyxxxxxen_consent\",\"gender\":1,\"languages\":[\"en-US\",\"zh-CN\",\"af-ZA\",\"am-ET\",\"ar-EG\",\"ar-SA\",\"az-AZ\",\"bg-BG\",\"bn-BD\",\"bn-IN\",\"bs-BA\",\"ca-ES\",\"cs-CZ\",\"cy-GB\",\"da-DK\",\"de-AT\",\"de-CH\",\"de-DE\",\"el-GR\",\"en-AU\",\"en-CA\",\"en-GB\",\"en-IE\",\"en-IN\",\"es-ES\",\"es-MX\",\"et-EE\",\"eu-ES\",\"fa-IR\",\"fi-FI\",\"fil-PH\",\"fr-BE\",\"fr-CA\",\"fr-CH\",\"fr-FR\",\"ga-IE\",\"gl-ES\",\"he-IL\",\"hi-IN\",\"hr-HR\",\"hu-HU\",\"hy-AM\",\"id-ID\",\"is-IS\",\"it-IT\",\"ja-JP\",\"jv-ID\",\"ka-GE\",\"kk-KZ\",\"km-KH\",\"kn-IN\",\"ko-KR\",\"lo-LA\",\"lt-LT\",\"lv-LV\",\"mk-MK\",\"ml-IN\",\"mn-MN\",\"ms-MY\",\"mt-MT\",\"my-MM\",\"nb-NO\",\"ne-NP\",\"nl-BE\",\"nl-NL\",\"pl-PL\",\"ps-AF\",\"pt-BR\",\"pt-PT\",\"ro-RO\",\"ru-RU\",\"si-LK\",\"sk-SK\",\"sl-SI\",\"so-SO\",\"sq-AL\",\"sr-RS\",\"su-ID\",\"sv-SE\",\"sw-KE\",\"ta-IN\",\"te-IN\",\"th-TH\",\"tr-TR\",\"uk-UA\",\"ur-PK\",\"uz-UZ\",\"vi-VN\",\"zh-HK\",\"zh-TW\",\"zu-ZA\"]},\"taskId\":\"tts6-xxx-xxxx-xxx-xx-789308\",\"tenant\":\"0\",\"taskType\":\"TTS6\",\"taskStatus\":5,\"stageStatus\":5,\"updatedTime\":\"2024-05-29T09:41:51.373802578Z\",\"sampleAudioUrl\":\"\"}",
            "extendParam": null,
            "startTime": "2024-05-29 17:38:31",
            "endTime": "2024-05-29 17:41:51",
            "status": 5,
            "message": "{\"tts resp msg\": \"task is finished\"}",
            "algoType": 41,
            "algoId": "f627-a980-78aba9c20308",
            "algoSubType1": null,
            "algoSubType2": null,
            "algoSubType3": null,
            "isDelete": 0
        }
    ]
}
# case8: 文件預熱(失敗信息,預熱成功文件不展示)
字段 類型 必填 描述
fileWarmingDetails Array False 失敗文件信息
  - fileId String True 文件ID
  - warmingResult String True 文件預熱失敗原因
# case8 返回樣例:
{
    "code": 0,
    "message": "success",
    "data": {
      "fileWarmingDetails": [
        {
          "fileId": "f627-a980-78aba9c20308",
          "warmingResult": "download error"
        },
        {
          "fileId": "xde37-a980-78aba9c20308",
          "warmingResult": "download error"
        }
      ]
    }
}

# 獲取賬戶任務信息

# 接口描述

根據用戶的賬戶ID查詢其賬戶下某算法類型下全部任務的對應信息,以及當前的任務所處狀態,任務列表支持分頁。

# 請求地址

POST /api/2dvh/v1/task/listByAccount

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
algoType Integer True 任務類型(11:TTS音色模型生成,12:人物形象模型生成,14:視頻合成,20:視頻人物換臉,18:人物形象模型更新,25:音色轉換, 32:圖片綠幕分割預覽,33:視頻綠幕分割預覽,41:TTS V3音色模型生成,42:口水話(快速答覆庫),43:文件預熱 )
pageNo int False 當前頁碼 (默認 1)
pageSize int False 每頁條數 (默認 10)
sortName String False 排序字段名
sortValue String False 排序順序: asc, desc

# 請求樣例

{
  "algoType": 12,
  "pageSize": 10,
  "pageNo": 1
}

# 響應元素

字段 類型 必填 描述
code Number True 0 - 成功, 其他- 异常
message String True 异常詳細信息
data Object False data object ,异常時通常爲空
  - pagination Pagination True 分頁信息(參照通用數據結構說明)
  - result Object True 任務列表(參照下面說明)

任務列表

字段 類型 必填 描述
id Long True 任務id
algoType Integer True 任務類型(11:TTS音色模型生成,12:人物形象模型生成,14:視頻合成,20: 視頻人物換臉,18:人物形象模型更新,25:音色轉換, 32:圖片綠幕分割預覽,33:視頻綠幕分割預覽,41:TTS V3音色模型生成,42:口水話(快速答覆庫),43:文件預熱 )
algoSubType1 String True 人物模型:模型規格:2K/4K,視頻合成:使用人物模型規格:2K/4K
algoSubType2 String False 視頻合成:結果物格式:webm/mp4
algoSubType3 String False 視頻合成:結果物幀率
status Integer True 任務狀態 0:未開始,1:Dispatcher隊列等待中,2:算法正在處理,3:已取消,5:已完成,9:异常
productParam String True 任務結果json串,包含視頻地址videoPath,視頻時長duration,截圖地址thumbPath
startTime String True 算法開始時間(yyyy-MM-dd HH:mm:ss)
endTime String True 算法截止時間(yyyy-MM-dd HH:mm:ss)

# 響應樣例

{
  "code": 0,
  "message": "success",
  "data": {
    "pagination": {
      "pageNo": 1,
      "numberPages": 1,
      "numberRecords": 2,
      "pageSize": 2,
      "startIndex": 0
    },
    "result": [
      {
        "id": 27,
        "algoType": 12,
        "algoSubType1": "4K",
        "algoSubType2": null,
        "algoSubType3": null,
        "productParam": "\"{\\\"duration\\\":1234,\\\"thumbPath\\\":\\\"https://oss-cn-hangzhou.aliyuncs.com/dwg-aigc-paas/materials/a8610d001aaa412ab2e0433fc848b48f/thumb.jpg\\\",\\\"videoPath\\\":\\\"https://oss-cn-hangzhou.aliyuncs.com/dwg-aigc-paas/materials/a8610d001aaa412ab2e0433fc848b48f/output.mp4\\\"}\"",
        "startTime": "2023-02-17 16:53:26",
        "endTime": "2023-02-18 10:03:21",
        "status": 5
      },
      {
        "id": 7,
        "algoType": 12,
        "algoSubType1": "4K",
        "algoSubType2": null,
        "algoSubType3": null,
        "productParam": "{}",
        "startTime": "2023-02-17 16:56:26",
        "endTime": "2023-02-17 17:43:19",
        "status": 9
      }
    ]
  }
}

# 獲取賬戶任務信息詳情

# 接口描述

查詢賬戶下某算法類型下全部任務的對應信息,以及當前的任務所處狀態,原始輸入內容,返回結果物等信息詳情,任務列表支持分頁。

# 請求地址

POST /api/2dvh/v1/task/listWithQueue

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
userId Long False 用戶id,默認爲當前登錄賬戶id
algoType Integer True 任務類型(11:TTS音色模型生成(舊),12:人物形象模型生成,14:視頻合成,20: 視頻人物換臉,18:人物形象模型更新,25:音色轉換, 32:圖片綠幕分割預覽,33:視頻綠幕分割預覽,41:TTS Qid音色模型生成 )
status Integer True 任務狀態 (0:未開始,1:Dispatcher隊列等待中,2:算法正在處理,3:已取消,5:已完成,9:异常, -1: 全部 )
key String False 任務ID/角色名稱查詢(精確匹配)
pageNo int False 當前頁碼 (默認 1)
pageSize int False 每頁條數 (默認 10)
sortName String False 排序字段名
sortValue String False 排序順序: asc, desc

# 請求樣例

{
  "algoType": 12,
  "pageSize": 10,
  "pageNo": 1
}

# 響應元素

字段 類型 必填 描述
code Number True 0 - 成功, 其他- 异常
message String True 异常詳細信息
data Object False data object ,异常時通常爲空
  - pagination Pagination True 分頁信息(參照通用數據結構說明)
  - result Object True 任務列表(參照下面說明)

任務列表

字段 類型 必填 描述
id Long True 任務id
algoType Integer True 任務類型(11:TTS音色模型生成,12:人物形象模型生成,14:視頻合成,20: 視頻人物換臉,18:人物形象模型更新,25:音色轉換, 32:圖片綠幕分割預覽,33:視頻綠幕分割預覽,41:TTS V3音色模型生成,42:口水話(快速答覆庫),43:文件預熱
materialId Long True 模型id
materialName String True 素材名稱
queueInfo String False 排隊信息
status Integer True 任務狀態 0:未開始,1:Dispatcher隊列等待中,2:算法正在處理,3:已取消,5:已完成,9:异常
productParam String True 任務結果json串,包含視頻地址videoPath,視頻時長duration,截圖地址thumbPath
extendParam String False 擴展參數,人物形象模型生成時包含faceFeatureId
algoSubType1 String True 人物模型:模型規格:2K/4K,視頻合成: 使用人物模型規格:2K/4K
algoSubType2 String False 視頻合成:結果物格式:webm/mp4
algoSubType3 String False 視頻合成:結果物幀率
taskInfo String True 任務初始參數及原始文件
algoId String True 算法任務id
message String False 錯誤信息
submitTime String True 算法提交時間(yyyy-MM-dd HH:mm:ss)
startTime String False 算法開始時間(yyyy-MM-dd HH:mm:ss)
endTime String False 算法截止時間(yyyy-MM-dd HH:mm:ss)
owner Long True 任務所屬賬戶
ownerPhone String True 賬戶手機號碼

# 響應樣例

{
  "code": 0,
  "message": "success",
  "data": {
    "pagination": {
      "pageNo": 1,
      "numberPages": 1,
      "numberRecords": 2,
      "pageSize": 2,
      "startIndex": 0
    },
    "result": [
      {
        "id": 8833,
        "materialId": 8122,
        "materialName": "Mario_4_talk.mp4_sensetime-segment_type_綠幕分割",
        "productParam": "{\"pkgPath\": \"https://dwg-aigc-paas-test.oss-cn-hangzhou.aliyuncs.com/download/8/b6ecebc8233b47809dedd6731c052d15_s1/b6ecebc8233b47809dedd6731c052d15_s1_result.zip\", \"thumbPath\": \"https://dwg-aigc-paas-test.oss-cn-hangzhou.aliyuncs.com/download/8/b6ecebc8233b47809dedd6731c052d15_s1/b6ecebc8233b47809dedd6731c052d15_s1_result.png\", \"faceFeaturePath\": \"https://dwg-aigc-paas-test.oss-cn-hangzhou.aliyuncs.com/download/8/b6ecebc8233b47809dedd6731c052d15_s1/b6ecebc8233b47809dedd6731c052d15_s1_face_feature.zip\"}",
        "extendParam": "{\"faceFeatureId\": \"b6ecebc8233b47809dedd6731c052d15_s1\"}",
        "startTime": "2023-06-07 23:31:50",
        "endTime": "2023-06-08 05:19:29",
        "status": 5,
        "message": "{}",
        "algoType": 12,
        "algoId": "b6ecebc8233b47809dedd6731c052d15_s1",
        "algoSubType1": "4K",
        "algoSubType2": null,
        "algoSubType3": null,
        "submitTime": "2023-06-07 17:34:40",
        "ownerPhone": "18311096857",
        "owner": 8,
        "queueInfo": null,
        "taskInfo": "{\"create2DAvatarModel\": {\"videoUrl\": \"https://ailab-storage-eus.oss-us-west-1.aliyuncs.com/31_trim_result/Mario_4_talk.mp4?OSSAccessKeyId=LTAI5tE2Hq2BAqr8EBzxmSrR&Expires=37686060051&Signature=C1L%2FxpHD%2FW155s%2BuhTocyVvsUfo%3D\", \"accountId\": 8, \"assetScale\": 1.0, \"existTaskId\": 0, \"firstCreate\": true, \"materialName\": \"Mario_4_talk.mp4_sensetime-segment_type_綠幕分割\", \"segmentStyle\": 1}}"
      },
      {
        "id": 9093,
        "materialId": 8258,
        "materialName": "wu0609_sensetime-segment_type_綠幕分割",
        "productParam": null,
        "extendParam": null,
        "startTime": "2023-06-09 10:56:38",
        "endTime": null,
        "status": 2,
        "message": "{}",
        "algoType": 12,
        "algoId": "5f6006acb891496f93bfeeff601201fe_s1",
        "algoSubType1": "4K",
        "algoSubType2": null,
        "algoSubType3": null,
        "submitTime": "2023-06-09 10:56:36",
        "ownerPhone": "18311096857",
        "owner": 8,
        "queueInfo": null,
        "taskInfo": "{\"create2DAvatarModel\": {\"videoUrl\": \"http://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/wanxing_0606/zhuzong.mp4\", \"accountId\": 8, \"assetScale\": 1.0, \"existTaskId\": 0, \"firstCreate\": true, \"materialName\": \"wu0609_sensetime-segment_type_綠幕分割\", \"segmentStyle\": 1}}"
      },
      {
        "id": 8528,
        "materialId": 7908,
        "materialName": "Claire_3_talk.mp4_sensetime-segment_type_綠幕分割",
        "productParam": "{\"pkgPath\": \"https://dwg-aigc-paas-test.oss-cn-hangzhou.aliyuncs.com/download/8/1907b913f78845168529bad59f36a43f_s1/1907b913f78845168529bad59f36a43f_s1_result.zip\", \"thumbPath\": \"https://dwg-aigc-paas-test.oss-cn-hangzhou.aliyuncs.com/download/8/1907b913f78845168529bad59f36a43f_s1/1907b913f78845168529bad59f36a43f_s1_result.png\", \"faceFeaturePath\": \"https://dwg-aigc-paas-test.oss-cn-hangzhou.aliyuncs.com/download/8/1907b913f78845168529bad59f36a43f_s1/1907b913f78845168529bad59f36a43f_s1_face_feature.zip\"}",
        "extendParam": "{\"faceFeatureId\": \"1907b913f78845168529bad59f36a43f_s1\"}",
        "startTime": "2023-06-06 02:32:13",
        "endTime": "2023-06-06 20:17:19",
        "status": 9,
        "message": "{\"errorMsg\": \"Algorithm heart beat is overtime!!!\"}",
        "algoType": 12,
        "algoId": "1907b913f78845168529bad59f36a43f_s1",
        "algoSubType1": "4K",
        "algoSubType2": null,
        "algoSubType3": null,
        "submitTime": "2023-06-05 20:41:43",
        "ownerPhone": "18311096857",
        "owner": 8,
        "queueInfo": null,
        "taskInfo": "{\"create2DAvatarModel\": {\"videoUrl\": \"https://ailab-storage-eus.oss-us-west-1.aliyuncs.com/online_videos/Claire_3_talk.mp4?OSSAccessKeyId=LTAI5tE2Hq2BAqr8EBzxmSrR&Expires=1689391554&Signature=pMSBmAlawZ7h2sxjUO8Dk%2B1dHRg%3D\", \"accountId\": 8, \"assetScale\": 1.0, \"existTaskId\": 0, \"firstCreate\": true, \"materialName\": \"Claire_3_talk.mp4_sensetime-segment_type_綠幕分割\", \"segmentStyle\": 2}}"
      },
      {
        "id": 9161,
        "materialId": 8317,
        "materialName": "Eddie_3_talk_trim_sensetime_0_綠幕分割",
        "productParam": null,
        "extendParam": null,
        "startTime": null,
        "endTime": null,
        "status": 1,
        "message": "{}",
        "algoType": 18,
        "algoId": "1667070933254279169",
        "algoSubType1": "4K",
        "algoSubType2": null,
        "algoSubType3": null,
        "submitTime": "2023-06-09 15:28:48",
        "ownerPhone": "18311096857",
        "owner": 8,
        "queueInfo": "8/9",
        "taskInfo": "{\"rebuild2DAvatarModelVideo\": {\"assetEnd\": 120.0, \"modelUrl\": \"https://dwg-aigc-paas-test.oss-cn-hangzhou.aliyuncs.com/download/8/ba80636d8a77423083af66174375a130_s1/ba80636d8a77423083af66174375a130_s1_result.zip\", \"videoUrl\": \"http://dwg-aigc-paas.oss-cn-hangzhou.aliyuncs.com/wanxing_0606/Eddie_3_talk_trim.mp4.mp4\", \"accountId\": 8, \"assetScale\": 1.0, \"assetStart\": 60.0, \"existTaskId\": 0, \"firstCreate\": true, \"materialName\": \"Eddie_3_talk_trim_sensetime_0_綠幕分割\", \"segmentStyle\": 1}}"
      }
    ]
  }
}

# 取消任務

# 接口描述

支持用戶對于進行中的任務進行取消任務的操作,取消成功後任務狀態將置爲已取消。

# 請求地址

GET /api/2dvh/v1/task/cancel

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
id Long True 任務id

# 請求樣例

http://xxx/api/2dvh/v1/task/cancel?id=1

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 值爲空

# 響應樣例

{
    "code": 0,
    "message": "success",
    "data": null
}

# 删除任務

# 接口描述

支持用戶對于非進行中的任務進行删除任務的操作,删除後任務信息將不再保存。

# 請求地址

DELETE /api/2dvh/v1/task/del

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
id Long True 任務id

# 請求樣例

http://xxx/api/2dvh/v1/task/del/id

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 值爲空

# 響應樣例

{
    "code": 0,
    "message": "success",
    "data": null
}

# 重啓任務

# 接口描述

支持用戶對于异常的的任務進行重啓任務的操作,重啓後任務ID保持不變。

# 請求地址

GET /api/2dvh/v1/task/restart

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
id Long True task id

# 請求樣例

http://xxx/api/2dvh/v1/task/restart?id=1

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object False 任務id

# 響應樣例

{
    "code": 0,
    "message": "success",
    "data": 2
}

# 查詢任務各階段耗時信息

# 接口描述

查詢任務各階段耗時信息,當前僅支持視頻合成。

# 請求地址

GET /api/2dvh/v1/task/phase/cost

# 請求頭

Content-Type: application/json

# 請求參數

字段 類型 必填 描述
id Long True 任務id

# 請求樣例

https://xxx/api/2dvh/v1/task/phase/cost?id=1

# 響應元素

字段 類型 必填 描述
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Array False 值爲空
  - phase String True 算法階段:asset_download:素材下載
parse_json:json解析時間
st_mobile_change_package:加載數字人資源
preprocess:前處理時間,準備各類資源
main_process:音視頻處理
postprocess:ffmpeg視頻後處理
result_upload:結果上傳
  - startTime String True 階段開始時間(yyyy-MM-dd HH:mm:ss)
  - endTime String True 階段完成時間(yyyy-MM-dd HH:mm:ss)
  - costTime String True 耗時(毫秒)
  - callCount Integer False 階段重複次數,該值爲空表示階段無重複

# 響應樣例

{
  "code": 0,
  "message": "success",
  "data": [
    {
      "id": 291340,
      "phase": "asset_download",
      "startTime": "2023-11-01 16:41:17",
      "endTime": "2023-11-01 16:41:17",
      "costTime": 0
    },
    {
      "id": 291340,
      "phase": "parse_json",
      "startTime": "2023-11-01 16:41:17",
      "endTime": "2023-11-01 16:41:18",
      "costTime": 124
    },
    {
      "id": 291340,
      "phase": "st_mobile_change_package",
      "startTime": "2023-11-01 16:41:18",
      "endTime": "2023-11-01 16:41:20",
      "costTime": 2242
    },
    {
      "id": 291340,
      "phase": "preprocess",
      "startTime": "2023-11-01 16:41:20",
      "endTime": "2023-11-01 16:41:21",
      "costTime": 1238
    },
    {
      "id": 291340,
      "phase": "main_process",
      "startTime": "2023-11-01 16:41:21",
      "endTime": "2023-11-01 16:41:25",
      "costTime": 3692
    },
    {
      "id": 291340,
      "phase": "result_upload",
      "startTime": "2023-11-01 16:41:25",
      "endTime": "2023-11-01 16:41:25",
      "costTime": 189
    },
    {
      "id": 291340,
      "phase": "postprocess",
      "startTime": "2023-11-01 16:41:25",
      "endTime": "2023-11-01 16:41:25",
      "costTime": 457
    }
  ]
}

# 賬單查詢服務(非語音類)

# 接口描述

賬單查詢服務。單次範圍最大1000條,超過1000條將不予查詢,請縮小查詢範圍再次嘗試。

# 請求地址

POST /api/assist/bill/list

# 請求參數

字段 類型 必填 描述
owner Long True 任務所屬賬戶
algoGroup Integer True 任務組(11:TTS音色模型生成,12:人物形象模型生成,14:視頻合成,17:互動直播, 44:視頻直播)
algoType Integer True 任務類型(11:TTS音色模型生成,12:人物形象模型生成,14:視頻合成,17:互動直播, 44:視頻直播)
billStartTime String True 賬單開始時間(格式爲"YYYY-MM-DD HH:MM:SS")
billEndTime String True 賬單結束時間 (格式爲"YYYY-MM-DD HH:MM:SS")
pageNo int False 當前頁碼 (默認 1)
pageSize int False 每頁條數 (默認 10)
sortName String False 排序字段名
sortValue String False 排序順序: asc, desc

# 請求樣例

{
  "owner": 41 ,
  "algoType": "14",
  "algoGroup": "14",
  "billStartTime": "2024-12-04 00:00:00",
  "billEndTime": "2025-01-02 23:59:59",
  "pageSize": 10,
  "pageNo": 1,
  "sortName": "",
  "sortValue": ""
}

# 響應元素

字段 類型 必填 說明
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object True 成功與否,成功是1 ,錯誤返回null
  - pagination Pagination True 分頁信息(參照通用數據結構說明)
  - result Object True 賬單列表(參照下面說明)
  - usedSum String True 當前頁總用量

賬單列表

字段 類型 必填 描述
id Long True 任務id
owner Long True 任務所屬賬戶
algoType Integer True 任務類型(11:TTS音色模型生成,12:人物形象模型生成,14:視頻合成,17:互動直播, 44:視頻直播)
billingValue Integer True 計費值
billingUnit Integer True 計費單位 (1:時長 單位:毫秒,2:時長 單位:秒,3:單位:數量)
billingTime String True 計費時間,格式爲"YYYY-MM-DD HH:MM:SS"
taskId Long True 任務id
taskName String True 任務名稱
algoId String True 算法任務id
status Integer True 3:已取消,5:已完成,9:异常
taskIsDelete String True 任務是否被删除(0:未删除, 1:已删除)
startTime String True 算法開始時間(yyyy-MM-dd HH:mm:ss)
endTime String True 算法截止時間(yyyy-MM-dd HH:mm:ss)
resultFile String False 結果文件路徑
resultThumb String False 結果縮略圖路徑
algoSubType1 String True 人物模型:模型規格:2K/4K,視頻合成: 使用人物模型規格:2K/4K
algoSubType2 String False 視頻合成:結果物格式:webm/mp4
algoSubType3 String False 視頻合成:結果物幀率
algoSubType4 String False 子類型4
message String False 任務信息

# 響應樣例

{
  "code": 0,
  "message": "success",
  "data": {
    "pagination": {
      "pageNo": 1,
      "numberPages": 1,
      "numberRecords": 3,
      "pageSize": 10,
      "startIndex": 0
    },
    "result": [
      {
        "id": 601057,
        "owner": 41,
        "billingValue": 30,
        "billingUnit": 2,
        "billingTime": "2024-12-27 15:03:09",
        "taskId": 20989677953,
        "taskName": null,
        "algoId": "db1fb10d0007485b8f7f41e6ebd41be7",
        "algoType": 17,
        "status": 5,
        "taskIsDelete": 0,
        "startTime": "2024-12-27 15:02:39",
        "endTime": "2024-12-27 15:03:09",
        "resultFile": null,
        "resultThumb": null,
        "message": "客戶主動關閉",
        "algoSubType1": null,
        "algoSubType2": null,
        "algoSubType3": null,
        "algoSubType4": null
      },
      {
        "id": 601056,
        "owner": 41,
        "billingValue": 1,
        "billingUnit": 2,
        "billingTime": "2024-12-27 14:58:33",
        "taskId": 20989677950,
        "taskName": null,
        "algoId": "980f8051b5a9499592cd34530fd90cbf",
        "algoType": 17,
        "status": 5,
        "taskIsDelete": 0,
        "startTime": "2024-12-27 14:58:32",
        "endTime": "2024-12-27 14:58:33",
        "resultFile": null,
        "resultThumb": null,
        "message": "客戶主動關閉",
        "algoSubType1": null,
        "algoSubType2": null,
        "algoSubType3": null,
        "algoSubType4": null
      },
      {
        "id": 601055,
        "owner": 41,
        "billingValue": 2,
        "billingUnit": 2,
        "billingTime": "2024-12-27 14:58:27",
        "taskId": 20989677949,
        "taskName": null,
        "algoId": "787c8923f67c447fbed38df345551789",
        "algoType": 17,
        "status": 5,
        "taskIsDelete": 0,
        "startTime": "2024-12-27 14:58:26",
        "endTime": "2024-12-27 14:58:28",
        "resultFile": null,
        "resultThumb": null,
        "message": "客戶主動關閉",
        "algoSubType1": null,
        "algoSubType2": null,
        "algoSubType3": null,
        "algoSubType4": null
      }
    ],
    "usedSum": "0.55",
    "usedModel2kSum": null,
    "usedModel4kSum": null
  }
}

# 賬單查詢服務(語音類)

# 接口描述

語音賬單查詢服務。

# 請求地址

POST /api/assist/bill/voice/list

# 請求參數

字段 類型 必填 描述
owner Long True 任務所屬賬戶
algoType Integer True 任務組(30: "ASR", 31: "TTS")
billStartTime String True 賬單開始時間(格式爲"YYYY-MM-DD HH:MM:SS")
billEndTime String True 賬單結束時間 (格式爲"YYYY-MM-DD HH:MM:SS")
algoSubType1 String True PAAS_HTTP,PAAS_WS,PAAS_VIDEO_2D,PAAS_VIDEO_MIX,PAAS_LIVE
algoSubType2 String True ASR5, TTS3, TTS4, TTS5, TTS7, TTS8
statRange String True 統計範圍 1:日賬單 ,2: 月賬單
pageNo int False 當前頁碼 (默認 1)
pageSize int False 每頁條數 (默認 10)
sortName String False 排序字段名
sortValue String False 排序順序: asc, desc

# 請求樣例

{
  "owner": 41,
  "algoType": "30",
  "billStartTime": "2024-12-04 00:00:00",
  "billEndTime": "2025-01-03 23:59:59",
  "statRange": 1,
  "algoSubType1": "",
  "algoSubType2": "",
  "pageSize": 10,
  "pageNo": 1,
  "sortName": "",
  "sortValue": ""
}

# 響應元素

字段 類型 必填 說明
code Integer True 0 - 成功, 其他 - 异常
message String True 异常詳細信息
data Object True 成功與否,成功是1 ,錯誤返回null
  - pagination Pagination True 分頁信息(參照通用數據結構說明)
  - result Object True 賬單列表(參照下面說明)

賬單列表

字段 類型 必填 描述
id Long True 任務id
owner Long True 任務所屬賬戶
algoType Integer True 任務類型(11:TTS音色模型生成,12:人物形象模型生成,14:視頻合成,17:互動直播, 44:視頻直播)
billingValue Integer True 計費值
billingUnit Integer True 計費單位 (1:時長 單位:毫秒,2:時長 單位:秒,3:單位:數量)
billingDate String True 計費日期,格式爲"YYYY-MM-DD"
billingMonth String False 計費月份
algoSubType1 String True PAAS_HTTP,PAAS_WS,PAAS_VIDEO_2D,PAAS_VIDEO_MIX,PAAS_LIVE
algoSubType2 String True ASR5, TTS3, TTS4, TTS5, TTS7, TTS8

# 響應樣例

{
  "code": 0,
  "message": "success",
  "data": {
    "pagination": {
      "pageNo": 1,
      "numberPages": 1,
      "numberRecords": 4,
      "pageSize": 10,
      "startIndex": 0
    },
    "result": [
      {
        "id": 13635,
        "owner": 260,
        "billingValue": 0.0045,
        "billingUnit": 3,
        "billingDate": "2024-12-27",
        "billingMonth": null,
        "algoSubType1": "PAAS_VIDEO_MIX",
        "algoSubType2": "TTS5",
        "algoType": 31
      },
      {
        "id": 13631,
        "owner": 260,
        "billingValue": 0.0347,
        "billingUnit": 3,
        "billingDate": "2024-12-27",
        "billingMonth": null,
        "algoSubType1": "PAAS_VIDEO_2D",
        "algoSubType2": "TTS5",
        "algoType": 31
      },
      {
        "id": 12441,
        "owner": 260,
        "billingValue": 0.0347,
        "billingUnit": 3,
        "billingDate": "2024-12-06",
        "billingMonth": null,
        "algoSubType1": "PAAS_VIDEO_2D",
        "algoSubType2": "TTS5",
        "algoType": 31
      },
      {
        "id": 12433,
        "owner": 260,
        "billingValue": 0.0347,
        "billingUnit": 3,
        "billingDate": "2024-12-06",
        "billingMonth": null,
        "algoSubType1": "PAAS_VIDEO_2D",
        "algoSubType2": "TTS3",
        "algoType": 31
      }
    ]
  }
}

# 任務完成回調參數

使用API時,系統將通過填寫的接口回調地址,返回任務狀態等信息,若需要任務回調功能,則需聯繫管理員在創建賬戶時提供接口回調地址。 如果用戶配置了AuthKey將返回鑒權信息timestamp和signature,具體參考<HTTP回調事件通知>。

提供的接口實現中HTTP Method爲POST,Content-Type應爲application/json

字段 類型 必填 描述
taskId Integer True 任務 id
materialId Integer True 素材 id
materialName String True 素材名稱
algoType Integer True 任務類型(11:TTS音色模型生成,12:人物形象模型生成,14:視頻合成,20: 視頻人物換臉,18:人物形象模型更新,25:音色轉換, 32:圖片綠幕分割預覽,33:視頻綠幕分割預覽,41:TTS V3音色模型生成,42:口水話(快速答覆庫),43:文件預熱
algoSubType1 String True 人物模型:模型規格:2K/4K,視頻合成:使用人物模型規格:2K/4K
algoSubType2 String False 視頻合成:結果物格式:webm/mp4
algoSubType3 String False 視頻合成:結果幀率
status Integer True 狀態 3:已取消,5:已完成,9:异常
taskResult String False 報錯信息

以上即爲平臺可以提供的全部算法能力。

最後更新: 2025/2/5 下午5:54:45