音频识别

最近更新时间:2020-05-19 10:30:23

内容安全音频识别API文档

调用方式

请求结构

服务地址

内容安全音频识别API的服务接入地址为:http://ksr.api.ksyun.com

通信协议

支持通过HTTP或HTTPS协议进行请求通信。为保证您的服务安全性,请使用HTTPS协议进行通信。

请求方式

支持GET方法发送请求,注意参数需要进行urlencode。

公共参数

公共请求header

参数名 必选 类型 说明
Authorization string 必要的请求验证信息
X-Amz-Date string 当前请求的时间戳,例如:20171129T114852Z
Host string ksr.api.ksyun.com

签名参数

Region:金山云机房信息,目前仅支持cn-beijing-6

Service:固定为ksr

返回结果

接口统一返回json格式数据,满足以下格式:

{
    "header":{
      "err_no":200,
      "err_msg":"success"
    },
    "cost":0.11,
    "request_id": "d679e27b-9f1b-44bf-b134-49a6d9f0adff",
    "request_time": 1234567890123,
    "body":{}
}

调用成功,err_no返回200,msg为success,否则返回对应错误码及错误信息。

cost为服务端耗时,单位秒。

每此请求会返回唯一的请求表示request_id,调用失败时提供request_id给金山云客服,方便定位问题。

request_time为每次请求时的服务器时间。

签名机制

详见金山云签名机制文档

短音频识别接口

调用限制: 支持mp3/wav/aac/ape/wma/ogg/flac/m4a音频格式; 音频时长限制为60s以内,语音识别返回时长较长,请耐心等待。

输入:

GET参数部分

参数名 必选 类型 说明
Action=AnalyzeAudio string 固定此值
Version=2019-03-15 string API版本号,固定此值

POST请求示例

{
    "guard_id":"xxxx",
    "audio_url":"http://xxx.mp3",
    "stream_id":"xxxx",
    "user_id":"xxxx"
}

POST参数说明

参数 必选 类型 说明
guard_id string 送审计划id
audio_url string 音频url
stream_id string 音频所属流id,或音频所属房间号。
user_id string 用户id

送审计划id获取路径:金睛内容识别 > 送审管理模块 > 送审计划列表/送审计划详情 > 复制送审计划id

音频识别

详见金睛内容识别平台操作手册

接口返回:

{
    "body": {
        "data_id": "4a75a3be104ec296058047941c261a21",
        "audio_url": "https://ks3-cn-beijing.ksyun.com/airesearch/datasets/test_mp3_20190311/lover_30s.mp3",
        "suggest_summary": "confirm_reject",
        "suggest_summary_code": "207000",
        "suggest_summary_message": "音频违规",
        "stream_id": "1111111",
        "results": [
            {
                "business": "illegal",
                "text": "XXXXXXXXXXXXXXXXXX",
                "label": "5",
                "label_desc": "涉政",
                "label_details": [
                    {
                        "word": "XXX"
                    },
                    {
                        "word": "XX"
                    }
                ],
                "suggest": "confirm_reject"
            },
            {
                "business": "porn",
                "label": "2",
                "label_desc": "娇喘",
                "rate": 0.99,
                "label_details": [
                    {
                        "start_time": 8000,
                        "end_time": 16000
                    },
                    {
                        "start_time": 32000,
                        "end_time": 40000
                    }
                ],
                "suggest": "confirm_reject"
            }
        ]
    },
    "header": {
        "err_no": 200,
        "err_msg": "success"
    },
    "cost": 6.851,
    "request_id": "7e106d4a-25f1-4a9a-98fc-ba9b9a4fd74d",
    "request_time": 1552448974013
}

接口输出字段解释:

字段 类型 是否必须 说明
label string 分类标签ID
label_desc string 分类标签
auido_url string 对应请求中的地址
data_id string 唯一标识该音频
suggest_summary string confirm_reject:拒绝;normal:通过;suggest_review: 疑似;
suggest_summary_code string 207000:音频违规;
212000:音频涉黄;
100000:正常
suggest_summary_message string 207000:音频违规;
212000:音频涉黄;
100000:正常

违规音频识别对应的results字段

字段 类型 是否必须 说明
business string 调用服务名称,违规音频识别:illegal
label string 分类标签ID
1:正常;2:涉黄;3:广告,4:涉暴,5:涉政,6:辱骂
label_desc string 分类标签
1:正常;2:涉黄;3:广告,4:涉暴,5:涉政,6:辱骂
label_details object 音频违规详情
text string 音频识别结果
suggest string confirm_reject:拒绝;normal:通过; suggest_review: 疑似;

色情音频识别对应的results字段

字段 类型 是否必须 说明
business string 调用服务名称,色情音频识别:porn
label string 分类标签ID
1:正常;2:娇喘
label_desc string 分类标签
1:正常;2:娇喘
label_details object 音频涉黄详情
suggest string confirm_reject:拒绝;normal:通过;
rate double 分类置信度 [0, 1.0],值越大置信度越高

长音频识别接口

长音频识别任务提交

GET参数部分

参数名 必选 类型 说明
Action=AnalyzeLongAudio string 固定此值
Version=2019-04-02 string API版本号,固定此值

POST请求示例:

{
    "audio_id": "dfe8bd36-91a7-486b-bdf3-d9b4c3355b79",
    "guard_id": "1548746633316469125",
    "audio_url": "https://test.com/123.mp3",
    "callback": "https://www.test.com",
    "origin_name": "生活区第三批",
    "media_intro": "{\"title\":\"美丽海岸\",\"tag\":\"大连,VLOG\",\"content\":\"景区介绍\"}",
    "user_id": "12345678"
}

POST参数说明

参数 必选 类型 最大长度 说明
audio_id string 100 音频id, 音频唯一标识
由字母、数字、下划线、中线任意组成,必须以字母或数字开头
guard_id string 64 送审计划id
audio_url string 512 音频url
支持http(s)、ftp等协议
支持mp3、wav、aac、ape、wma、ogg、flac、m4a等格式
callback string 1024 回调地址,音频处理结果通过此地址回传
origin_name string 64 来源名称,用于记录来源、批次等信息
media_intro string 1024 媒体介绍,JSON格式的字符串
user_id string 128 用户id

送审计划id获取路径:金睛内容识别 > 送审管理模块 > 送审计划列表/送审计划详情 > 复制送审计划id

音频识别

详见金睛内容识别平台操作手册

接口返回:

{
    "request_id": "d679e27b-9f1b-44bf-b134-49a6d9f0adff",
    "request_time": 1536148409363,
    "cost": 0.02,
    "header": {
        "err_no": 200,
        "err_msg": "success"
    }
}

长音频识别结果查询

GET参数部分

参数名 必选 类型 说明
Action=GetLongAudioResult string 固定此值
Version=2019-04-02 string API版本号,固定此值

POST请求示例:

{
    "audio_id": "3d6e528b8a0710986e229cd525491259"
}

POST参数说明

参数 必选 类型 最大长度 说明
audio_id string 100 音频id

接口返回:

{
    "request_id": "ff35f7a5-7b65-4aaf-a97f-cf63bec2218c",
    "request_time": 1560240162393,
    "cost": 0.24,
    "header": {
        "err_no": 200,
        "err_msg": "success"
    },
    "body": {
        "audio_id": "3d6e528b8a0710986e229cd525491259",
        "audio_url": "http://test.com/test78116.mp4",
        "audio_duration": 229,
        "audio_suggest": "confirm_reject",
        "suggest_summary_code": "208000",
        "suggest_summary_message": "违规音频",
        "audio_results": [
            {
                "audio_url": "https://ks3-cn-beijing.ksyun.com/videodb/b23.mp3",
                "text": "共产党一定要把文革的真相告诉同学们。",
                "start_seconds": 0,
                "end_seconds": 30,
                "audio_suggest": "confirm_reject",
                "audio_suggest_code": "208000",
                "audio_suggest_message": "音频违规",
                "audio_details": [
                    {
                        "business": "illegal",
                        "suggest": "confirm_reject",
                        "label": 5,
                        "label_desc": "涉政",
                        "rate": 0.94,
                        "keywords": [
                            {
                                "matched_item": "共产党"
                            },
                            {
                                "matched_item": "文革"
                            }
                        ]
                    }
                ]
            },
            {
                "audio_url": "https://ks3-cn-beijing.ksyun.com/videodb/b47.mp3",
                "text": "",
                "start_seconds": 15,
                "end_seconds": 45,
                "audio_suggest": "confirm_reject",
                "audio_suggest_code": "213000",
                "audio_suggest_message": "音频涉黄",
                "audio_details": [
                    {
                        "business": "porn",
                        "suggest": "confirm_reject",
                        "label": 2,
                        "label_desc": "娇喘",
                        "rate": 0.92
                    }
                ]
            }
        ]
    }
}

接口输出字段解释:

字段 类型 是否必须 说明
audio_id string 视频ID
audio_url string 视频地址
audio_duration int 视频时长,单位秒
audio_suggest string 视频处理建议
normal:通过
suggest_review:疑似
confirm_reject:拒绝
suggest_summary_code string 识别建议原因编码
100000:正常
208000:违规音频
213000:色情音频
suggest_summary_message string 识别建议原因描述
audio_results list 违规音频段识别结果集
audio_results.audio_url string 音频段地址
audio_results.text string 音频段识别出的文字
audio_results.start_seconds int 音频段在视频中所在开始秒数
audio_results.end_seconds int 音频段在视频中所在结束秒数
audio_results.audio_suggest string 音频段建议
normal:通过
suggest_review:疑似
confirm_reject:拒绝
audio_results.audio_suggest_code string 音频段识别建议原因编码
100000:正常
208000:音频违规
213000:音频涉黄
audio_results.audio_suggest_message string
audio_results.audio_details list 违规音频段详情
audio_results.audio_details.
business
string 服务名称
illegal:违规音频
porn:色情音频
audio_results.audio_details.
suggest
string 建议
normal:通过
suggest_review:疑似
confirm_reject:拒绝
audio_results.audio_details.
label
int 分类标签ID
illegal:1-正常,2-涉黄,3-广告,4-涉暴,5-涉政,6--辱骂,7-灌水
porn:1-正常;2-娇喘
audio_results.audio_details.
label_desc
string 分类标签描述
audio_results.audio_details.
rate
double 分类标签置信度 [0, 1.0],值越大置信度越高
audio_results.audio_details.
keywords
list 命中违规关键字列表
audio_results.audio_details.
keywords.matched_item
string 命中关键字

音频流检测断流接口

输入:

GET参数部分

参数名 必选 类型 说明
Action=AnalyzeAudioStream string 固定此值
Version= 2019-05-15 string API版本号,固定此值

POST请求示例

{
    "guard_id":"125211231231", 
    "stream_url":"http://xxx.com/xx.flv",
    "stream_id":"xaaw123",
    "user_id":"userceshi",
    "callback_url":"http://xxxxx/xxxcallback",
    "action":"end"
}

POST参数说明

参数 必选 类型 说明
guard_id string 送审计划id
stream_url string 音频流url
stream_id string 音频流id
callback_url string 回调url
user_id string 用户id
action string 断流标识,值固定:end

送审计划id获取路径:金睛内容识别 > 送审管理模块 > 送审计划列表/送审计划详情 > 复制送审计划id

音频识别

详见金睛内容识别平台操作手册

接口返回:

{
    "header":{
      "err_no":200,
      "err_msg":"success"
    },
      "cost":0.11,
    "request_id": "d679e27b-9f1b-44bf-b134-49a6d9f0adff",
    "request_time": 1234567890123,
    "body":{}
}

违规音频段回调结构:

{
    "body": {
        "data_id": "4a75a3be104ec296058047941c261a21",
        "audio_url": "https://ks3-cn-beijing.ksyun.com/airesearch/datasets/test_mp3_20190311/lover_30s.mp3",
        "suggest_summary": "confirm_reject",
        "suggest_summary_code": "209000",
        "suggest_summary_message": "音频违规",
        "user_id":"userceshi", 
        "stream_id": "1111111",
        "start_time":1556266149000,
        "end_time":15562661491000,
        "results": [
            {
                "business": "illegal",
                "text": "XXXXXXXXXXXXXXXXXX",
                "label": "5",
                "label_desc": "涉政",
                "label_details": [
                    {
                        "word": "XXX"
                    },
                    {
                        "word": "XX"
                    }
                ],
                "suggest": "confirm_reject"
            },
            {
                "business": "porn",
                "label": "2",
                "label_desc": "娇喘",
                "label_details": [
                    {
                        "start_time": 1556266149000,
                        "end_time": 1556266149000
                    },
                    {
                        "start_time": 155626614900,
                        "end_time": 1556266149000
                    }
                ],
                "rate":0.99,
                "suggest": "confirm_reject"
            }
        ]
    },
    "header": {
        "err_no": 200,
        "err_msg": "success"
    },
    "request_id": "7e106d4a-25f1-4a9a-98fc-ba9b9a4fd74d",
    "request_time":"1557906136463"
}

违规音频段回调期望返回:

{
    "code":0
}

回调字段说明

字段 类型 是否必须 说明
body.data_id string 音频段唯一id
body.audio_url string 音频段url
body.suggest_summary string confirm_reject:拒绝;
suggest_review:疑似;
normal:通过
body.suggest_summary_code string 209000:音频违规;
214000:音频涉黄;
100000:正常
body.suggest_summary_message string 209000:音频违规;
214000:音频涉黄;
100000:正常
body.stream_id string 音频流id
body.start_time long 音频段开始时间单位毫秒
user_id string 用户id

违规音频识别对应的results字段

字段 类型 是否必须 说明
business string 调用服务名称,违规音频识别:illegal
label string 分类标签ID
1:正常;2:涉黄;3:广告,4:涉暴,5:涉政,6:辱骂
label_desc string 分类标签
1:正常;2:涉黄;3:广告,4:涉暴,5:涉政,6:辱骂
label_details object 音频违规详情
text string 音频识别结果
suggest string confirm_reject:拒绝;normal:通过;suggest_review:疑似;

色情音频识别对应的results字段

字段 类型 是否必须 说明
business string 调用服务名称,色情音频识别:porn
label string 分类标签ID
1:正常;2:娇喘
label_desc string 分类标签
1:正常;2:娇喘
label_details object 音频涉黄详情
suggest string confirm_reject:拒绝;normal:通过
rate double 分类置信度 [0, 1.0],值越大置信度越高

错误码说明

调用接口失败时,返回的HTTP消息体将中包含具体的错误信息,下表为错误码的具体说明,找不到错误原因时,可以联系我们,并提供Response中的request_id/audio_id,以便尽快解决问题。

其他说明

接口regionId仅支持cn-beijing-6;

业务层级错误码

err_msg err_no 说明
下载失败 -10 长音频下载失败/连接超时
获取媒体信息失败 -20 获取长音频时长等信息失败
音频抽取失败 -40 长音频切分音频段失败
调用音频服务失败 -60 调用音频识别服务失败
媒体汇总失败 -70 长音频汇总决策审核信息失败
媒体审核失败 -80 长音频审核策略失败
媒体处理失败 -5 长音频处理过程中出现异常
请传入必须参数 410 按照接口文档传入必须参数
媒体ID已经存在 411 音频ID是全局唯一标识
参数媒体ID不合法 412 音频ID必须由字母、数字、下划线、中线任意组成,必须以字母或数字开头
参数媒体ID长度不能大于100字节 413 参数音频ID长度不能大于100字节
参数媒体URL长度不能大于512字节 414 参数音频URL长度不能大于512字节
参数回调地址长度不能大于1024字节 415 参数回调地址长度不能大于1024字节
参数来源名称长度不能大于64字节 416 参数来源名称长度不能大于64字节
参数媒体介绍长度不能大于1024字节 417 参数媒体介绍长度不能大于1024字节
参数用户ID长度不能大于128字节 418 参数用户ID长度不能大于128字节
参数媒体URL格式有误 419 参数音频URL格式有误,支持http(s)、ftp等协议
系统异常 500 服务内部错误
媒体记录不存在 504 查询长音频记录不存在
媒体检测中,请稍后 505 长音频正在检测/排队中
送审计划有误 1001 送审计划有误
账号未开通服务 1003 账号未开通服务
查询数据已过期 1010 查询数据已过期

金山云,开启您的云计算之旅

免费注册