更新时间:2020-04-29 21:17:54
在“内容为王”的视频领域,视频网站除了想方设法防止自己的内容被盗链或侵权外,还需要特别注意自身对外提供的视频内容是否触发政策或法律风险,比如涉黄涉恐涉政等。现在很多视频网站都包含UGC/PGC类的视频内容,这些内容主要由终端用户制作上传,视频网站对这些内容的可控性较差,容易触发政策或法律风险。
如果客户自己通过人工鉴别,工作量大,效率又低,会影响视频内容的发布时间;如果客户自己开发算法进行鉴别,技术要求高,开发周期长,而且准确性也得不到保障;如果客户自己购买第三方成熟产品,单价比较高,成本投入大,出现问题时响应速度也比较慢。
为帮助客户解决这一难题,网宿推出了基于深度学习算法的图片识别技术,以智能手段代替人工手段,可以更加高效、准确地识别出涉黄涉恐涉政等非合规视频信息,既保证视频内容的快速发布,又避免触发政策或法律风险。
网宿智能识别系统是一种基于深度学习算法的图片识别技术,它先建立样本库,利用海量的数据建立模型,然后提取图片中的图像特征,通过图像检索算法与模型进行比对,再不断地训练机器,让机器不断纠正错误,学习到更多的特征,进行更精确的判断。
鉴定机器会根据客户需求,将被审核的的图片进行分类,并对每个分类分别进行打分,分数越高则确信度越高,每个鉴定类别结果显示如下:
(1) 鉴黄结果分类显示:色情、性感、正常
(2) 鉴恐结果分类显示:非暴恐、暴恐
(3) 政治人物识别结果分类显示:非政治人物、政治人物
(1) 客户调用API接口下发视频截图指令,对存储在云存储的视频进行截图操作。详见《视频截图》功能文档。
(2) 客户通过API接口下发智能识别指令,要求对截图进行智能鉴定。
(3) 云存储将鉴定结果回调给客户。
2.3.1 调用请求鉴定接口
格式:
type=<type>&image=<Urlsafe_Base64_Encoded_Image>&bucket=<bucketName> Authorization |
参数说明:
参数 | 必填 | 类型 | 描述 |
type | 是 | string | 鉴定类型,porn-鉴黄,terror-暴恐,political-政治人物识别 一次请求只能指定一种鉴定类型 |
image | 是 | string | 图片URL,一次请求只支持一个URL的鉴定,需经过URL安全的Base64编码 |
bucket | 是 | string | 云存储空间名 |
Authorization | 是 | string | 管理凭证,一般由安全密钥和访问密钥组成,用于校验API接口请求的合法性,管理凭证生成地址:https://wcs.chinanetcenter.com/document/Tools/GenerateManageToken |
实例:
curl -X POST -d "type=<type>&image=aHR0cDovL3Nob3ctdmllZG8uODY4NmMuY29tL3Byb24ucG5n&bucket=xxx" -H "Authorization:xxx:xxx" http://xxx(管理域名)/imageDetect |
2.3.2 鉴定结果通知接口
客户需设置鉴定通知地址detectNotifyURL和detectNotifyRule,云存储才会进行鉴定通知,否则不通知。鉴定通知地址detectNotifyURL需要进行URL Encode编码后,再经过URL安全的Base64编码。格式详见《视频截图》功能文档。
2.3.3 鉴定结果说明
{
“results”:[
{
“image”:
“errMessage”:
“pornDetect”: { //仅鉴定类型为鉴黄,即type=porn时返回该节点
“label”:
返回字段说明:
字段名 | 父元素 | 类型 | 描述 |
result | - | array | 鉴定结果 |
image | results | string | 请求鉴定的图片 |
errMessage/td> | results | string | 错误信息,鉴定成功返回空值 |
pornDetect | results | node | 鉴黄信息,仅type=porn时返回该节点 |
label | pornDetect | int | 图片鉴黄结果分类;0-色情, 1-性感, 2-正常 |
rate | pornDetect | float | 介于0-1间的概率值,概率越高,鉴定结果越肯定 |
review | pornDetect | boolean | 是否需要人工复审该图片;true-需要,false-不需要 |
terrorDetect | results | node | 鉴恐信息,仅type=terror时返回该节点 |
label | terrorDetect | int | 图片鉴恐结果分类;0-非暴恐, 1-暴恐 |
rate | terrorDetect | float | 介于0-1间的概率值,概率越高,鉴定结果越肯定 |
review | terrorDetect | boolean | 是否需要人工复审该图片;true-需要,false-不需要 |
politicalDetect | results | node | 政治人物识别信息,仅type=political时返回该节点 |
label | politicalDetect | int | 图片政治人物识别结果分类;0-非政治人物, 1-政治人物 |
persons | politicalDetect | array | 政治人物信息 |
name | persons | string | 政治人物名字 |
rate | persons | float | 介于0-1间的概率值,概率越高,鉴定结果越肯定 |
review | persons | boolean | 是否需要人工复审该图片;true-需要,false-不需要 |
适用于视频内容不易把控的客户,比如开展UGC/PUC视频业务的客户
(1) 智能识别属于增值服务,若要使用需另行付费。
(2) 客户可设置鉴定通知规则,不设置通知参数则默认不通知客户鉴定结果,客户可以在网宿SI系统上查询鉴定结果。