神马搜索开户系统可对广告物料进行精细打标,让分类效果更优秀

1、广告物料标签


图片/视频物料在广告服务表达和用户兴趣表达上有着非常重要的作用,广告系统一般以特征的方式将其纳入到广告投放决策中。以物料ID作为特征纳入广告召回/排序的模型,能够较好地学习和预估历史上高频展现的广告,但对展现不足的新广告和长尾广告能力较弱。为了实现高效而智能的投放,神马搜索开户系统会对图片/视频物料进行更精细地理解,通过打标/分类从物料中提取实体/语义等结构化信息。


图像分类通过在训练集上学习,建立从输入空间(图像)到输出空间(标签/分类)的映射,主要包括二分类、单标签分类和多标签分类等3种类型。基于广告物料多元素多目标的特性,我们构建了多标签分类算法,应有尽有地为图像打上标签。


图像分类算法框架,一般包含主干网、分类头和损失函数3个部分(下图为多标签分类算法框架):




2、广告图像的多标签分类,主要面临3个挑战:


(1)通用多标签分类网络,包含全局池化的环节,会丢失空间信息,难以处理广告图片多区域包含多目标的问题。


(2)多标签分类任务,样本不均衡问题较为严重。


(3)视觉(CV)模型训练成本高,难以高效支持标签体系的高频更新迭代。


O6VK440.jpg


3、针对这3个问题,采用相应算法进行解决:


(1)纳入交互注意力模块:在主干网和分类头之间,去掉全局池化,替换为交叉注意力模块,进行标签和图像空间特征的自适应匹配学习,解决多区域多目标识别问题。


(2)损失函数优化:多标签分类常用的BCE损失函数,对所有样本赋予相同权重,导致已经无需大量学习的高置信度样本占用了过多资源,正样本由于比例低而得不到充分学习。神马搜索开户系统采用ASL损失函数替代BCE,能够达到降低高置信度样本权重、降低负样本权重、忽略过于简单负样本这3个目的,较好地缓解了样本不均衡问题。


(3)多分类头设计:对标签进行分组,每组对应一个分类头,以此进行标签的高效迭代。后续增加标签时,训练阶段先冻结主干网和其他分类头,仅训练新增标签涉及的分类头;精调阶段,基于训练好的主干网和分类头,仅进行较少批次的精调,即可达到优秀的分类效果。

行业动态
上一页 1 2 3
...
下一页
广告投放
 
 

服务热线:18971576794

网易云渠道活码.png

免费开户中