原文:下笔如有神:这是一个基于营销行业的 AI 技术实践 - 2020.11.07

出处:InfoQ

“读书破万卷,下笔如有神”,当机器书读万卷的时候,能否做到下笔有神呢?

正在经历一个节奏越来越快的时代,互联网上的信息来也匆匆去也匆匆,各行各业涉及到高频内容生产和处理工作的都希望内容生产的速度快、质量高、数量多. 而随着人工智能技术的发展,让机器辅助人类更高效地处理信息,以及让机器自动生成信息都已经成为可能.

让机器“下笔如有神”,涉及到的就是自然语言处理(NLP)技术了,其实依据 NLP 让机器帮助人工写作的技术早已不是新鲜事,前两年人工智能最火热的时候,关于 “AI 写新闻稿,记者要失业”、“AI 写剧本,编剧要下岗”等新闻甚嚣尘上,对于 AI 导致文字工作者失业的讨论也是学术界、产业界喜欢探讨的话题.

对于这种技术能力,在市场上常听到的称呼则是「智能写作」. 互联网巨头们多有押注「智能写作」,本篇文章主要是了解京东在智能写作上的探索,更多解析在电商场景中智能写作发挥的作用.

在电商产品页面,通过点击商品标题、商品详情,到最终的下单行为,图文的感染力是左右用户的实在原因,而且随着电商平台体量增大,必然会面临需要更快更优质的内容以实现电商转化率地提升.

那么京东「智能写作」涉及到哪些关键性技术,其在京东有哪些应用,又发挥了什么作用呢?

1. 智能写作在哪些场景下占优势?

什么场景适合让机器代替人工?重复性的劳动. 在写作这件事上,把一些能找到规律的、大批量、短时间内需产出的内容让机器输出,本身对于商业来说,具有成本优势和效率优势.

从成本角度讲,一个系统一个人操作就能生产出 10 倍于人工的营销文案,这样的场景中技术是一定占优势的,而且当前的技术能力已经达到了替代部分人工的经济可行性和技术可行性.

从效率角度讲,机器能够通过数据分析,通过更精细的数据挖掘维度和非结构化营销内容的数据化与结构化,有效提升营销转化率,进而提升单位流量成本下的 GMV 收益.

所以智能写作在电商场景中的应用是非常占优势的. 同时也解决了品牌方、消费者和内容生产方三方的难题:品牌方所投放内容转化订单金额提升困难、消费者面对导购内容与商品不一致的平台使得选择成本增高,体验变差、内容生产方人工成本居高不下,资料搜集时间长,内容审核修订,素材产出效率低.

目前,京东的「智能写作」更多应用在自身平台——京东 APP 上:京东【发现好货】频道、京小智智能客服、京东搭配购、社交电商京粉、人机交互写作等.

图:京东 APP【发现好货】频道

图:京东 APP【发现好货】频道,很多商品的营销文案都由「智能写作」来生成

智能写作能够针对不同群体采用不同营销策略,以及不同风格的营销文案,从而提高营销转化率. 具体是如何实现的呢?京东 AI 研究院提出了基于商品要素的多模态摘要模型,论文发表在 AAAI2020 上,可基于商品要素进行可控的文案生成.

这也得益于京东原创的商品元素体系,首先根据用户的行为(浏览、点击、加购、下单、评论、分享等)识别用户感兴趣的商品要素——根据这些要素指定模型要生成的文案必须包含的商品要素——利用京东提出的基于商品要素可控的文案生成相应文案.

在京东 APP,通过 AI 创作的数十万商品营销图文素材,不仅填补了商品更新与达人写作内容更新之间的巨大缺口,也提升了内容频道的内容丰富性. 同时,AI 生成内容在曝光点击率、进商品详情转化率等方面,其实都表现出了优于人工创作营销的内容.

另外,在其他的互联网场景中,智能写作也在大放异彩. 比如:店铺装修运营、广告创意创作等场景下,将重复工作由 AI 技术完成,创意工作由 AI 构建数据支持和洞察支持,人机协同创作更高效的创意营销内容. 还有直播场景下,AI 可以辅助主播创作黄金话术、实时洞察消费者情绪变化与直播间的消费者需求分布等.

2. 京东智能写作的关键性技术

京东「智能写作」依靠的关键技术就是多模态异构数据自动摘要技术.

通过输入多模态(图片 + 文本)、异构(结构化商品知识图片和非结构化纯文本)数据,挖掘卖点和商品要素,模型包括多模态的编码器和解码器、预训练语言模型提高文本合规性、句间流畅度模型提高文本逻辑性、标点纠错模型改正标点错误,最终输出商品的营销短文.

京东 AI 研究院入选 AAAI 2020 的两篇智能写作论文:

[1] - Aspect-Aware Multimodal Summarization for Chinese E-Commerce Products论文解读

[2] - Keywords-Guided Abstractive Sentence Summarization论文解读

2.1. 基于关键词指导的生成式句子摘要模型

自动文本摘要是 NLP 领域中的一个传统任务,提出于 20 世纪 50 年代,其目标就是基于给定的文本,生成一段包含其中最重要信息的简化文本. 生成式句子摘要(Abstractive Sentence Summarization)任务的输入是一个较长的句子,输出是该输入句子的简化短句.

常用的自动文本摘要方法包括抽取式自动文摘(Extractive Summarization) 和生成式自动文摘(Abstractive Summarization). 抽取式自动文摘通过提取给定文本中已存在的关键词、短语或句子组成摘要;生成式自动文摘则是通过对给定文本建立抽象的语意表示,利用自然语言生成技术,生成摘要.

京东提出的方法则是融合了抽取式自动文摘和生成式自动文摘,在 Gigaword 句子摘要数据集上与对比模型相比,也取得了更好的性能.

如何让句子“由长变短”呢?京东提出的想法是:输入文本中的关键词可以为自动文摘系统提供重要的指导信息. 这一过程就是:首先将输入文本和参考摘要之间重叠的词(停用词除外)作为 Ground-Truth 关键词,通过多任务学习的方式,共享同一个编码器对输入文本进行编码,训练关键词提取模型和摘要生成模型,其中关键词提取模型是基于编码器隐层状态的序列标注模型,摘要生成模型是基于关键词指导的端到端模型.

图1:输入句和参考摘要之间的重叠关键词(用红色标记)涵盖了输入句的重要信息,我们可以根据从输入语句中提取的关键字生成摘要

如上图所示,可以大致将输入句子和参考摘要的重叠的词(停用词除外)作为关键词,这些重叠的词语覆盖了输入句子的要点. 例如,通过关键词“世界各国领导人”“关闭”和“切尔诺贝利” ,可以获取输入句子的主旨信息,即“世界各国领导人呼吁关闭切尔诺贝利”,这与实际的参考摘要 “世界各国领导人敦促支持切尔诺贝利核电站关闭计划”是相吻合的. 这种现象在句子摘要任务中很常见:在Gigaword句子摘要数据集上,参考摘要中的词语超过半数会出现在输入句子中.

关键词提取模型和摘要生成模型均训练收敛后,利用训练好的关键词提取模型对训练集中的文本抽取关键词,利用抽取到的关键词对摘要生成模型进行微调. 测试时,利用关键词提取模型对测试集中的文本抽取关键词,最终利用抽取到的关键词和原始测试集文本生成摘要.

这其中的重点动作可总结为以下几点:

[1] - 通过采用多任务学习框架来提取关键词和生成摘要;

文本摘要任务关键词提取任务在某种意义上非常相似,都是为了提取输入文本中的关键信息. 不同点在于其输出的形式:文本摘要任务输出的是一段完整的文本,而关键词提取任务输出的是关键词的集合. 这两个任务均需要编码器能够识别出输入文本中的重要信息的能力. 因此,利用多任务学习框架,共享这两个任务编码器,提升编码器的性能.

[2] - 通过基于关键字的选择性编码策略,在编码过程中获取重要的信息;

[3] - 通过双重注意力机制,动态地融合了原始输入句子和关键词的信息;

[4] - 通过双重复制机制,将原始输入句子和关键词中的单词复制到输出摘要中.

[5] - 在标准句子摘要数据集上,京东验证了关键词对句子摘要任务的有效性.

2.2. 基于商品要素的多模态摘要模型

商品摘要任务的挑战性在于:一方面,商品给顾客的第一印象来自该商品的外观,这对顾客的购买决策有着至关重要的影响. 因此,商品摘要系统必须能够充分挖掘商品视觉信息,反映商品的外观特色. 另一方面,不同的产品有不同的卖点. 例如,紧凑型冰箱的优点是节省空间,而环保型冰箱的优点是节能. 因此,商品摘要应该反映商品最独特的方面,从而最大限度地促成消费者的购买.

如下图所示,商品广告含有大量的文字介绍,顾客很难在短时间内在这些广告中获取有价值的商品信息,尤其是当顾客想要比较多个商品时,将会耗费大量的时间,影响了购物体验. 商品摘要模型可以为商品生成文本摘要,为潜在消费者提供了短时间内了解商品的便利. 从消费者决策的角度出发,一个好的商品摘要需要反映商品的外观特色和卖点信息,这也是本文提出的商品摘要模型的出发点.

京东 AI 研究院提出的这一电商商品的多模态摘要模型,将商品图像、产品标题和其他产品描述作为输入,生成商品文本摘要. 该模型不仅可以有效地整合商品的视觉和文本信息,而且从商品要素出发,使生成的商品摘要尽可能的包含商品的特色要素,并提高商品摘要的流畅性和简洁性.

这里对于文本信息的整合很好理解,那么这一模型是怎么理解图像信息的呢?

京东 AI 研究院提出的这一模型基于指针 - 生成器网络(Pointer-Generator). 采用了三种策略将商品图像信息融入模型中,包括使用商品图片的全局特征初始化编码器,使用商品图片的全局特征初始化解码器,以及使用商品图片的局部特征,通过注意力机制生成图片上下文向量参与解码.

首先,对商品要素进行建模(所谓的商品要素,就是商品不同方面的属性. 例如:对洗衣机而言,商品要素包括容量和能耗等),然后从商品的要素出发,对摘要的重要性、非冗余性和可读性进行建模.

[1] - 采用基于商品要素的RAML(reward augmented maximum likelihood)训练,鼓励模型生成的摘要涵盖商品的特色要素. 如图2(b)所示,该商品ground-truth特色要素是容量、操控与电机,则该模型将会鼓励生成描述容量、操控与电机相关的文本;

[2] - 采用基于商品要素的覆盖度机制消除冗余信息. 传统覆盖度机制仅能在词维度进行去冗余,难以处理相关词冗余问题. 如图2(c)所示,“noise”、“quiet”和“tranquil”均在描述“运行声音”这一商品要素,如果仅对“noise”进行去冗余,难以保证“quiet”和“tranquil”不出现摘要中. 本文提出的模型通过商品要素维度的去冗余,可以避免“noise”、“quiet”和“tranquil”同时出现在摘要中;

[3] - 通过商品要素放回跳机制提高摘要的可读性. 如图2(d)所示,商品要素的回跳描述降低了商品摘要的连贯性,影响了消费者的阅读体验. 本文提出的模型通过解码时禁用回跳要素词,有效地避免了这一现象.

这使得京东的智能写作可以更层次化地理解商品图像. 第一,通过 R-CNN 挖掘有价值的局部特征,例如冰箱的面板、手机的屏幕,将其融入到文本解码的每一步中,使模型针对商品有卖点的局部进行描述;第二,通过 ResNet 挖掘商品全局特征,该特征和文本全局特征一起,对编码器和解码器初始状态进行赋值,从而从更多的角度丰富商品的特征,提高商品的可区分度,生成更加多样化的文案.

论文提出了一个多模态商品摘要模型,其可以利用商品图像、标题和其他文本介绍,为商品生成摘要. 文中提出的模型可以有效地利用商品的视觉信息,并反映商品的特色要素,从重要性、非冗余性和可读性的角度对商品要素进行了有效的建模.

对于电商而言,海量商品的营销内容在由达人供稿的过程中,受限于达人写作的效率限制,商品更新速度明显高于营销内容上线速度,导致内容短缺.

AI生成内容在生成效率、曝光点击率、订单转化率等方面其实都表现出了优于人工创作营销的内容. 该方法正在应用于垂直电商、综合电商、社交电商、新媒体平台等众多场景.

3. 智能写作给京东零售带来的诸多受益

自 2019 年 2 月底,在【发现好物】的频道内实践智能写作功能,它帮助了京东零售生成多种风格文案,包括属性类描述、体验类描述、官方单品描述、搭配商品描述、社交体等,涵盖京东 2700 余个三级类目. 文案人工审核率超过 99%,曝光点击率高出达人写作 40%,累计引单金额超过一亿.

而且在今年京东 618,【发现好货】的 AI 内容导购,AI 内容是人工创作内容曝光点击率的 1.4 倍. 另外在京小智智能客服,智能生成了数百万营销文案,每天相当于超过 500 个文案编辑人员的工作量.

在 NLP 基础技术研究上,京东未来将强化电商领域语言模型,强化 NLP 应用技术研究,在商品理解和营销内容理解方面更加深入营销场景.

后续,京东「智能写作」还将覆盖更多题材的内容营销导购频道,将商品营销内容理解能力、卖点挖掘与卖点包装能力,更多的赋能商家店铺装修、广告文案创意等场景. 同时在这项能力的迭代上,提供千人千面的个性化文案,短文、长文、直播话术等多题材智能创作、营销内容智能诊断.

朱林仓,京东智联云平台产品经理,自然语言处理与智慧内容营销产品负责人,主导商品营销智能创意产品规划设计,《特种机器人》作者. 擅长将电商营销管理与人工智能技术深度融合,专注主观感性业务的数据化、结构化与智能化的产品设计.

Last modification:May 19th, 2021 at 11:37 am