《彭博商业周刊》采访金融壹账通叶望春:人工智能更需要分析客户深层意图
2020-07-07 08:34 收藏(0) 阅读(708) 评论(0)

叶望春在金融及银行领域拥有逾40年的从业经验,2007年3月加入平安集团,于2015年底至今任金融壹账通(OCFT)董事长兼CEO。他告诉《商业周刊/中文版》,在局限于某个垂直领域的单个场景,可以让机器看起来具备一定的情绪理解能力,但这并不代表现阶段的人工智能具备了情商。

现今的人工智能在感知、认知能力上,发展到了什么样的一个阶段?

当前的人工智能已经具备很高的感知能力,通过模仿人的视觉和听觉等感知能力,将业务场景中的视频、图片、语音和文本等信息进行识别。比如在金融场景中,将扫描文本通过OCR(光学字符识别)技术识别为字符、将银行双录语音通过语音识别技术转换为文字,或者是从审计报告中提取出特定的财务字段标签等。

认知智能更为复杂,包含归纳总结、思考推理等能力,当前阶段的人工智能具备浅层的判断能力,但还不具备深度的认知能力。比如,我们给家具行业的小微企业主放贷,一般要做下户调查,这时感知智能是指将下户调查中拍摄到的视频、文档和对话语音转化为结构化的标签数据,而认知智能指的是如何对这些数据自动而智能的进行交叉验证,从而推断或者甄别出潜在的风险。

感知人类情绪在内的需求推动一些情感人工智能的快速兴起,然而最近有一个观点是人工智能拥有了很高的认知智商,但没有情商,你同意吗?

情商包含两部分,一是感知他人的情绪,目前从视觉、听觉和文本等多模态理解一个人的情绪已经能做得比较好,比如视觉方面,微表情识别准确率在OMG竞赛(一分钟渐进式情绪挑战)时可以达到95.1%。

另外就是揣摩出他人情绪背后的意图与动机,这需要结合事件背景、个人经历以及性格观念等多个维度进行推断,属于认知智能的范畴。

在局限于某个垂直领域的单个场景,可以让机器看起来具备一定的情绪理解能力,但这并不代表现阶段的人工智能具备了情商。例如,在贷款面审中,我们制作定制化的反欺诈模型可以让机器根据客户的表情特征判断其第三方欺诈的概率高与低,但这并不意味着机器具备了情商与认知,它只是在这个特定场景具备了判断能力,这个能力不是通用的。

语言是高度复杂的,简单的线性叠加会造成精度损失,词语权重也会发生变化,为了情绪和意图等的识别更加的准确,你们在NLP(自然语言处理)上做了哪些研究?

我们首先会使用大规模的文本语料库训练模型,去学习基本的语义信息和语法结构,然后使用特定任务场景的文本语料,让模型对之前学习的知识进行微调。

现在有国际对冲基金依靠NLP(自然语言处理)做投资决策,通过一个人的语音模式、声音频率、音调和句子结构来分析他的潜台词,那么在金融领域里,意图分析有哪些特点?

金融场景需要对口语表达中的长难句进行意图识别,客户话语中往往包含很多无意义的口水句,或者跟核心主题不怎么相关的句子,这些句子的混入会与客户本身想表达的意思造成出入,也就是理解不精确导致语义匹配和理解出现问题。例如,客户实际表达:“不是不是,我不知道,我不知道,他们使用什么手段啊,我不知道他们在搞什么鬼名堂,去年年底的时候跟我协商,一次性吧,去年年底,二月份的时候,一直是协商把这个货,把这笔钱还完,还完了以后,过了三四个月到了今天,四五月份又还是打电话给我,说我没还没还,我不知道他们搞什么名堂嘞?”客户实际意图:“二月份已还完,为啥四五月份又让还?”

金融场景的意图识别还需要一定的推理,例如,客户实际表达:“是啊是啊是啊,我开始还不了,我就用了一个50的试了一下,50的还的了,然后我用一个1950的还,又还的了,然后又2000块钱的也可以,充第三个2000块钱的时候就不行了,那我晚点再看一下好吧?”客户实际意图是客户已成功还款50+1950+2000=4000元。

需要做哪些特殊的处理呢?

金融场景的意图分析不满足于仅理解表层的意图,更需要对客户潜在的深层意图进行理解。为了能让AI具备一定的认知能力,我们首先构建了常识图谱和金融概念知识图谱,让机器具备一定的知识,同时我们搭建了意图识别框架,可以用于准确揣测客户想表达的是肯定还是否定的态度等。

哪类金融场景是当下需求最多,但还没有实现的?

金融机构在服务中小微企业开展普惠金融业务时,往往经营成本很高,尤其是在风控、运营等环节,涉及大量人工参与的中间业务流程。这其中产生了大量对人工智能的需求,但目前还不能完全攻克。去年我们运用领先科技对金融流程进行全面的优化改造,打造的智能语音机器人全年累计服务量达到8.5亿次,已覆盖本集团83%金融销售场景和81%的客户服务场景,可实现每年坐席成本下降11%。但还有20%的场景,因为无法做到准确的客户意图理解、难以显示的梳理清楚对话状态流程,还只能依靠人来应对。

半结构化和非结构化数据在很多场景的应用都有很大的困难,你们目前正在攻克哪个领域的任务?

半结构化与非结构化数据多半隐含在机器不易理解的自然语言文本中,从自然文本中提取出有效信息是人类认知力的高级表现,也是人工智能领域最难攻克的难题之一。

受启发于人类的思考过程,我们自主研发出文本标签化中台,它的底层由机器阅读理解、关系提取等基础算法组成,中层将不同文书的字段梳理成标签体系。上层则提供工作流模板,对文本进行由粗到精的拆解,这样可以实现用有限的算法构造数量不限的模板。

金融领域的任务是不是会更难?

金融领域的数据结构化主要有两个难点,一是不知道要提取什么标签。整个金融领域包含证券、基金、银行、租赁、保险等数十个方向,金融文本类型多达三千余种,每种文本可能包含的标签不同,而现阶段还没有统一的文档标签体系。二是不知道怎么提取,金融文本行文结构多样、表达形式富于变化,甚至有些标签还需要结合一定的推理运算,对于现有解决特定任务的深度学习模型而言是严峻挑战。

为什么深度学习在NLP领域中取得的成绩不如在计算机视觉领域突出?

一个原因是技术成熟度不够,计算机视觉的一些技术,例如人脸识别,目前已经较为成熟。而自然语言处理的技术多涉及认知智能,目前还未发展的很成熟。

第二个原因是NLP的技术难以规模化复制。人工智能技术大体上可以分为标准化能力和非标准化能力两种,像人脸识别这种就是标准化的AI能力,可以直接从一个场景迁移到另一个场景,因此从1到N的规模化复制很容易。而像意图识别这种NLP能力,每种场景下的意图类别都不同,每个场景都需要重新定制化建模,因此很难规模化。我们打造了十余个金融AI配置中台,解决对非标准人工智能需求进行定制化时耗时耗力的难题,这个过程可以不需要算法人员的介入。


疫情的演化也让经济和金融的格局发生变化,催化出很多新的机会,你们的股价今年至今涨幅超过了50%,你有哪些发现?

一季度公司的总收入增长29.6%,这在疫情影响下是个不错的成绩。本次疫情对全球经济和中国银行业都带来剧烈影响,中国一季度GDP同比下降6.8%,服务业、制造业、进出口受影响巨大,民营中小企业是最困难的群体。疫情也使我国银行业面临资产质量下滑、净息差收窄等变化,造成行业分化加剧。正因如此,我们也发现了变化中孕育的机会。

疫情催生了“非接触式”金融服务的需求,我们智能产品中全线上化的智能贷款、智能运营中的无接触理赔就分别是银行业、保险业“非接触金融”的典型应用。采访/马珊珊