AI时代已来?我们需要先辨一辨其中的真伪与虚实

CFAInstitute2020-11-28 15:18:25

Noah Silverman博士(LinkedIn: https://hk.linkedin.com/in/noahsilverman)


本文整理自Helios.ai公司创始人Noah Silverman博士在国际金融科技论坛上的演讲。


今天我想要跟大家谈一谈人工智能,“AI”这个热门话题。如今,我们把这些叫做传统机器学习工具、统计学习理论或者说是线性编程(年纪大一点的人应该还记得这些),改称为AI,宣传力度和可见之处比以前增加很多。媒体近来对于AI的表现已经失控,他们经常在探讨这个话题,比如用很多有意思的新闻标题——通常情况下,搜索AI你会看到非常酷的照片,机器人占领世界什么的,然后你会看到这样的标题,“保卫我们的收入和工作”、“AI失控的六个恐怖故事”、“AI崛起带来终结劳动力的威胁”等越来越多的负面标题,还有“机器人逃跑”这种。一直以来,互联网好和坏的点都在于让每个人都能发表自己的看法。说到AI,现在的这种知名度高到离谱,比如跟我聊天的人都会问,“你在AI领域投资的是什么?”、“我们应该看什么?”、“未来的热点在哪里?”。因为实在太热门了,也会带来一些积极的东西,比如下图是一个非常有爱的来自第三世界的小孩接种疫苗的照片,虽然不清楚这个过程中有哪个部分用了AI,但是已经有报道称AI能够节省上亿费用、应对人道主义危机,讨论政府是否应该监管、已经应用于公共事业,还有AI来做评委的选美大赛等等。



IBM的沃森(Watson)在我看来并没有能展示出来这个系统多有价值,这个所谓的“万能”技术并没有被用在很多地方,(看到的)有设计裙子——这是一个很典型的市场营销部门“运营不错”的例子。下图展示的是我最喜欢的(一个案例),有人做了一个网站,用AI、机器学习可以发现任何事物间的所谓相关性,这就是AI或者很多这类工具的问题,输入数据可以得出任何东西。数学家John von Neumann 曾说过,给我最多四个参数,我可以生成一只大象,给我五个,我还能做出一个象鼻。



当互联网开始做新闻、出版商开始在网上发布内容,这改变了竞争模式,开始对公众关注度的争夺,通过吸引流量来获得广告收入,记者和新闻媒体都被推动着尽可能用“标题党”那样的做法,这样才能吸引来点击量。



上图是我很喜欢的一个漫画,一个大学的研究员发现了A和B之前有某种相关性,经过一圈媒体报道以后,就变成了“有致命因素”、“你要警惕”。这就是AI可能做出来的事。这是一个“完美的风暴圈”,媒体根本不知道自己在说什么,却想着吸引眼球,整个行业也非常期待着有新兴事物可以投资,通过什么新方式将投资回报最大化、服务好客户,然后还有各种复制粘贴工具的扩散,每个人都可以在参加完一个工作坊以后说“做AI就是这么简单”。很多创业项目、创业公司宣传的噱头都没有什么价值。著名科幻小说家Arthur Charles Clarke曾经说过,“所有充分先进的技术就像是魔法一样。”所以你会看到的是,很多一直在金融、基金、银行业工作的专业人士,他们可能不知道AI是什么,他们没有科学或计算机背景,所以对他们来说,这看起来就是十分神奇的技术,这也是催生这样一个不应该如此的热点和投资圈的部分原因。


我接下来想说的是,AI到底是什么?以及我们公司是如何看待AI的。我的博士学位是统计机器学习专业的。从根本上说,我觉得这就是一个概率理论,我的方法就是如果你对你的工作、投资组合、财务模型有不确定性,而你想要使用它们,如果你能用excel表格解决,很容易可以处理好,但是如果你不确定,就需要更高深复杂的工具。对一般人来说,如果说到不确定性,他们想到的是根本不知道如何下手。但我不这样认为,爱因斯坦说“上帝是不掷骰子的”,但物理学家Joseph Ford说的是,上帝是掷骰子的,只是他们会“出老千”。我们能学到其中的规律,这也是我对金融科技中很多问题的理解——尽管是随机的,但却有规律可寻。对我来说,不确定性就像这样,的确是随机的,但我们可以从中发现规律,而且是有工具可以让我们去做的,就像是机器学习中的“回归”,就是在做这种,是有一些实际的工具可以使用。


回到我刚才的观点,我把它叫做解决方案主义者(solutionism),就是沉迷于使用工具的各种初创企业、银行或者任何人。香港一家是全球最大投行之一的公司请我去演讲的时候,他们想让我讲的第一个问题就是,“我们应该拥有哪些AI工具?”他们真的问了我很多各种AI软件工具有什么不同,我问他们的问题是:你们想要做什么?想解决什么问题?是在做什么样的金融建模?你的数据是什么?是用股票价格、风险模型、投资者类别、还是企业的未来营收做数据?我们应该有什么工具?我们应该拥有或者建立什么样的工具?这也是一个心态和思想的问题,就是说每个人都有沉迷于解决方案的心态。



如图所示,excel有个很好用的功能叫solver求解器,你可以在一份表单中建立一个基础模型,通过调整一些表格数值,达到降低开支、实现最佳利润目标的结果。现在我们可以称其为AI了,放在区块链上,可能还能从投资人手上融一大笔钱,但这个东西并没有做什么特别的事,就是做优化。现在是知识世界,我们要做决策,我们要做工作,我们有很多数据,我们需要做出盈利数字、准确性、做到降低风险和开支,我们还有人力每天进行数据处理,所以涉及到AI,或者是金融科技,或者是机器学习的第一件事应该是,先退一步看看这些业务流程究竟是什么?我们到底在做什么?人们经常会问我怎么样进行一个公司的投资?我们要在那些华丽的用词之外,看看这个公司究竟是做什么的?他们解决了什么问题?是不是真的有市场、他们做的究竟怎么样。


我想再谈谈一些基础的AI工具,我们看看这个回归,我们有一些点,可以用一条线把这些点连起来,然后会有噪点,有越来越的噪点,我们在做的是将不确定性量化,这个是有规律的,这样的模型其实是非常不准确的,但这是我们能对这样的回归做的最好的展示。你可以称其为机器学习或者AI,我们要计算的就是这条线某一个截取部分的斜率,代入参数,然后我们可以有更加复杂的情况、更加复杂的模型,我们要做的就是更加复杂的一个AI,因为已经掌握了基本线段的斜率,我们可以进行这种多维度的学习,可以做预测等等。归根结底,这是对任何现象或事物的数学模型的权重学习,最终你做的其实就是通过一些数字模型进行学习,你可以把它叫做AI,你可以在上面加一些机器人,让它看起来很炫,但核心做的工作就是这么简单


然后在有分类的情况下,你可以分两类、三类,我们要掌握的还是参数和权重、非确定性,还有多维度曲线等等,但是实际上都是一样的。所有机器学习,不管是自动驾驶,还是照片识别,还有语音识别,最终还是去计算一个可能性,然后做出决策。就是分成两层,一层是确定可能性,另一层是决策理论,根据这样的可能性可以得出什么样的结论。


接下来说一下深度学习,AI领域里最热门的趋势之一,我相信大家对深度学习了解已经很多了。深度学习其实就是上个世纪四五十年代的神经网络的“老调重弹,科学家人脑的神经元它在受到刺激之后,将接收到的信号传递给下一个神经元,最终完成大脑学习,这个过程可以通过感知器来表示,下图所示这个就是他们的一些研究结果,应该可能是四五十年代看到的公式,最左边输入因素是三个变量,各自有一个权重,互相交错处理,最终得出一个结果。



如果做监督学习,输入1万张猫的图片,再输入1万张不是猫的其他图片,然后固定权重,你就可以很好地进行预测了,这就是深度学习。问题是在于我说的“无法解读”,我们在医学领域做诊断、在金融方面做投资决策等,你想要知道为什么,如果我改变了其中一些输入因素,那么最终的结果会怎么变?如果你是医生和投资经理,我们有哪些地方可以改,最后是什么结果的改变?通过深度学习你对此没有任何控制力,就像是一个黑匣子,对图像、语音识别来说都挺好,但在金融、投资、商业流程方面,深度学习确实不是一个靠谱的工具


而现在有一个趋势是,花时间来研究股票或基金的历史价格数据、通过复杂的深度学习,在电脑里设置一个链条,形成各种工具的数百万种组合,去回测过去几个月里的价格走势,直到找到一个匹配点,证明能产生alpha收益了,就可以出去寻求投资了,可以成立一个基于AI的投资基金,但问题是这样的东西总会有行不通的那一天。像我刚才提到的关于大象的那句话,如果我可以在任何深度学习模型中输入我想输入的数据,肯定有可能得出我想要的结果,做到我想做的这些事情,所以我对于这些AI基金其实是有很大质疑的。有一些就是通过深度学习的这种模式,找到一些所谓的相关性,只是用一些流行的专业词汇包装起来,人们就会投资了,但是我其实想警告大家不要太仓促做这样的决定



我们回到这个神经网络感知器,上图这个S型曲线,我们可以把任何你想要的数学模型放在里面,基本把你的结果固定在0-1之间,其实就像是一个事情发生的概率一样,所以深度学习、机器学习做的就是输入数值,得到的结果总在0-1之间,这就是概率,可能这样的用法不太合适,但当人们说起机器学习、AI模型,总是想知道结果那个概率,而不仅仅是最后得出的某个数值,有人会说这个股票的价格会上升,我不想要这个结果,我想要的是说它有30%的概率会走高,如果是做投资组合再平衡,我看的是潜在结果的概率,概率的组合和权重。然后下一问题就可能是我们所说的这种大规模风险,如果你是一个农民的话,你会觉得下雨是件好事,如果下太多就会变成洪涝灾害,所以适度利好是好事,过度就变坏事了。


我知道我刚才是简化了整个机器学习的过程,如果以一种智能的方式把这些结合在一起,并且对整个业务流程和投资流程非常了解的话,那么他们其实是非常有用、非常强大的工具。我的工作就是做这些,我帮助我的客户,包括对冲基金、保险、监管机构建立起工具模型,这些非常有用,但是你必须要仔细研究这些流程究竟是什么。


下图所示是心脏病因果关系的学习模式 ,通过症状、活动、生活风格可以发现其中是有一定的模式可寻,可以推理出什么样的方式有助于提升健康,它们相互之间的因果关系是什么,我不会说这是AI,我会说这就是对复杂系统的理解


另外,我刚刚发现在上海有一家AI银行,它其实就是有一个机器人在那里,具备面部识别功能和预设语音信息,ATM机也有面部识别,这个概念很棒,但认真来看待底层工具的话,商汤科技大家应该也听过,图像识别做得非常好,就是通过机器学习,可以识别出车辆、人、动作。所以这些工具可以是非常有用的,就是我们需要理性的方式去对待


说到AI的神奇公式,就是把数据进行基本的简单加工,加一些“魔法因素”,公关市场部门大力推广,就可以做AI项目出去融资了。不幸的是我看到越来越多的创业公司在做的都是这种简单加工的事。python编程大家应该都听过或者用过,有一个工具包叫scikit learn,下图是网站上的一张流程图,标明了哪些环节应用了机器学习,让人们可以很方便的使用这些工具。问题就是,很多创业公司就做这样的事,在这样的“名号”下,一些大学毕业生,计算机科学专业的,组合其中两三个工具,就可以包装成AI或者是区块链公司,但这就是复制粘贴的事而已。



然后是深度学习。下图是我非常喜欢的一个深度学习的例子,就是叠加很多次,做多层深度学习,看起来很复杂,其实是非常简单的,所以再回到我刚才说的,大家要采取谨慎的态度,这些都是工具,我们在投资或者使用这些工具之前,都要仔细的研究一下这些公司、这些流程都是在干什么。

今天的主题是金融科技,所以我想简单说一下在金融科技领域看到哪些领域使用了这些AI,比如说在前端部门,用户自助服务平台,入职培训、管理关系中会使用,从自动化的角度说,很有帮助,可以减少人工的使用;中端部门中,投资组合再平衡,对于客户的风险评估、合规、绩效分析等等;后端部门,做算法交易、买卖盘传递、账户整合、风险敞口、以及清算结算等等,这三个方面都是机器学习可以很好地发挥作用的,可以提升准确度和效率


有三个当下非常热门的话题,聊天机器人、智能投顾、以及算法交易。聊天机器人是个有趣的现象,我还没发现业内有人真的需要聊天机器人,而现在很多初创企业都在推销他们的聊天机器人的技术,各种大肆宣传,甚至还有一个聊天机器人的杂志。如果你在Google和百度上搜索的话,有几千个复制粘贴的行为被贴上聊天机器人的标签,这个巨大的产业带来的是没有人想用的机器人。我想原因可以回归到解决方案主义者——这种东西很容易学到,复制聊天机器人也是非常简单的,那些计算机科学专业毕业的学生想要创业,就可以选择做聊天机器人。


话说回来,任何工具都想做不同,比如亚马逊Alexa和Google Home,中国也有类似的产品 ,本质上就是语音检测和识别,并不是什么新技术,就是设置听到什么话应该回复什么的编码,这不是什么智能家居,也不是什么学习,就是语音识别然后提供你所需要的信息,非常方便,但是它不是AI


聊天机器人其实更像是一个音乐盒,预设程序,固定问题、固定回复,然后下一个就是智能投顾,甚至有一些人会提出智能投顾是让CFA持证人的工作变容易还是取代人工这样的忧虑。智能投顾其实使用的就是一些非常基础的机器学习的工具,做的工作也不是特别神奇的。


在新加坡做的最好的三家智能投顾公司,其中采用的有基于规则的投资算法,他们其实做的也是非常基础的算法。可怕的是有一家用的是源自Harry Markowitz的现代投资组合理论(Modern Portfolio Theory,MPT),我是不会投资于这样的模式的,但我在调查中发现,将近41%的智能投顾用的还是MPT,真的挺吓人,所以我还是提醒大家要谨慎使用这样的工具,也不用担心自己的工作很快会被智能投顾所抢走,它们并没有很出色。


算法交易是个非常有意思的领域,我其实也不想把它叫做AI,用工具和软件在市场中做交易,希望做的就是发现规律和趋势,其他人还没来得及发现的,就像大型的围棋比赛,用非常好机器学习的工具帮助你达到这个目的,我们还是要深度研究概率理论、市场宏观结构、短期价格走势规律以及流动性等等,在这些方面有很多发展空间。所以基于我的背景来看,这个才是未来具有增长潜力一个金融科技领域。问题在于最终我们面临的会是不同算法之间的竞争,人类交易员很快会落后。我们今天所讲的像技术分析、市场微结构、做市、套利等等,这些都不是深度学习。


我最后想以“谨慎”这个词来结尾,在美国有一个流行的嘻哈歌曲中有一句词是说,不要相信那些大肆宣扬的东西,阅读那些经常有名人来讨论AI和机器人的小报时要持一个谨慎的态度,它们大多数就是基本的机器学习,被严重滥用了。




文章仅代表作者本人观点,不应被视为投资建议,所述观点也不一定代表CFA Institute或者作者所在公司的看法。文中所有图片来自Noah Silverman博士演讲材料。本文未经CFA Institute授权,请勿以任何形式进行转载。