2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
[ 億歐導(dǎo)讀 ] 智能金融的核心問(wèn)題是兩件事情:自動(dòng)化和智能化。先有自動(dòng)化才有智能化,像個(gè)人征信、銀行大數(shù)據(jù)等,都用到了很多人工智能的算法:如機(jī)器算法和知識(shí)圖譜。但是,真正以人工智能為核心來(lái)構(gòu)造智能金融系統(tǒng)的,目前在國(guó)內(nèi)我基本上沒(méi)有看到。
【編者按】這是一篇一年前的文章,文因互聯(lián)創(chuàng)始人鮑捷在參加中信證券2016年11月24日舉辦的《中信證券2017年資本市場(chǎng)年會(huì)》上的演講,主題是《智能金融的核心引擎:一覽與前瞻》,文章從智能金融的核心、中美兩國(guó)智能金融的發(fā)展、智能對(duì)產(chǎn)業(yè)的影響、智能金融的底層技術(shù)以及相關(guān)事例等方面,對(duì)國(guó)內(nèi)智能金融商業(yè)化發(fā)展進(jìn)行了概論和前瞻:Intelligent、Smart Data。時(shí)隔一年半,讀完依舊收獲頗多,億歐特編輯,供業(yè)內(nèi)人士參考。
6月15日,億歐在上海舉辦「2018全球AI領(lǐng)袖峰會(huì)——智能+新金融峰會(huì)」,峰會(huì)將從智能金融商業(yè)模式落地、金融業(yè)務(wù)革新、銀行業(yè)態(tài)變遷、智能科技前景與難點(diǎn)等方面進(jìn)行研討,探析即將到來(lái)的智能金融時(shí)代。
我們文因互聯(lián)是一家位于北京的初創(chuàng)公司,正在探索智能金融落地的各種場(chǎng)景。智能金融這件事,不僅在中國(guó)很新,在美國(guó)也是很新的事物。在探索智能金融的過(guò)程中,包括技術(shù)的基礎(chǔ)、技術(shù)在金融行業(yè)的切入點(diǎn)、盈利模式等,大家都沒(méi)有完全探索出來(lái)。我估計(jì)還要花上三五年甚至更久的時(shí)間才能搞清楚。
之前很多人都會(huì)問(wèn)我:你們是不是做互聯(lián)網(wǎng)金融的?最近幾個(gè)月以來(lái),大家開始問(wèn):你們是不是做科技金融的?Internet Finance和Fintech這兩個(gè)概念,大家都已經(jīng)很熟悉了,但智能金融是一個(gè)更小的概念。我的理解是:智能金融是科技金融的一個(gè)子模塊,和互聯(lián)網(wǎng)金融有一定交叉,但并不完全相同。
前一段時(shí)間我看了《清華科技評(píng)論》,這是一本很厚的集子,里面講了國(guó)內(nèi)外100多個(gè)這樣的公司。畢馬威也出了一個(gè)中國(guó)Fintech 50強(qiáng)的列表。仔細(xì)看的話,這些公司從事科技金融和互聯(lián)網(wǎng)金融的都有,但是涉及到智能金融的其實(shí)還是非常少的。智能金融從去年開始在中國(guó)剛剛起步,今年又陸陸續(xù)續(xù)出現(xiàn)了一些,但是還處于非常初步的階段。
什么是智能金融?
在之前20多年的金融數(shù)據(jù)化和智能化的過(guò)程中,智能金融逐步成熟起來(lái)。這離不開之前做的很多工作,從金融到互聯(lián)網(wǎng)金融,再到科技金融,其實(shí)經(jīng)歷了很多的準(zhǔn)備工作。不僅是數(shù)據(jù)的準(zhǔn)備工作,還有市場(chǎng)的教育工作。已經(jīng)有這些領(lǐng)域的前輩幫我們探了路,趟了很多地雷。
按照我的理解,智能金融的核心問(wèn)題是兩件事情:自動(dòng)化和智能化。先有自動(dòng)化才有智能化,像個(gè)人征信、銀行大數(shù)據(jù),還有之前的P2P和眾籌,都用到了很多人工智能的算法,包括機(jī)器算法和知識(shí)圖譜。但是,真正以人工智能為核心來(lái)構(gòu)造智能金融系統(tǒng)的,目前在國(guó)內(nèi)我基本上沒(méi)有看到。在國(guó)外,我們可以看到Alphasense、Kensho這樣的公司,國(guó)內(nèi)目前還沒(méi)有成熟的對(duì)應(yīng)公司。
智能金融的定義
為什么會(huì)有智能金融出現(xiàn)?這是這些年中國(guó)經(jīng)濟(jì),特別是金融產(chǎn)業(yè)發(fā)展所帶來(lái)的一些因素造成的。
發(fā)展的正負(fù)面因素
促進(jìn)因素包括:
第一點(diǎn):市場(chǎng)規(guī)模的成長(zhǎng)
舉個(gè)例子,我們之前找A股的研報(bào),隨便一搜,大概就下載了30多萬(wàn)份研報(bào)的PDF文件。我們?nèi)フ倚氯逖袌?bào)的時(shí)候,發(fā)現(xiàn)新三板93%的企業(yè)沒(méi)有任何研報(bào),98%的企業(yè)只有一份或者少于一份的研報(bào)。在A股市場(chǎng)上,中國(guó)的研究員可能有7000人或更多,他們?cè)趦汕Ф嗉夜旧厦嫜芯苛?0年時(shí)間,把每個(gè)行業(yè)都研究透了,寫出來(lái)上百萬(wàn)份報(bào)告。
新三板上現(xiàn)在有將近一萬(wàn)家公司,未來(lái)還有可能達(dá)到兩萬(wàn)家,其中一半以上的公司所在的行業(yè)都是新興行業(yè)。在這些行業(yè)上,如果我們還沿用之前人工研究的方法,需要多少研究員?現(xiàn)在是七千個(gè)研究員,要把研究員擴(kuò)大到七萬(wàn)個(gè)來(lái)解決這個(gè)問(wèn)題的話,顯然是不可能的。所以之前的研究體系跟交易體系、資源配置體系,只適合為很少的公司進(jìn)行運(yùn)作?,F(xiàn)在面臨著一個(gè)十倍甚至更大市場(chǎng),我們不可能沿用原來(lái)的方式來(lái)服務(wù)這個(gè)市場(chǎng),必須要依靠技術(shù)。而人工智能就是這個(gè)過(guò)程中最重要的一環(huán)。
第二點(diǎn):產(chǎn)業(yè)的升級(jí)
之前我們看A股的公司,上面有各種各樣傳統(tǒng)的產(chǎn)業(yè),國(guó)有企業(yè)的產(chǎn)業(yè)。那么到了新三板上,我們看到了一大半以上公司都是新興行業(yè),這些行業(yè)在A股上根本沒(méi)有。在新三板,我們找到了六萬(wàn)多種產(chǎn)品,其中超過(guò)60%的行業(yè)標(biāo)簽在A股上是找不到的。傳統(tǒng)培養(yǎng)行業(yè)研究員的方式跟不上今天的新興行業(yè)的成長(zhǎng)速度。新三板還只有一萬(wàn)家企業(yè),早期市場(chǎng)有幾十萬(wàn)家企業(yè),還有更多新興的行業(yè),怎么可能用人力完全把它建模出來(lái)?必須用技術(shù)的手段。
第三點(diǎn):人工智能技術(shù)的進(jìn)步
特別是最近幾年,深度學(xué)習(xí)技術(shù)和知識(shí)圖譜技術(shù)快速發(fā)展,使得我們有可能解決這些問(wèn)題。這些問(wèn)題并不是全新的問(wèn)題,在美國(guó)之前也有。十年之前美國(guó)有一批公司出來(lái)做這種事情,但他們最終大多死掉了。為什么?因?yàn)槟莻€(gè)時(shí)候從底到上,每一層的技術(shù)架構(gòu)都不完善,從數(shù)據(jù)庫(kù)到前面的搜索引擎,都是自己來(lái)搭。那個(gè)時(shí)候還沒(méi)有成熟的體系來(lái)支撐,也沒(méi)有開放的數(shù)據(jù)來(lái)建立整個(gè)生態(tài)鏈。2006年之后,美國(guó)的這種數(shù)據(jù)發(fā)展起來(lái)了。2001年之后整個(gè)語(yǔ)義網(wǎng)的技術(shù),2012年之后整個(gè)知識(shí)圖譜的技術(shù),使得我們現(xiàn)在有可能解決這些問(wèn)題了,不需要我們?cè)僦仡^開始構(gòu)造整個(gè)架構(gòu)了。
以上是正面的因素。在這些正面因素的前提下,為什么智能金融現(xiàn)在還是一個(gè)非常弱小的產(chǎn)業(yè)?我們下面來(lái)看看制約智能金融發(fā)展的因素。
制約因素包括以下三點(diǎn):
第一點(diǎn):數(shù)據(jù)的缺失
在美國(guó),這個(gè)問(wèn)題已經(jīng)解決得比較好了。在國(guó)內(nèi),相信做過(guò)這件事情的同行都會(huì)有切身體會(huì)。無(wú)論是政府?dāng)?shù)據(jù),還是行業(yè)數(shù)據(jù),數(shù)據(jù)缺失都是第一位的。3月份的時(shí)候,我們開了一個(gè)沙龍叫“語(yǔ)義對(duì)話金融”。在這個(gè)沙龍上我問(wèn)在座的投資人:你們覺(jué)得當(dāng)今最需要解決的問(wèn)題是什么?答:是數(shù)據(jù)!巧婦難為無(wú)米之炊,所以我們必須先把數(shù)據(jù)問(wèn)題解決?,F(xiàn)在大多數(shù)的數(shù)據(jù)在哪里?其實(shí)都被隱藏著。很多數(shù)據(jù),在政府的各部委的數(shù)據(jù)中,在各個(gè)地方政府里面,現(xiàn)在還沒(méi)有一套很好的開放方法,讓大家能夠訪問(wèn)到。實(shí)際上,這是全民的財(cái)富。
從2009年之后,美國(guó)從白宮開始一層一層去搞開放數(shù)據(jù),最后要求政府每一級(jí)都真正地開放數(shù)據(jù)。使用數(shù)據(jù)的每一個(gè)人,不需要事先申請(qǐng)就可以使用,這一點(diǎn)在中國(guó)目前是還沒(méi)做到的。即使是大家能夠接觸到的數(shù)據(jù),現(xiàn)在用得還不是特別好。比如說(shuō)機(jī)器可讀的金融報(bào)表,現(xiàn)在的結(jié)構(gòu)化金融報(bào)表本來(lái)應(yīng)該讓每個(gè)人都可以訪問(wèn),這樣我們就不用雇那么多實(shí)習(xí)生去爬數(shù)據(jù)了。但現(xiàn)在它也不是每個(gè)人都能夠拿到。另外,在股轉(zhuǎn)書、年報(bào)、季報(bào)里,90%以上的數(shù)據(jù)都是非結(jié)構(gòu)化的。怎么使用這些數(shù)據(jù)?現(xiàn)在沒(méi)有一套很好的辦法幫我們用好這些財(cái)富。
第二點(diǎn):人才的缺失
既懂金融又懂技術(shù),這樣的人才是非常非常少的。因?yàn)檫@兩種人是完全不一樣的,一個(gè)來(lái)自火星,一個(gè)來(lái)自金星。能將這兩種背景結(jié)合在一起的人,在中國(guó)可以說(shuō)是鳳毛麟角。
第三點(diǎn):組織變革的困難
我覺(jué)得這個(gè)因素是最重要的一個(gè)問(wèn)題。我前兩天在看一本書叫《創(chuàng)業(yè)者》,英文叫Founders at Work。這本書第一篇文章是PayPal的創(chuàng)始人回憶他們當(dāng)時(shí)怎么創(chuàng)造出PayPal的。記者問(wèn)他們:為什么你們不害怕銀行來(lái)做這件事情呢?創(chuàng)始人說(shuō):銀行絕對(duì)不可能做這件事情,因?yàn)殂y行關(guān)心的問(wèn)題是銀行原來(lái)的體系內(nèi)部,他們認(rèn)為PayPal完全不可能做出來(lái),因?yàn)樗麄冋J(rèn)為反欺詐的問(wèn)題絕對(duì)不可能被解決。但是PayPal就解決掉了這些問(wèn)題?,F(xiàn)在我們回過(guò)頭來(lái)想,是不是還有類似的事。
在一開始的時(shí)候,大量金融創(chuàng)新的可用性、可靠性都不是那么好。在這種大型組織里,想運(yùn)用這種新技術(shù)是很困難的事情。這就是一個(gè)典型的創(chuàng)新者的窘境。
特別是在技術(shù)面臨的挑戰(zhàn)前面,它組織的變化,整個(gè)理念的變化,它的價(jià)值體系的變化都是挺慢的一件事情。我們大家都知道,銀行只看風(fēng)險(xiǎn)是不夠的。國(guó)家強(qiáng)調(diào)提高直接融資的比例,降低間接融資的比例。但是銀行為什么就不能很快轉(zhuǎn)變過(guò)來(lái)呢?因?yàn)殂y行原來(lái)的一整套體制都是風(fēng)控驅(qū)動(dòng)。風(fēng)控是高壓線,所以人的提拔,獎(jiǎng)懲全都是按照風(fēng)控來(lái)做的。在外部形勢(shì)沒(méi)有發(fā)生變化的前提下,這個(gè)并沒(méi)有什么錯(cuò)誤。但如果發(fā)生了變化呢?組織在這個(gè)過(guò)程中會(huì)變化,但不會(huì)這么快。這使得越大的組織,在使用這些新技術(shù)的時(shí)候,反應(yīng)越慢。這是制約因素。
簡(jiǎn)單看一下中美比較,去年畢馬威把中國(guó)Fintech 50強(qiáng)和國(guó)際100強(qiáng)做了一個(gè)比較。他們剛剛做了一個(gè)發(fā)布會(huì),這里面有幾個(gè)大塊,跟智能金融有一點(diǎn)關(guān)系,但不是完全一樣。我們看框起來(lái)這一塊是大數(shù)據(jù)征信。中國(guó)對(duì)這一塊進(jìn)行了密集的投入,比美國(guó)還密集。我懷疑中國(guó)有沒(méi)有一千家在做這件事情。另外智能投顧這一塊,做財(cái)富管理的公司美國(guó)非常多,中國(guó)非常少。這跟中國(guó)各種產(chǎn)業(yè)環(huán)境也有關(guān)?,F(xiàn)在,中國(guó)的監(jiān)管機(jī)構(gòu)不是很鼓勵(lì)做這件事情。之前,哪怕是非智能的投顧,在中國(guó)其實(shí)也沒(méi)有發(fā)展得特別好。所以智能投顧的基礎(chǔ)并不是很成熟。
中美比較一
中美比較二
再看科技系統(tǒng)這一塊。美國(guó)有這么多公司,中國(guó)居然是一片空白。中美兩國(guó)的發(fā)展,也預(yù)示著我們哪些地方發(fā)展過(guò)熱,哪些地方可能還需要再加強(qiáng)一下。
最關(guān)鍵的,我覺(jué)得是上面兩張圖里都還沒(méi)有的東西。畢馬威2016 Fintech榜單里提到了幾家公司,像Alphasense和Kensho,2015年都沒(méi)有出現(xiàn),2016年才把它們加進(jìn)來(lái)。類似這樣的還有其他一些公司。我認(rèn)為非常值得關(guān)注的智能金融的公司,像Palantir和Dataminr,這些公司真正的是以人工智能為核心來(lái)改造金融的數(shù)據(jù)產(chǎn)業(yè)鏈,很多這樣的公司還沒(méi)有進(jìn)入公眾的視野。但實(shí)際上像Alphasense和CB Insights這樣的公司,其實(shí)已經(jīng)有七八年的歷史,并不是一夜之間冒出來(lái)的。
5.jpg
那么他們是怎么起家的?很多新興的技術(shù),像知識(shí)圖譜技術(shù),其實(shí)在2007年、2008年的時(shí)候,是非常悲催的。我從2001年開始做知識(shí)圖譜,2007年博士畢業(yè)。那個(gè)時(shí)候想找稱心的工作是蠻難的一件事情,因?yàn)榇蠹耶?dāng)時(shí)都不看好這些技術(shù)。到了2012年之后,這方面才慢慢受到關(guān)注。特別是谷歌從2010年的時(shí)候,買了一個(gè)小公司(Metaweb),發(fā)現(xiàn)這個(gè)技術(shù)特別有用。他們發(fā)現(xiàn),只有機(jī)器學(xué)習(xí)是不夠的,知識(shí)圖譜特別有用。之后發(fā)生了幾個(gè)大事件,在2012年左右像蘋果的Siri和IBM的Watson,他們發(fā)現(xiàn),僅僅是通過(guò)統(tǒng)計(jì)的方法,無(wú)法解決他們現(xiàn)在面臨的問(wèn)題。必須把人的知識(shí)、世界的知識(shí)放到系統(tǒng)里,才能解決各自的問(wèn)題。在2007年、2008年之后,已經(jīng)有一些公司先知先覺(jué)開始將這些技術(shù)用到金融里面了,Alphasense和CB Insights都是那時(shí)候成立的。
Palantir是2004年成立的。用我們行話說(shuō),它是個(gè)本體編輯器(Ontology editor),這個(gè)東西是非??菰锏?。從2004年到2010年,我自己寫過(guò)五個(gè)本體編輯器,不過(guò)沒(méi)有想過(guò)進(jìn)行商業(yè)化。Palantir則商業(yè)化了,變成了一個(gè)估值100多億的企業(yè)。這說(shuō)明,人工智能的價(jià)值取決于你怎么用它。把它用到好的角度上,找到市場(chǎng)結(jié)合點(diǎn),哪怕是看起來(lái)很偏門的技術(shù),也完全有可能成長(zhǎng)為一個(gè)很大的市場(chǎng)。Palantir背后也有一個(gè)很大的知識(shí)圖譜團(tuán)隊(duì),因?yàn)橐氚巡呗陨?、?shù)據(jù)集成做好,把下面的邏輯模型做好,都必須用到知識(shí)圖譜技術(shù)。
發(fā)展的基礎(chǔ)和階段
智能金融公司在美國(guó)從2007年、2008年就開始有了,在中國(guó)最近一兩年才開始做起來(lái),就是因?yàn)槊總€(gè)國(guó)家的經(jīng)濟(jì)發(fā)展都有階段性。我們只有一個(gè)階段、一個(gè)階段地把前面的技術(shù)都夯實(shí)了,才能去做更高級(jí)的事情。所以之前我們花了20年時(shí)間,做銀行的金融的信息化。信息化之后,我們才能做大數(shù)據(jù)化。像工商銀行可能是做這種大數(shù)據(jù)最早的一批,然后做了七八年甚至上十年時(shí)間。很多銀行只是為了滿足巴塞爾協(xié)議的那些要求,就花了十年時(shí)間。有了這些東西之后,從2015年之后,我們看到有些做信息處理的自動(dòng)化企業(yè)。做了自動(dòng)化之后,才能去做智能化,這是一層一層發(fā)展的。我們目前做智能化,坦白說(shuō)有點(diǎn)早。如果太冒進(jìn)會(huì)成為先烈,所以應(yīng)該實(shí)事求是追求合理的目標(biāo)。
從大數(shù)據(jù)到智能化
這幅圖是我從工行的前行長(zhǎng)楊凱生先生的文章里面摘出來(lái)的。這篇文章蠻新的,發(fā)表于2016年。在回顧他們工行的大數(shù)據(jù)架構(gòu)時(shí),他把整個(gè)大數(shù)據(jù)的發(fā)展過(guò)程分為五個(gè)階段。他認(rèn)為前面三個(gè)階段現(xiàn)在都已經(jīng)做得比較好了,報(bào)表顯示已經(jīng)發(fā)生了什么事情,分析為什么會(huì)發(fā)生這些事情,預(yù)測(cè)還會(huì)發(fā)生什么事情。后面兩個(gè)層面,就是運(yùn)營(yíng)分析和動(dòng)態(tài)正在發(fā)生什么,實(shí)際上這兩個(gè)層面不是光靠大數(shù)據(jù)技術(shù)就能解決的,需要更多的人工智能技術(shù),包括機(jī)器學(xué)習(xí)技術(shù)、知識(shí)圖譜技術(shù)。比如這篇文章里也講了好幾個(gè)例子,講了一個(gè)工商銀行有上千萬(wàn)的房產(chǎn)抵押,而這個(gè)房產(chǎn)的價(jià)值,每天都會(huì)變化,不停地變化,該怎么快速跟蹤上千萬(wàn)的抵押房產(chǎn)呢?他們開發(fā)了一套系統(tǒng),其中還用到了自然語(yǔ)言處理的技術(shù),來(lái)估計(jì)每一個(gè)房子價(jià)值的變化。
把視野往后推一推,我們今天談的智能對(duì)產(chǎn)業(yè)的影響,其實(shí)只是漫長(zhǎng)的技術(shù)對(duì)金融的推進(jìn)過(guò)程的自然延伸。從1960年到現(xiàn)在,過(guò)去這半個(gè)多世紀(jì)的時(shí)間,每一代計(jì)算技術(shù)的發(fā)展都對(duì)金融產(chǎn)業(yè)產(chǎn)生了巨大的沖擊。特別是這些技術(shù)創(chuàng)造了新的業(yè)務(wù),這是最重要的一件事情。所以每一次革新開始的時(shí)候,大家總是先提高現(xiàn)有業(yè)務(wù)的效率,然后再往前走。隨著每一次效率的提升之后,就會(huì)有新的組織出現(xiàn)、新的業(yè)務(wù)出現(xiàn),去挑戰(zhàn)原來(lái)的組織和業(yè)務(wù)。大家發(fā)現(xiàn)這個(gè)技術(shù)不僅僅可以提高效率,還可以創(chuàng)造出新的業(yè)務(wù),從而顛覆原有的大型組織。所以金融組織也是不斷地新陳代謝。
什么是技術(shù)
我看過(guò)一篇文章,是中信建投的一位高層寫的,他說(shuō)中國(guó)券商是個(gè)高危行業(yè)。他分析了一下過(guò)去15年的券商,發(fā)現(xiàn)好像超過(guò)一半的券商都死掉了。雖然現(xiàn)在券商的收入很高,好像去年的平均利潤(rùn)率是50%,但是我們十年后看,券商的淘汰率可能也會(huì)很高。那么什么樣的組織能夠存活下來(lái)?我們看看上面的表格會(huì)得到一些啟示。在每一次的迭代過(guò)程中,都會(huì)有一些順應(yīng)技術(shù)進(jìn)步的新興組織冒出來(lái)。最近這些年人工智能讓我們能夠看到,我們可以去做自動(dòng)化的小貸、精準(zhǔn)獲客,還有策略自動(dòng)化、組合風(fēng)險(xiǎn)管理,這些事情可以做。其實(shí)還有很多其他的事情,有待新興的組織去服務(wù)。
什么是“智能”
在談智能金融之前,我們來(lái)解釋一下什么叫“智能”。我們看到很多東西都冠以智能。我的鞋子里面有一個(gè)鞋墊,它稱為智能鞋墊,后來(lái)我掰開看了一下有一個(gè)小芯片,就稱為智能了。還有智能燈泡、智能音箱、智能汽車,這些東西都稱為智能。這些東西背后的智能指的是同一個(gè)東西嗎?
我把上圖中的三種智能稱為智能的三個(gè)階段:
第一個(gè)階段,是機(jī)器人化或者自動(dòng)化,它代替人完成一般性的、重復(fù)性的動(dòng)作,比如說(shuō)里面的芯片,或者套了一個(gè)公式。
第二個(gè)階段,稱為小聰明(Smart),像智能音箱是典型的,它可以完成一個(gè)相對(duì)而言比較簡(jiǎn)單的數(shù)據(jù)集成的事情,或者人花上很長(zhǎng)時(shí)間才能完成但是機(jī)器很快就可以完成的事情,我們稱為Smart。
第三個(gè)階段,就是Intelligent,可以真正地進(jìn)行預(yù)測(cè)、分類、聚類、策略等等,提供深度的洞察,這些都需要長(zhǎng)期深入的訓(xùn)練才有可能得到的技能。一般意義上,在說(shuō)人工智能的時(shí)候,我們通常會(huì)認(rèn)為是Intelligent層面才課稱為人工智能。但是目前我們?cè)谏虡I(yè)上看到,很多情況下大家會(huì)把這個(gè)概念往外伸,把Robot、Smart也說(shuō)成人工智能。智能燈泡不算是人工智能,智能鞋墊也不算是人工智能,但是我們?cè)谔嶂悄艿臅r(shí)候,很多人會(huì)把這些賣成AI技術(shù)的一部分。
看硬件的時(shí)候,我們可以看得很清楚,但看軟件就不一定看得那么清楚了。比如說(shuō)智能投顧這個(gè)概念是不是AI的應(yīng)用?其實(shí)本身它就有多種含義的。如果只看基于60年代就已經(jīng)有的資產(chǎn)配置理論來(lái)說(shuō)的話,那我們可以認(rèn)為它不是人工智能的。它只是在一些簡(jiǎn)單數(shù)據(jù)提取、整合這方面,做了一些Robot的工作,所以這不是人工智能。但是智能投顧這個(gè)概念,也用在很多事情上。比如說(shuō)在智能選股這些事情上面,就有人工智能在里邊。所以說(shuō)這個(gè)概念的含義是多種的。
什么是智能
我認(rèn)為可以分為三個(gè)層面:
第一個(gè)層面是Robot。在座很多人都雇過(guò)實(shí)習(xí)生。這些實(shí)習(xí)生每天從PDF里面扒數(shù)據(jù)是人工智能嗎?這是人工的智能,但不是人工智能。這個(gè)工作是非常機(jī)械的,就不應(yīng)該用人來(lái)做,而應(yīng)該用機(jī)器來(lái)做。
第二個(gè)層面是Smart,指數(shù)據(jù)的簡(jiǎn)單分析、摘要、過(guò)濾、跟蹤、可視化。Alphasense是智能的,是美國(guó)的基于知識(shí)圖譜的語(yǔ)義、金融搜索。這個(gè)軟件可以去監(jiān)視上市公司所有的年報(bào)、季報(bào)、會(huì)議記錄,開會(huì)的時(shí)候說(shuō)了什么,董事長(zhǎng)一句話說(shuō)完,一秒鐘之內(nèi),交易策略自動(dòng)就推送到投資者那里去了。這樣一種工作,用人來(lái)干一個(gè)小時(shí)也可以完成,但是用機(jī)器人,不到一秒鐘就可以干完,這是Smart。
第三個(gè)層面是Intelligent,提供數(shù)據(jù)的決策支持和洞察,這是高級(jí)分析師才能做的事情。Robot是實(shí)習(xí)生就可以做到,Smart是一兩年工作經(jīng)驗(yàn)的分析師才可以做的。Intelligent是高級(jí)分析師才能做到的。他真正有這些行業(yè)的經(jīng)驗(yàn)和洞察力,他才能做出來(lái)這件事情,才能夠合格的提出一個(gè)參謀的意見(jiàn)。像這樣的事情,我們認(rèn)為才是真正的人工智能。Kensho從某種程度上來(lái)說(shuō)接近了,但我還不能夠有信心地說(shuō)Kensho現(xiàn)在已經(jīng)是這樣的東西了,因?yàn)镵ensho包括兩大塊內(nèi)容,一塊是數(shù)據(jù)集成,第二塊就是策略生成,它的數(shù)據(jù)集成那一塊,我認(rèn)為還只能說(shuō)是Smart。
真正的Intelligent是怎么發(fā)展起來(lái)的?其實(shí)人工智能的行業(yè)是“有多少人工,就有多少智能”。因?yàn)槊客白咭徊?,最核心的?wèn)題都是成本、成本、成本。如果想去構(gòu)造一個(gè)所謂非常聰明的系統(tǒng),從技術(shù)上來(lái)說(shuō)都是做得到的。我經(jīng)常愛(ài)開玩笑說(shuō),如果明天發(fā)生第三次世界大戰(zhàn)的話,所有的AI問(wèn)題我們都可以在五年內(nèi)解決掉。因?yàn)橹灰軌蛘靼l(fā)一千萬(wàn)人,來(lái)給我們做數(shù)據(jù)標(biāo)注就可以了。我們?cè)谏虡I(yè)中,不可能免費(fèi)得到一千萬(wàn)奴隸。我們解決這些問(wèn)題的最好方法,就是經(jīng)過(guò)快速的產(chǎn)品迭代。在每一個(gè)層次上面,我們從低質(zhì)量的數(shù)據(jù)到高質(zhì)量的數(shù)據(jù),在投入一些成本之后,我們獲得一些收益,然后不斷地去加速人的輔助價(jià)值。
大家常聽到一句話,什么職業(yè)要在人工智能的壓力下失業(yè)了,速記員要失業(yè)了,或者說(shuō)翻譯要失業(yè)了。坦白說(shuō)我認(rèn)為這種話說(shuō)得不對(duì)。其實(shí)技術(shù)發(fā)展那么多年,真正的被技術(shù)消滅了的行業(yè)、職業(yè)真的很多嗎?我不覺(jué)得,更多的時(shí)候是增強(qiáng)了。我們有了計(jì)算器之后,真的把會(huì)計(jì)這個(gè)行業(yè)給消滅掉了嗎?其實(shí)會(huì)計(jì)做得更好了。人工智能取代這個(gè)、取代那個(gè)是現(xiàn)在根本不用擔(dān)心的問(wèn)題。實(shí)際上,人應(yīng)該起到畫龍點(diǎn)睛的作用。每一個(gè)層面機(jī)器幫我們,我們有了更好的數(shù)據(jù),我們有更好的創(chuàng)造力,來(lái)加速人的判斷,這才是比較好的人工智能的應(yīng)用。中間有很多的步驟,我不一一去講這些細(xì)節(jié)了。
在這里面有兩張表,講了分別從底層技術(shù)的層次上,我們到底有哪些技術(shù)可以用。同樣今天沒(méi)有足夠多的時(shí)間,把這里面的每一點(diǎn)都講到。如果把這兩張表給解釋完了的話,可能就要花半個(gè)小時(shí)時(shí)間,只好略過(guò)。
一些底層技術(shù)一
一些底層技術(shù)二
我們看最后的層面“策略生成”。如果想造出Kensho這樣的系統(tǒng)來(lái),我們到底需要花多少人力和物力?這絕對(duì)不是一個(gè)小團(tuán)隊(duì)可以做出來(lái)的。比如說(shuō)組一個(gè)10人團(tuán)隊(duì),給他們一年的時(shí)間,就能做得出來(lái)嗎?這是不可能的事情。因?yàn)楸澈笮枰龅牡讓蛹夹g(shù)發(fā)展實(shí)在太多了。
知識(shí)圖譜
這里多提一下知識(shí)圖譜技術(shù)。其實(shí)知識(shí)圖譜是一堆問(wèn)題,而不是一個(gè)技術(shù)。雖然知識(shí)圖譜為人所知是最近三四年的事情,實(shí)際上這個(gè)領(lǐng)域成型已經(jīng)有15年時(shí)間了。2001年,我們管它叫Semantic Web(語(yǔ)義網(wǎng)),2006年的時(shí)候叫Linked Data(互聯(lián)數(shù)據(jù)),2012年的時(shí)候叫Knowledge Graph(知識(shí)圖譜),到了2015年我們又把它改成一個(gè)新名叫Smart Data(智能數(shù)據(jù))。今后一兩年,大家聽到智能數(shù)據(jù)這個(gè)詞不要詫異,它和知識(shí)圖譜是同一個(gè)技術(shù),只是換了一個(gè)馬甲而已。因?yàn)槲覀冞@一行,博士論文每五年一屆,所以每五年我們這個(gè)行業(yè)就要換一個(gè)馬甲。1998年的時(shí)候我們叫Agent,在這之前我們叫Lisp、專家系統(tǒng)。所以整個(gè)知識(shí)圖譜的技術(shù),實(shí)際上有三四十年的發(fā)展歷程。最早起源的技術(shù),60年代就有了,整個(gè)細(xì)分為幾個(gè)大塊。我認(rèn)為細(xì)分下來(lái),有幾十種不同的技術(shù),統(tǒng)稱為知識(shí)圖譜。并不是找到一兩個(gè)做自然語(yǔ)言處理的人就可以號(hào)稱是知識(shí)圖譜。
從來(lái)源來(lái)講,知識(shí)圖譜可以分成四大塊:
第一塊:知識(shí)提取。這一塊主要是從自然語(yǔ)言處理的角度來(lái)看的。比如說(shuō),我們現(xiàn)在有股轉(zhuǎn)書或者研報(bào),研報(bào)里面有很多表格。把這些表格的數(shù)據(jù)提取出來(lái),就叫自然語(yǔ)言處理的技術(shù)。我們從非結(jié)構(gòu)化的數(shù)據(jù)里,把數(shù)據(jù)信息結(jié)構(gòu)化,也就是知識(shí)提取。
第二塊:知識(shí)表現(xiàn)。我們拿到了一些數(shù)據(jù)之后,怎么進(jìn)行有效處理。尤其是背后有意義的數(shù)據(jù),像股權(quán)關(guān)系網(wǎng)絡(luò)里面,股東A和股東B之間有親屬關(guān)系,他的兄弟們、同學(xué)們,這些關(guān)系是什么意思?這是一種知識(shí),我們要有一種方法,讓機(jī)器更方便地進(jìn)行自動(dòng)處理,這一部分就叫知識(shí)表現(xiàn)。
第三塊:知識(shí)存儲(chǔ)。剛才提到了圖數(shù)據(jù)庫(kù)。圖數(shù)據(jù)庫(kù)是知識(shí)存儲(chǔ)的一個(gè)分支,還有很多其他數(shù)據(jù)庫(kù),比如RDF數(shù)據(jù)庫(kù),還有混合的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的管理。
第四塊:知識(shí)檢索,有時(shí)候也叫語(yǔ)義檢索。這里面又細(xì)分成六七種不同的技術(shù),我就不一一列舉了。
這些技術(shù)對(duì)我們有什么用呢?先舉一個(gè)小例子,在投資研究的過(guò)程中,我們最早跟一些券商研究員聊的時(shí)候,逐漸分析他們的行為過(guò)程。我發(fā)現(xiàn)應(yīng)該可以將他們的分析過(guò)程分成四個(gè)步驟:
以投資研究為例四步走
第一步,是搜索。比如說(shuō)百度搜索。有時(shí)候可能是通過(guò)線下聊天或者微信,聽說(shuō)這個(gè)行業(yè)不錯(cuò)。大家看看這個(gè)行業(yè)有哪些公司,比如說(shuō)珠寶這個(gè)行業(yè),我在搜索里去搜珠寶,繞過(guò)了前面若干個(gè)不該點(diǎn)擊的鏈接之后,找到了一個(gè)正確的鏈接。然后在這個(gè)鏈接里頭,我們找到了一篇文章說(shuō)珠寶行業(yè)里面有8家公司可以看。
第二步,是找數(shù)據(jù)。這8家企業(yè)的數(shù)據(jù)在哪兒呢?打開一個(gè)金融終端,把里面的數(shù)據(jù)提取出來(lái)??赡芤荒甑臄?shù)據(jù)不夠,那么把過(guò)去幾年的都拎出來(lái),然后一年一年地給篩出來(lái)。
第三步,把這些數(shù)據(jù)扔到EXCEL表格里。有些表頭,還有一些公式也都是事先定義好的,他們每天都要做這件事。我們之前還遇到了一個(gè)人,他每周一都要發(fā)布一個(gè)新的EXCEL,里面包含股轉(zhuǎn)中心中的新三板在審企業(yè)。這些企業(yè)有1000多個(gè),每周一下午三點(diǎn)的時(shí)候發(fā)布。他每周一下載下來(lái)之后,把數(shù)據(jù)調(diào)出來(lái),用以前定義好的模板把EXCEL表格填出來(lái)。每一個(gè)周一要花三個(gè)小時(shí)做這個(gè)事情。他怎么過(guò)濾數(shù)據(jù),都是他自己的世界觀。
第四步,就是呈現(xiàn)。他拿到了數(shù)據(jù),要寫PPT、做報(bào)告、畫圖、畫表,然后看風(fēng)險(xiǎn)點(diǎn),各種進(jìn)一步分析。
當(dāng)然這只是非常簡(jiǎn)化的一個(gè)過(guò)程,實(shí)際的研究過(guò)程可能會(huì)比這復(fù)雜很多,而且是迭代的過(guò)程。這里也沒(méi)有包括那些非案頭的工作,如打電話和現(xiàn)場(chǎng)調(diào)研。
在這四步里,其實(shí)每一步你都會(huì)看到,人80%的時(shí)間在做什么?是在把一些文字、數(shù)字從一些地方挪到另外一個(gè)地方。這些事情為什么要用人來(lái)做呢?這些事情要用機(jī)器來(lái)做嘛。這就是人工智能在上面能夠起到的作用。每一個(gè)層面上,我們可以用語(yǔ)義聯(lián)想來(lái)做搜索,做行業(yè)對(duì)標(biāo)簡(jiǎn)化發(fā)現(xiàn)細(xì)分行業(yè)的問(wèn)題。我們可以用微信機(jī)器人,在微信里快速尋找數(shù)據(jù)。有報(bào)道的摘要、產(chǎn)業(yè)鏈的分析、數(shù)據(jù)的集成等等。一系列的算法,可以在每一個(gè)細(xì)節(jié)上面提高分析師的效率。這就是文因互聯(lián)現(xiàn)在在做的事情。
我們?cè)?016年1月份就做過(guò)新三板的金融終端,5月份發(fā)布了搜索,7月份發(fā)布了快報(bào)去跟蹤投前和投后的信息。最近我們做了自動(dòng)化企業(yè)報(bào)告。企業(yè)要素分析大概有十來(lái)個(gè)點(diǎn),這些點(diǎn)都是以前要一個(gè)實(shí)習(xí)生花上一天時(shí)間,甚至兩天時(shí)間才能夠做完的?,F(xiàn)在一秒鐘之內(nèi)就可以做成一份。也可以在微信群里說(shuō),我要某一個(gè)企業(yè)的分析報(bào)告,在10秒鐘之后微信機(jī)器人會(huì)在微信群里給你發(fā)出來(lái)。對(duì)于一些企業(yè)的負(fù)責(zé)人,或者時(shí)間特別寶貴的人來(lái)說(shuō),這非常有價(jià)值。之前他們的助理做這個(gè)報(bào)告,至少需要一天。現(xiàn)在在街上、出租車上,他看到了一個(gè)公司,想看看那個(gè)公司的信息,一分鐘之內(nèi)就能找到。這種信息的及時(shí)性是以前享受不到的。
自動(dòng)化信貸報(bào)告準(zhǔn)備
信貸報(bào)告準(zhǔn)備的自動(dòng)化是我們跟銀行合作的一個(gè)例子。信貸經(jīng)理、客戶經(jīng)理生成報(bào)告的過(guò)程中,需要填很多表。填完這些表格,他們把數(shù)據(jù)從一個(gè)表里挪到另外一個(gè)表里。這里面有大量企業(yè)基本信息數(shù)據(jù)、工商數(shù)據(jù)、實(shí)際控制人的數(shù)據(jù)。這些數(shù)據(jù)都是從很多其他的表里面提取出來(lái)的。一個(gè)信貸報(bào)告中大概有一兩百個(gè)點(diǎn),根據(jù)我們的評(píng)估,這其中大概有一半左右可以自動(dòng)化。我們就跟銀行一起來(lái)自動(dòng)化。同時(shí),我們還跟一些評(píng)級(jí)機(jī)構(gòu)做類似的事情。在債券的評(píng)估報(bào)告里,大家要看六百多個(gè)點(diǎn)。這六百多個(gè)點(diǎn)大部分都是可以自動(dòng)化的。從各種各樣的地方,把信息從表格中抽取出來(lái),然后定義好,進(jìn)行呈現(xiàn)和總結(jié)。
自動(dòng)化上下游分析
自動(dòng)化行業(yè)的上下游分析是另外一個(gè)例子。我們之前就已經(jīng)有這樣的數(shù)據(jù)。但是在新三板以及早期創(chuàng)投一級(jí)市場(chǎng)上,有大量的新行業(yè),這些行業(yè)的上下游從來(lái)沒(méi)有人分析過(guò)。那么怎么做呢?我們?nèi)タ纯词忻嫔弦呀?jīng)公開的數(shù)據(jù),包括這幾十萬(wàn)份的新三板上的年報(bào)、半年報(bào),還有股轉(zhuǎn)書,還有對(duì)整個(gè)產(chǎn)業(yè)的描述,這些都是金子。從這里面,我們可以抽取出來(lái)幾乎每一個(gè)細(xì)分行業(yè),上下游企業(yè)有哪些?他們對(duì)應(yīng)的產(chǎn)品有哪些?所以對(duì)這上千個(gè)新興行業(yè),我們都可以機(jī)器生成這樣一個(gè)產(chǎn)業(yè)鏈。上圖是園林行業(yè)的例子。園林的上游企業(yè),有沙石、石材,它的下游有綠化、工程、設(shè)計(jì)、種植景觀。這些工作以前都是要用人工,要用行業(yè)專家來(lái)做。我們現(xiàn)在有了機(jī)器之后,并不是取代了行業(yè)專家,而是可以讓行業(yè)專家大大節(jié)省時(shí)間,把成本降低。
自動(dòng)化公告摘要
最后一部分是我們正在跟一些交易所在做的公告自動(dòng)摘要。A股的已經(jīng)基本做好了,明年初還會(huì)做美股的。這都還是一些很初步的工作。對(duì)于整個(gè)投資研究而言,這些可以說(shuō)都是一些局部的具體應(yīng)用。我們做了十幾個(gè)這樣的工具之后,現(xiàn)在在把它們組合在一起變成一個(gè)投資研究系統(tǒng)。這個(gè)投資研究系統(tǒng)可以做發(fā)現(xiàn)標(biāo)的、企業(yè)的研究、行業(yè)的分析、事件的分析,最后生成各種各樣的自動(dòng)化報(bào)告,能夠讓每一位研究人員把他的時(shí)間放在能夠創(chuàng)造更多價(jià)值的事情上。多一個(gè)小時(shí)做什么不好?不工作的話,睡覺(jué)也好、談戀愛(ài)也好,做什么都好。讓金融人士每天延長(zhǎng)生命一小時(shí),這就是我希望達(dá)到的目標(biāo)。
投研系統(tǒng)
我們現(xiàn)在做的事情還都非常初步。再回到剛開始說(shuō)的,智能金融這件事情才剛剛開始,我們的著眼點(diǎn)并不是下一步就替代什么,或者做很智能化的事情,而是把小事情做好,真正地幫助人做一些自動(dòng)化的小事,提高人的效率。我相信在5年以后,我們會(huì)有一個(gè)智能金融的生態(tài)系統(tǒng)出來(lái)。人工智能在這個(gè)過(guò)程中會(huì)起到非常重要的作用。我們文因互聯(lián)希望跟這個(gè)產(chǎn)業(yè)一起同步成長(zhǎng),謝謝大家!
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。