[No.X002]
作為一門(mén)新興技術(shù),“聯(lián)邦學(xué)習(xí)”能在保證數(shù)據(jù)隱私安全基礎(chǔ)上,實(shí)現(xiàn)共同建模,提升AI模型的效果。
這樣的前景,讓“聯(lián)邦學(xué)習(xí)”自提出以來(lái)就受到各方關(guān)注,在國(guó)內(nèi),微眾銀行首席人工智能官,國(guó)際人工智能學(xué)會(huì)理事長(zhǎng)楊強(qiáng)教授與微眾銀行AI團(tuán)隊(duì)為了“聯(lián)邦學(xué)習(xí)”的普及與落地,率先發(fā)布了商用級(jí)開(kāi)源項(xiàng)目 FATE(Federated AI Technology Enabler)。
FATE作為“聯(lián)邦學(xué)習(xí)”的第一個(gè)開(kāi)源社區(qū),吸引了大量技術(shù)愛(ài)好者與高校研究團(tuán)隊(duì)的目光,來(lái)自香港科技大學(xué)的研究生——敬清賀,就是其中一員。作為首位貢獻(xiàn)者,他提出了對(duì)FATE通信框架的優(yōu)化建議,顯著提升了通信效率。
對(duì)此我們采訪了敬清賀,分享他與團(tuán)隊(duì)對(duì)FATE的研究,以及更多關(guān)于FATE的期望與設(shè)想。
1.國(guó)內(nèi)第一個(gè)對(duì)“聯(lián)邦學(xué)習(xí)”的良好實(shí)現(xiàn)
敬清賀所在的港科大研究小組,主要工作中有一大項(xiàng)即為對(duì)機(jī)器學(xué)習(xí)框架進(jìn)行優(yōu)化,也因此接觸到了“聯(lián)邦學(xué)習(xí)”這一新興的概念。
“聯(lián)邦學(xué)習(xí)”在本質(zhì)上,是一種基于多方安全計(jì)算的分布式機(jī)器學(xué)習(xí)技術(shù),參與各方可以在不披露底層數(shù)據(jù)和底層數(shù)據(jù)的加密(混淆)形態(tài)的前提下共建模型。作為一種共贏的機(jī)器學(xué)習(xí)方式,它能有效連接“數(shù)據(jù)孤島”,形成一片共贏的AI大陸。行業(yè)應(yīng)用中能幫助不同機(jī)構(gòu)打破隔閡,聯(lián)合建立AI模型,同時(shí)各方的數(shù)據(jù)都不出本地,能讓用戶隱私得到最好保護(hù)。
而FATE作為“聯(lián)邦學(xué)習(xí)”的落地實(shí)現(xiàn)項(xiàng)目,受到了研究小組的重點(diǎn)關(guān)注。在對(duì)FATE進(jìn)行深入了解并討論后,這一群年輕的技術(shù)愛(ài)好者,躍躍欲試地開(kāi)始嘗試用FATE解決研究中遇到的問(wèn)題,并由此對(duì)FATE開(kāi)源項(xiàng)目提出優(yōu)化建議。
據(jù)敬清賀講:“接觸FATE一段時(shí)日后,我們感到這是國(guó)內(nèi)第一個(gè)對(duì)‘聯(lián)邦學(xué)習(xí)’的良好實(shí)現(xiàn)”。在敬清賀及研究小組看來(lái),F(xiàn)ATE對(duì) “聯(lián)邦學(xué)習(xí)”概念進(jìn)行了豐富和拓展,不僅包括了橫向聯(lián)邦學(xué)習(xí),還包括縱向聯(lián)邦學(xué)習(xí), 更將“聯(lián)邦學(xué)習(xí)”和“聯(lián)邦學(xué)習(xí)”相結(jié)合,從而讓不同組織不同模式的數(shù)據(jù)都能實(shí)現(xiàn)合作。他們認(rèn)為,這樣的實(shí)現(xiàn)形式,使得FATE能為有特殊需求的機(jī)構(gòu),比如對(duì)用戶隱私保護(hù)有訴求的兩個(gè)公司,提供了合作的可能。
圖:敬清賀接受采訪
2.基于“聯(lián)邦遷移學(xué)習(xí)”的FATE適用場(chǎng)景很廣泛
據(jù)敬清賀設(shè)想,F(xiàn)ATE的適用場(chǎng)景相當(dāng)廣泛,尤其是在金融、醫(yī)療等,對(duì)數(shù)據(jù)更敏感,監(jiān)管也更強(qiáng)的場(chǎng)景下,F(xiàn)ATE能夠協(xié)助實(shí)現(xiàn)在保障數(shù)據(jù)隱私基礎(chǔ)上的協(xié)同合作。
敬清賀及研究團(tuán)隊(duì)明白,真正的使用場(chǎng)景中,不可能要求兩個(gè)單位訓(xùn)練模型時(shí),具有相同結(jié)構(gòu)的信息,這幾乎是無(wú)法實(shí)現(xiàn)的,即使能限制整個(gè)用戶都要有相同模型,那應(yīng)用場(chǎng)景也會(huì)相當(dāng)有限。因而,像FATE這樣結(jié)合了縱向聯(lián)邦學(xué)習(xí),聯(lián)邦遷移學(xué)習(xí)的形式,能進(jìn)一步拓展適用場(chǎng)景。即使兩個(gè)機(jī)構(gòu)的模型是不一樣的,它還是可以共享數(shù)據(jù)一起訓(xùn)練。這也是FATE最讓這群年輕的研究愛(ài)好者所欣賞的點(diǎn)。
以微眾銀行為例,在不共享用戶數(shù)據(jù)的前提下,微眾銀行聯(lián)合多家銀行建立的反洗錢(qián)模型,經(jīng)過(guò)模擬測(cè)試,參與銀行越多,模型的性能越高。而在醫(yī)療場(chǎng)景下,比如多家醫(yī)院醫(yī)療影像、病例分散的情況,也可以通過(guò)聯(lián)邦學(xué)習(xí)提升疾病預(yù)測(cè)準(zhǔn)確度,提升整體診療水平。
當(dāng)然,除了學(xué)習(xí)和建模能力,面對(duì)即將到來(lái)的5G時(shí)代,網(wǎng)絡(luò)安全特別是數(shù)據(jù)安全問(wèn)題也是一大要點(diǎn),人人都在提給數(shù)據(jù)裝上“安全閥”,從歐盟的“數(shù)據(jù)隱私保護(hù)法”GDPR(The General Data Protection Regulation),到我國(guó)國(guó)家互聯(lián)網(wǎng)信息辦公室起草的《數(shù)據(jù)安全管理辦法(征求意見(jiàn)稿)》,數(shù)據(jù)在安全合規(guī)的前提下自由流動(dòng),成了大勢(shì)所趨。
而在同樣關(guān)注數(shù)據(jù)安全的敬清賀看來(lái),F(xiàn)ATE對(duì)加密算法的優(yōu)化,使用同態(tài)加密而非DP等形式,也更有力地保障了數(shù)據(jù)安全,對(duì)AI的落地起到了極大的推動(dòng)作用。
3.年輕研究團(tuán)隊(duì)與技術(shù)愛(ài)好者心中的FATE
作為FATE開(kāi)源項(xiàng)目的首位貢獻(xiàn)者,也是最早使用和接觸FATE的一群年輕技術(shù)愛(ài)好者,敬清賀和研究團(tuán)隊(duì)的伙伴也對(duì)FATE具有許多構(gòu)想,他們相信FATE框架語(yǔ)言還可以實(shí)現(xiàn)更多模型,從而應(yīng)用在不同的場(chǎng)景中。而在性能上,他們也會(huì)繼續(xù)深入研究,探索是否有優(yōu)化的可能。
在采訪的最后,敬清賀表示,F(xiàn)ATE是一個(gè)非常好,非常新的東西,給AI的落地提供了更大的幫助,也讓AI能應(yīng)用到更多的適用場(chǎng)景里,對(duì)不同的領(lǐng)域讓機(jī)器學(xué)習(xí)學(xué)出的模型更可靠,讓機(jī)器學(xué)習(xí)更好地進(jìn)入我們的生活。在以后,他也會(huì)持續(xù)關(guān)注著FATE,期待著自己和更多的技術(shù)愛(ài)好者,能跟隨著整個(gè)框架的更新去做一些有意義東西。
4. 開(kāi)源生態(tài)離不開(kāi)有志向的年輕技術(shù)愛(ài)好者
據(jù)了解,敬清賀來(lái)自于香港科技大學(xué)網(wǎng)絡(luò)系統(tǒng)實(shí)驗(yàn)室(HKUST SingLab),香港科技大學(xué)副教授、SINGLAB主任陳凱帶領(lǐng)學(xué)生們共同研究網(wǎng)絡(luò)系統(tǒng)的設(shè)計(jì)、分析和落地。實(shí)驗(yàn)室這一研究可以打破人工智能設(shè)施Scale Out的通信瓶頸,提升人工智能基礎(chǔ)設(shè)施的算力,讓聯(lián)邦學(xué)習(xí)技術(shù)更好、更快的落地。
像敬清賀這樣的貢獻(xiàn)者初現(xiàn)崢嶸,可以預(yù)見(jiàn),在以后會(huì)有越來(lái)越多高校和年輕技術(shù)愛(ài)好者投入FATE開(kāi)源項(xiàng)目建設(shè)中。楊強(qiáng)教授欣慰地表示:一個(gè)有活力的開(kāi)源生態(tài)離不開(kāi)有志向的青年人的貢獻(xiàn)。
楊強(qiáng)教授指出,安全和保護(hù)隱私的智能計(jì)算是軟件業(yè)當(dāng)前最重要的發(fā)展方向之一。FATE已經(jīng)成為維系大數(shù)據(jù)、人工智能和多方計(jì)算架構(gòu)的主力軍。我們歡迎更多像清賀這樣的技術(shù)新秀參與其中,讓這個(gè)“機(jī)器學(xué)習(xí)大數(shù)據(jù)的操作系統(tǒng)”生態(tài)變得越來(lái)越有活力。
同時(shí),面對(duì)許多技術(shù)愛(ài)好者及開(kāi)發(fā)者所關(guān)心的聯(lián)邦學(xué)習(xí)走向,以及這門(mén)技術(shù)的未來(lái)發(fā)展等問(wèn)題,楊強(qiáng)教授講到,“聯(lián)邦學(xué)習(xí)是一種保護(hù)用戶數(shù)據(jù)隱私的有效技術(shù),它的研發(fā)和工業(yè)應(yīng)用密不可分。所以,在接下來(lái)的發(fā)展中,也期待越來(lái)越多的企業(yè)和機(jī)構(gòu)會(huì)采用聯(lián)邦學(xué)習(xí)技術(shù),發(fā)展2C和2B的人工智能垂直應(yīng)用。”
社會(huì)對(duì)隱私和數(shù)據(jù)安全愈加嚴(yán)格的要求,將會(huì)推動(dòng)新的加密技術(shù)和多方建模的技術(shù)更加蓬勃的發(fā)展。讓我們一起期待。
FATE開(kāi)源社區(qū),匯聚了大量人工智能專(zhuān)業(yè)人士,為聯(lián)邦學(xué)習(xí)的“帝國(guó)”添磚加瓦。
來(lái)github一起參與項(xiàng)目,貢獻(xiàn)者將加入FATE開(kāi)源項(xiàng)目名單,更可獲取300-10000元等同價(jià)值激勵(lì):https://github.com/webankfintech/fate
了解更多,可訪問(wèn)FedAI聯(lián)邦學(xué)習(xí)官網(wǎng):https://www.fedai.org/#/
咨詢及溝通,可添加【FATE開(kāi)源社區(qū)助手】微信號(hào):FATEZS001。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...