日前,由DoraHacks主辦的第二屆Hackthon(黑客馬拉松)DataHack 數(shù)據(jù)科技Hackathon 落下帷幕。
近年以來, 隨著數(shù)據(jù)量日益增長,越來越多的企業(yè)意識到需要對大數(shù)據(jù)資產(chǎn)進(jìn)行價值挖掘,借助數(shù)據(jù)驅(qū)動管理和業(yè)務(wù)。另外,數(shù)據(jù)采集和處理的多樣化,讓數(shù)據(jù)驅(qū)動可以作用于整個企業(yè)的管理和業(yè)務(wù)流程。從而降低企業(yè)的運營成本、提高工作效率、增強科學(xué)決策能力。
6月17日DoraHacks聚集了70名來自全國各地的Hacker、數(shù)據(jù)高手、AI大咖、最有創(chuàng)業(yè)產(chǎn)品經(jīng)理、行業(yè)專家,涉及金融機(jī)構(gòu),銀行,保險,地產(chǎn),消費及各行業(yè)。在24小時內(nèi),Hacker們現(xiàn)場組隊,解決行業(yè)中的數(shù)據(jù)問題,將數(shù)據(jù)類的創(chuàng)意落地為產(chǎn)品。
本屆比賽冠軍陳曦說,這是他第二次參賽,感覺和去年參賽時大不相同。他認(rèn)為過去的兩次Hackthon,單從主題上講區(qū)別就很大,第一次的主題是 Fintech Hackthon, 強調(diào)的是技術(shù)在金融領(lǐng)域的運用;第二次的主題是 Data Hackthon, 強調(diào)的是數(shù)據(jù)技能以及項目快速落地的想法。
陳曦認(rèn)為,兩次參賽經(jīng)歷對他自己來說也是一個認(rèn)知升級的過程。陳曦和他的團(tuán)隊第一次參賽時,工作量很大,干的非常辛苦,但偏題較遠(yuǎn)。結(jié)果最后導(dǎo)致背景不符,選題太大,思路不清,炫耀苦工,沒能做出來真正解決重要問題的產(chǎn)品。
而第二次參加比賽,陳曦吸取了第一次參賽的教訓(xùn),他總結(jié)的成功經(jīng)驗還是四句話:背景相符,選題要小,思路清晰,強調(diào)可行,直戳用戶痛點,解決重要問題。當(dāng)然,除了加強自己技術(shù)的同時,陳曦還補齊了一位相關(guān)行業(yè)背景的商業(yè)分析師,最終在實戰(zhàn)操作中層層深入,直擊痛點,做到了用20%的時間解決了80%的問題。
中科院地理信息博士姚曉婧是第一次參賽,她認(rèn)為,現(xiàn)在是數(shù)據(jù)爆炸的時代,手機(jī)基本實現(xiàn)了全覆蓋,人的行為和發(fā)生行為的位置、時間都為數(shù)據(jù)科學(xué)家和相關(guān)研究人員分析規(guī)模性行為趨勢和預(yù)測提供了很好的數(shù)據(jù)基礎(chǔ)。
地理信息科學(xué)可以將與位置相關(guān)的人類活動進(jìn)行記錄、分析和科學(xué)表達(dá),可以滲透到金融、房產(chǎn)、消費、安防等很多領(lǐng)域。
曉婧看到,這次DoraHacks的比賽,有團(tuán)隊通過輿情分析來做投資股票交易策略。她當(dāng)時就想到,如果這個預(yù)測模型能夠跟投資者的地域特點結(jié)合起來,能否提高預(yù)測精度?因為人的投資傾向和地理位置是有關(guān)系度的�?茖W(xué)論證表明,人的活動百分之八十以上都和位置相關(guān)。地理信息科學(xué)加入Fintech是一個趨勢,大有可為。
曉婧團(tuán)隊關(guān)于房產(chǎn)金融的項目是在現(xiàn)場組隊的,吸引了三個來自京東產(chǎn)品、日立研發(fā)部和紐約大學(xué)的小伙伴,大家24小時高強度的工作讓房產(chǎn)這個點子更加豐滿,24小時的相處讓大家結(jié)下了深厚的革命友誼。努力沒有白費,最終拿到了二等獎,閉幕式后也得到不少企業(yè)拋來的橄欖枝,這堅定了大家繼續(xù)深度實踐這一想法的信心。
Hackathon的魅力在哪里?深陷工作和學(xué)習(xí)中的Hacker們有著無盡的創(chuàng)意,卻常常沒有時間和團(tuán)隊去實現(xiàn),一個想法的實現(xiàn)依靠單一的技能很難達(dá)到,Hackathon為大家提供了24小時密集創(chuàng)意、開發(fā)的時間,聚集了來自各個領(lǐng)域最有激情、技術(shù)頂級的Hacker們, 自由結(jié)組,讓曾經(jīng)的創(chuàng)意落地為實實在在可以解決重要問題的產(chǎn)品。 喝著啤酒,碰撞著思想,一起戰(zhàn)斗!
以下為本次活動中優(yōu)秀項目介紹:
FinGoGo 店鋪情報系統(tǒng)
使用電商店鋪信息,商品信息和評論信息的數(shù)據(jù),配合情感分析算法,為淘寶店鋪提供店鋪畫像,制作了店鋪信息系統(tǒng)的原型,并且為在場的觀眾提供了產(chǎn)品原型的鏈接。
FinGoGo的店鋪畫像產(chǎn)品可以為店鋪的服務(wù)進(jìn)行總體打分,并且對關(guān)鍵要素進(jìn)行分解,例如物流服務(wù),客服服務(wù),退貨滿意度等。產(chǎn)品可以比較同行業(yè)的不同店鋪的服務(wù)質(zhì)量,以及比較行業(yè)服務(wù)滿意度均值。
樂租app(GeoGeeks)
在中國的一線城市有超過70%的年輕人處于租房狀態(tài),因此中科院的樂租團(tuán)隊制作了樂租app,通過已經(jīng)獲取的衛(wèi)星遙感數(shù)據(jù),建立居住社區(qū)綜合評價體系。
GeoGeeks使用了出租車和地鐵等交通數(shù)據(jù),植被,水體情況的遙感數(shù)據(jù),以及POI興趣點數(shù)據(jù),建立了垃圾堆深度學(xué)習(xí)目標(biāo)檢測Faster-RCNN,環(huán)境數(shù)據(jù)模型等,對社區(qū)進(jìn)行多維全面的評估。樂租的app將評估的結(jié)果轉(zhuǎn)化成用戶能夠理解的內(nèi)容,綜合評價社區(qū)。
事件沖擊的FTP曲線預(yù)測(成府班客)
成府班客是來自成府路的Banker團(tuán)隊,他們的項目是解決銀行內(nèi)部資金轉(zhuǎn)移價格(FTP)曲線當(dāng)前面臨的問題: 對原始數(shù)據(jù)處理過于粗糙,且模型想對靜態(tài),不能及時反映市場的最新變動。成府班客設(shè)計的FTP曲線預(yù)測系統(tǒng)在構(gòu)建基礎(chǔ)母線的基礎(chǔ)上,考慮事件沖擊和企業(yè)信用溢價,實現(xiàn)更準(zhǔn)確的FTP曲線預(yù)測。
除了獲獎的前三名項目賽艇隊和CPI的項目也獲得了現(xiàn)場觀眾的一致好評。
以太坊ENS域名智能競價系統(tǒng)(賽艇隊 Exciting)
ENS是建立在以太坊區(qū)塊鏈上的分布式命名系統(tǒng),主要由注冊表,解析器,和注冊服務(wù)組成。注冊服務(wù)(Registrars)是在 ENS 中擁有名稱并可根據(jù)規(guī)則分配子域的智能合約。它使 用拍賣系統(tǒng)分配名稱的.eth子域名,并反向解析以太坊地址,可用于綁定收款賬號, Dapps以及智能合約,使其更易被大眾記住。
域名購買采用拍賣的方式,取第二高價格成交。
賽艇隊通過API收集歷史交易數(shù)據(jù),包括新開啟的域名,開啟人以及投注風(fēng)金額,還有揭標(biāo)金額與域名,并通過分詞確定域名特性。賽艇隊制作的系統(tǒng)有三個功能: 1. 輸入域名,判斷是否被注冊 2. 判斷域名是否手動開啟,展示手動開啟投注金額 3. 分析域名特征,展示具有相同特征的域名歷史競價特性,推薦該域名的三個最佳競標(biāo)金額及相應(yīng)中標(biāo)概率
這個系統(tǒng)有很明確的應(yīng)用場景,例如提供API接口,批量估計域名競標(biāo)價,以及通過腳本進(jìn)行競標(biāo),優(yōu)化資金競標(biāo)效率等。
金融資訊數(shù)據(jù)的結(jié)構(gòu)化解讀-情感分析(少帥隊)
少帥隊現(xiàn)場提取了股吧3200支股票的86萬余條評論,抽取其中5萬條建立了字典數(shù)據(jù)集,標(biāo)注了數(shù)千條樣本數(shù)據(jù)。產(chǎn)品對任何輸入的句子進(jìn)行分詞和句向量提取后,通過一個情感分析的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)(RNN),輸出情感分析的結(jié)果,在驗證集中準(zhǔn)確率超過80%。
網(wǎng)絡(luò)大數(shù)據(jù)CPI測算 (CPI隊)
傳統(tǒng)CPI測算的有專業(yè)訓(xùn)練人員線下采訪成本高,權(quán)重固定,隨機(jī)采樣,計算簡單,數(shù)據(jù)滯后等問題,而且沒有考慮網(wǎng)絡(luò)零售交易。CPI團(tuán)隊從國家統(tǒng)計局分類出發(fā),選取網(wǎng)絡(luò)數(shù)據(jù)源,進(jìn)行三級分類,根據(jù)交易額對各類指標(biāo)設(shè)置權(quán)重,使用加權(quán)平均的方法計算CPI。
CPI團(tuán)隊計算使用的數(shù)據(jù)源包含網(wǎng)絡(luò)零售數(shù)據(jù),搜索數(shù)據(jù),出租房掛牌數(shù)據(jù),出行和旅行數(shù)據(jù),藥品交易數(shù)據(jù)等。這種方法考慮的數(shù)據(jù)量級比傳統(tǒng)方法大很多,并且數(shù)據(jù)實時更新,權(quán)重可以動態(tài)調(diào)整,最終還降低統(tǒng)計成本。
調(diào)整權(quán)重: 根據(jù)交易額的變化,固定大類,優(yōu)化細(xì)分類別
CPI團(tuán)隊將在一段時間內(nèi)部署系統(tǒng)進(jìn)行連續(xù)測算,并且與央行發(fā)布數(shù)據(jù)進(jìn)行比較,兩者形成互補。
關(guān)于DoraHacks
DoraHacks 在清華大學(xué)貓頭鷹實驗室的指導(dǎo)和幫助下,由世界著名的各個極客組織成員發(fā)起創(chuàng)立的hacker組織,DoraHacks的使命是連接全世界的hacker,解決重要而迫切的問題
DoraHacks長期持續(xù)地組織Hackathon、技術(shù)演講與各種科技交流活動,旨在創(chuàng)造優(yōu)秀而美好的科技產(chǎn)品,普及最新的科學(xué)和技術(shù),傳播Hacker的生活方式并促進(jìn)新科技向社會應(yīng)用的轉(zhuǎn)化。
DoraHacks已經(jīng)在清華、北大、北航、上交等高校成功舉辦了多場Hackathon,同時與出門問問、APUS、XCOR等公司合作,為各行業(yè)提供跨界交流的機(jī)會。此外,DoraHacks已經(jīng)成功上線了多個跨界活動方案,包括12 場創(chuàng)意風(fēng)暴、20場 DoraSpeaker、36場科技分享活動,并將Google Solve for X首次引入中國。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...