大數(shù)據(jù)正在以不可阻攔的磅礴氣勢,與當(dāng)代同樣具有革命意義的*科技進(jìn)步 (如納米技術(shù)、生物工程、全球化等)一起,揭開人類新世紀(jì)的序幕。大數(shù)據(jù)宣告了21世紀(jì)是人類自主發(fā)展的時代,是不以所謂上帝的意志為轉(zhuǎn)移的時代,是上帝失業(yè)的時代。大數(shù)據(jù)對每個人的重要性不亞于人類初期對火的使用。大數(shù)據(jù)讓人類對一切事物的認(rèn)識回歸本源;大數(shù)據(jù)通過影響經(jīng)濟(jì)生活、政治博弈、社會管理、文化教育科研、醫(yī)療保健休閑等等行業(yè),與每個人產(chǎn)生密切的聯(lián)系。以下是小編為你整理的大數(shù)據(jù)該學(xué)什么 ?
大數(shù)據(jù)技術(shù)滲透進(jìn)入我們每個人的日常生活消費之中,它提供了光怪陸離的全媒體,難以琢磨的云計算,無法抵御的仿真環(huán)境。大數(shù)據(jù)依仗于無處不在的傳感器,通過大數(shù)據(jù)技術(shù),人們能夠在醫(yī)院之外得悉自己的健康情況;而通過收集普通家庭的能耗數(shù)據(jù),大數(shù)據(jù)技術(shù)給出人們切實可用的節(jié)能提醒;通過對城市交通的數(shù)據(jù)收集處理,大數(shù)據(jù)技術(shù)能夠?qū)崿F(xiàn)城市交通的優(yōu)化。 ?
隨著科學(xué)技術(shù)的發(fā)展,人類必將實現(xiàn)數(shù)千年的機(jī)器人夢想。事實上,今天人們已經(jīng)享受到了部分家用智能機(jī)器人給生活帶來的便利。比如,智能吸塵器以及廣泛應(yīng)用于汽車工業(yè)領(lǐng)域的機(jī)器手等等。目前,科學(xué)家研發(fā)出的智能微型計算機(jī)只和雪花一樣大,卻能夠執(zhí)行復(fù)雜的計算任務(wù),將來可以把這些微型計算機(jī)安裝在任何物件上用以監(jiān)測環(huán)境和發(fā)號施令。
?
在大數(shù)據(jù)時代,人腦信息轉(zhuǎn)換為電腦信息成為可能。科學(xué)家們通過各種途徑模擬人腦,試圖解密人腦活動,最終用電腦代替人腦發(fā)出指令。正如今天人們可以從電腦上下載所需的知識和技能一樣,將來也可以實現(xiàn)人腦中的信息直接轉(zhuǎn)換為電腦中的圖片和文字,用電腦施展讀心術(shù)。 ?
隨著大數(shù)據(jù)時代的到來和技術(shù)的發(fā)展,我們必將進(jìn)入神奇的智能機(jī)器人時代。 ?
大數(shù)據(jù)技術(shù)的發(fā)展有可能解開宇宙起源的奧秘。因為,計算機(jī)技術(shù)將一切信息無論是有與無、正與負(fù),都?xì)w結(jié)為0與1,原來一切存在都在于數(shù)的排列組合,在于大數(shù)據(jù)。 ?
驗證借款人身份 ?
驗證借款人身份的五因素認(rèn)證是姓名、手機(jī)號、身份證號、銀行卡號、家庭地址。企業(yè)可以借助國政通的數(shù)據(jù)來驗證姓名、身份證號,借助銀聯(lián)數(shù)據(jù)來驗證銀行卡號和姓名,利用運(yùn)營商數(shù)據(jù)來驗證手機(jī)號、姓名、身份證號、家庭住址。 ?
如果借款人是欺詐用戶,這五個信息都可以買到。這個時候就需要進(jìn)行人臉識別了,人臉識別等原理是調(diào)用國政通/公安局 API接口,將申請人實時拍攝的照片/視頻同客戶預(yù)留在公安的身份證進(jìn)行識別,通過人臉識別技術(shù)驗證申請人是否是借款人本人。
?
其他的驗證客戶的方式包括讓客戶出示其他銀行的信用卡及刷卡記錄,或者驗證客戶的學(xué)歷證書和身份認(rèn)證。 ?
分析提交的信息來識別欺詐 ?
大部分的貸款申請都從線下移到了線上,特別是在互聯(lián)網(wǎng)金融領(lǐng)域,消費貸和學(xué)生貸都是以線上申請為主的。 ?
線上申請時,申請人會按照貸款公司的要求填寫多維度信息例如戶籍地址,居住地址,工作單位,單位電話,單位名稱等。如果是欺詐用戶,其填寫的信息往 往會出現(xiàn)一些規(guī)律,企業(yè)可根據(jù)異常填寫記錄來識別欺詐。例如填寫不同城市居住小區(qū)名字相同、填寫的不同城市,不同單位的電話相同、不同單位的地址街道相 同、單位名稱相同、甚至居住的樓層和號碼都相同。還有一些填寫假的小區(qū)、地址和單位名稱以及電話等。 ?
如果企業(yè)發(fā)現(xiàn)一些重復(fù)的信息和電話號碼,申請人欺詐的可能性就會很高。 ?
Hadoop和Hive
一群基于Java的工具被開發(fā)出來以滿足數(shù)據(jù)處理的巨大需求。Hadoop作為*的基于Java的框架用于批處理數(shù)據(jù)已經(jīng)點燃了大家的熱情。Hadoop比其他一些處理工具慢,但它出奇的準(zhǔn)確,因此被廣泛用于后端分析。它和Hive——一個基于查詢并且運(yùn)行在頂部的框架可以很好地結(jié)對工作。 ?
Scala
Scala是另一種基于Java的語言,并且和Java相同的是,它正日益成為大規(guī)模機(jī)器學(xué)習(xí),或構(gòu)建高層次算法的工具。它富有表現(xiàn)力,并且還能夠構(gòu)建健壯的系統(tǒng)。 ?
“Java就像是建造時的鋼鐵,而Scala則像黏土,因為你之后可以將之放入窯內(nèi)轉(zhuǎn)變成鋼鐵,”Driscoll說。 ?
Kafka和Storm
那么,當(dāng)你需要快速實時的分析時又該怎么辦呢?Kafka會成為你的好朋友。它大概5年前就已經(jīng)出現(xiàn)了,但是直到最近才成為流處理的流行框架。 ?
Kafka,誕生于LinkedIn內(nèi)部,是一個超快速的查詢消息系統(tǒng)。Kafka的缺點?好吧,它太快了。在實時操作時會導(dǎo)致自身出錯,并且偶爾地會遺漏東西。 ?
“有精度和速度之間有一個權(quán)衡,”Driscoll說, “因此,硅谷所有的大型高科技公司都會使用兩條管道:Kafka或Storm用于實時處理,然后Hadoop用于批處理系統(tǒng),此時雖然是緩慢的但超級準(zhǔn)確?!? ?
Storm是用Scala編寫的另一個框架,它在硅谷中因為流處理而受到了大量的青睞。它被Twitter納入其中,勿庸置疑的,這樣一來,Twitter就能在快速事件處理中得到巨大的裨益。