行業新聞
聚類成大數據認知突破口

  大數據作為網絡時代的一種客觀存在,是網絡時代人類社會的重要資產,盡管目前對于大數據的認知存在挑戰,但聚類將會成為大數據認知的突破口。
  大數據聚類將成行業核心競爭力
  大數據標志著一個新時代的到來,這個時代的特征不只是追求豐富的物質資源,也不只是無所不在的互聯網帶來的方便的多樣化信息服務,同時還包含區別于物質的數據資源的價值發現和價值轉換,以及由大數據帶來的精神和文化方面的嶄新現象。
  大數據來源于人類的測量、記錄和分析世界的渴望和無盡的追求。隨著信息技術,尤其是傳感器、通信、計算機和互聯網技術的迅猛發展和廣泛應用,人類獲取數據的手段越來越多,速度大大加快、成本急劇降低,層次和尺度更為精細,揭示自然現象和社會現象更加深刻,人聯網和物聯網又使得人人物物都成為數據源,這樣一來,大數據成為網絡時代人類社會的重要資產。
  大數據本身既不是科學,也不是技術。它反映的是網絡時代的一種客觀存在,各行各業的大數據,規模從TB到PB到EB到ZB,都是以三個數量級的階梯迅速增長,是用傳統工具難以認知的,具有更大挑戰。
  “物以類聚,人以群分”,這是人類幾千年來認識世界和社會的基本能力,是從大數據中發現價值必須面對的一個普遍性、基礎性問題,是認知科學作為“學科的學科”要解決的首要問題。無論是政治、經濟、文學、歷史、社會、文化、還是數理、化工、醫農、交通、地理、各行各業的大數據或宏觀或微觀的任何價值發現,無不借助于大數據聚類分析的結果,因此,數據分析和挖掘的首要問題是聚類,這種聚類是跨學科、跨領域、跨媒體的。大數據聚類是數據密集型科學的基礎性、普遍性問題。
  以汽車保險為例,作為一個很傳統的行業,保險是基于概念評估的生意,保險公司對車險客戶是這樣聚類的:A類連續兩年沒有出車禍的,B類最近一年沒有出車禍的,C類過去一年出了一次車禍的,D類過去一年出了兩此及以上車禍的,要做到這樣的聚類,保險公司就要獲得客戶的相關數據。
  物聯網時代,當汽車成為輪式機器人,成為大數據發生器以后,就是一個大數據發生體。每一次駕駛,每一次維修,每一次行駛,甚至每一次剎車,都會記錄在案,利用大數據聚類,保險公司可對一個車況好、駕駛習慣好、常走線路事故率低,不勤開車的特定客戶,給予更大的優惠,而對風險太高的客戶報高價甚至拒絕。總之根據大數據聚類保險公司能夠給出包括保險費支付方式在內的個性化解決方案,這就顛覆了保險公司的傳統商業模式。我認為將來大數據聚類成為很多行業的核心競爭力。
  大數據對形式化方法的挑戰是非常嚴峻的,在數據密集型的網絡時代,任何傳統學科或者傳統的行業,其公理、原理和定理組成的語境,遇到互聯網+的挑戰之后,都將成為一個大數據、小模型、小定律、交叉學科的時代,模型和程序要圍繞數據。
  創新也會相應的發生變化,應該是創造一個新的語境、新的坐標系,在這個坐標系下研究大數據,否則難以有新的發現。
  實踐中的研究也要由下而上地深入,數據要勝過程序,價值要勝過知識,關聯要勝過因果,要更多地關注有意義的小眾,把這些小眾累積起來才成為大眾。
  通過大數據聚類即時發現價值,還要充分認識大數據中的不確定性和價值的隱蔽性。

  機器人是大數據認知的典型代表
  智能機器人是集新材料、新工藝、新能源、機械、電子、移動通信、全球定位導航、移動互聯網、云計算、大數據、自動化、人工智能、認知科學乃至人文藝術等多個學科、多種技術于一身的人造精靈,是人聯網、物聯網不可或缺的端設備,是人類社會走向智慧生活的重要伴侶。
  機器人既是使用大數據也產生大數據,既是大數據的產物也是大數據的推動者,機器人是大數據的認知的典型代表。而在目前,無論是搬運、碼垛、研磨、拋光、挖掘等灰頭土臉的工業機器人還是微電子產品生產線上精細靈巧大的機器人,機器人在我們的生產生活中已經隨處可見。
  機器人革命是世界性的、時代性的,機器人替換的首先不是理發師之類的勞動者,而可能是產業工人、文秘人員、醫生、服務員、甚至士兵,他們將升級轉型成為機器人的創造者和使用者,成為懂得集成、維修、管理機器人的專業人才。跨界滲透和跨界創新誕生的智能制造也將是我國抓住歷史機遇的又一次崛起。
  此外,機器人還將進一步刮起“穿戴風”。蘋果推出了自己的手表,并發表了5個有關醫療的App,啟動全新醫療應用。試想如果有一天手機或手表將會成為醫療診斷的工具,用于慢性管理的醫患視頻互動平臺,醫療互聯網個人健康與醫療的數據發生器,這將是遠程診療的開始,并繼而成為某種流行病的社會調查,成為病友社交網絡,甚至會顛覆傳統看病模式,顛覆傳統醫學研究。
  同時我們也可以期待未來的生物機器人,如果器官移植越來越發達,那么“移花接木”就屢見不鮮。改造人類胚胎DNA,會不會避免遺傳性疾病?如果將人的思維移植到機器人,那么思想是不是不朽的呢……
  人腦是很復雜的,科學界現在正把腦科學和認知科學作為當前的重大研究領域,我們也在熱切期待生物腦的出現。
  當然認知科學不僅是研究生物腦的自然屬性,社會屬性研究也很重要。我們各種高端生物都會有語言、文字,有了文字,才會有文明。因此我們要研究腦認知的后天屬性,研究腦發育、可塑性與自然環境的關系,認知也是后天學習和積累的結果,是與社會環境、社會實踐、群體交互等密切相關的,要建立人腦認知的成長機制:如何創建神經元之間新的連接和新的認知。
  人的智能除了記憶之外,在學習和思維上,概括地說有兩點:一個是邏輯思維,一個是形象思維,形象思維最主要的是類比和聯想。
  從我的技術觀點來看,如果人腦的認知能力不能夠全部、完整、統一地形式化,那么我們可以在特定的情境下使認知能力局部形式化,如算術運算、簡單游戲、博弈、定點開車等。
  在未來,我還想做一個機器駕駛腦,這個駕駛腦主要涵蓋了人腦關于駕駛行為的主要功能,長期記憶、短期記憶,還有瞬間記憶,就是感覺記憶,從感知到認知,到行動。
  目前,中國腦計劃馬上要啟動了,我個人認為是要將各項研究同步進行,用大數據來認識腦袋、保護腦、模擬腦。

聚发彩票注册 利来彩票注册 湖北快3 英豪彩票注册 河北11选5开奖 什么网赚最容易 聚沙彩票注册 四肖三期必開 安徽快3走势 介绍下靠谱的网赚项目