大數(shù)據(jù)時代讀書心得大全(16篇)

格式:DOC 上傳日期:2023-12-12 16:01:03
大數(shù)據(jù)時代讀書心得大全(16篇)
時間:2023-12-12 16:01:03     小編:雅蕊

教育是培養(yǎng)人才的基礎,對一個國家的發(fā)展至關重要。如何提升自己的領導力,成為一個優(yōu)秀的領導者?了解他人的總結經(jīng)驗,可以幫助我們更好地進行自我總結。

大數(shù)據(jù)時代讀書心得篇一

大數(shù)據(jù)時代成為炙手可熱的話題。筆者在這說明信息和數(shù)據(jù),只是試圖首先說明信息、數(shù)據(jù)的關系和不同,也試圖說明,為什么信息時代轉變?yōu)榱舜髷?shù)據(jù)時代?大數(shù)據(jù)時代帶給了我們什么?下面是本站小編為大家收集整理的大數(shù)據(jù)時代。

歡迎大家閱讀。

這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運作上的應用,以及它對現(xiàn)代商業(yè)運作的影響。

《大數(shù)據(jù)時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對現(xiàn)象的解剖提出對這一現(xiàn)象的解釋。然后在通過解釋在對未來進行預測,并對未來可能出現(xiàn)的問題提出自己看法與對策。

下面來重點介紹《大數(shù)據(jù)時代》這本書的主要內容。

《大數(shù)據(jù)時代》開篇就講了google通過人們在搜索引擎上搜索關鍵字留下的數(shù)據(jù)提前成功的預測了20xx年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關的數(shù)據(jù)。同時google的預測與政府數(shù)據(jù)的相關性高達97%,這也就意味著google預測數(shù)據(jù)的置信區(qū)間為3%,這個數(shù)字遠遠小于傳統(tǒng)統(tǒng)計學上的常規(guī)置信區(qū)間5%!而這個數(shù)字就是大數(shù)據(jù)時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時代“樣本=總體”的思想。我們都知道當樣本無限趨近于總體的時候,通過計算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質。而之前采取的“樣本總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數(shù)據(jù)的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯(lián)網(wǎng)終端與計算機的出現(xiàn)使數(shù)據(jù)的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數(shù)據(jù)時代的主流,同時大數(shù)據(jù)時代本身也是建立在大批量數(shù)據(jù)的存儲與處理的基礎之上的。

接下來,維克多又通過了ibm追求高精確性的電腦翻譯計劃的失敗與google只是將所有出現(xiàn)過的相應的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系google詞庫就會出現(xiàn)翻譯,雖然有的時候的翻譯很無厘頭,但是大多數(shù)時候還是正確的,所以google的電腦翻譯的計劃的成功,表明大數(shù)據(jù)時代對準確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時代是建立在大數(shù)據(jù)的基礎住上的,所以大數(shù)據(jù)時代追求的是全方位覆蓋的數(shù)字測度而不管其準確性到底有多高,因為大量的數(shù)據(jù)會湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時大量的數(shù)據(jù)也會無限的逼近事物的原貌。

之后,維克托又預測了一個在大數(shù)據(jù)時代催生的重要職業(yè)——數(shù)據(jù)科學家,這是一群數(shù)學家、統(tǒng)計學與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個人隱私在大數(shù)據(jù)時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用數(shù)據(jù),是否侵犯了個人隱私。

無論如何,大數(shù)據(jù)時代將會到來,不管我們接受還是不接受!

我覺得《大數(shù)據(jù)時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),比如你在相關的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學家”們利用,從而再將相關數(shù)據(jù)賣給各大網(wǎng)店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網(wǎng)上留下的痕跡。

我喜歡這本書是因為它給我展現(xiàn)了一個新的世界。

讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。

“在小數(shù)據(jù)時代,我們會假象世界是怎樣運作的,然后通過收集和分析數(shù)據(jù)來驗證這種假想?!薄半S著由假想時代到數(shù)據(jù)時代的過渡,我們也很可能認為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y(tǒng)計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經(jīng)脫離實際”來“終結”量子力學。對此我很高興,因為統(tǒng)計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。

近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領域里隱含的固有偏見”,跟作者一起先把統(tǒng)計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。

當我們人類的數(shù)據(jù)收集和處理能力達到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調查為基礎的統(tǒng)計學了。但是由統(tǒng)計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!

《大數(shù)據(jù)時代》第16頁“大數(shù)據(jù)的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關系規(guī)則。兩者似乎是做同一件事。可大數(shù)據(jù)要的“不是因果關系,而是相關關系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。

可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。

其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那么大數(shù)據(jù)會不會通過正視混雜性,放棄因果關系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區(qū)別在于人有邏輯思維而機器沒有?!洞髷?shù)據(jù)時代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現(xiàn)科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現(xiàn)在就趁早跳樓。

還好我知道自己對什么統(tǒng)計學、量子力學、邏輯學和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。

所以想向《大數(shù)據(jù)時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數(shù)據(jù)時代的邏輯思維。

在《大數(shù)據(jù)時代》一書中,大數(shù)據(jù)時代與小數(shù)據(jù)時代的區(qū)別:1、思維慣例。大數(shù)據(jù)時代區(qū)別與轉變就是,放棄對因果關系的渴求,而取而代之關注相關關系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質區(qū)別。數(shù)據(jù)的更多、更雜,導致應用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅動過去來預測未來。筆者認為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關,而與數(shù)據(jù)的解讀者有關,而相關關系更有利于預測未來。3、結構。大數(shù)據(jù)更多的體現(xiàn)在海量非結構化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實齊頭并進,理論來創(chuàng)立處理非結構化數(shù)據(jù)的方法,處理結果與未來進行驗證。4、分析基礎。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質變的過程。筆者認為,小數(shù)據(jù)時代也即是信息時代,是大數(shù)據(jù)時代的前提,大數(shù)據(jù)時代是升華和進化,本質是相輔相成,而并非相離互斥。

數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質??蛻魯?shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機遇和挑戰(zhàn)也隨之而來,適應變革,適者生存。我們可以有更廣闊的業(yè)務發(fā)展空間、可以有更精準的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力??可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實現(xiàn)“數(shù)據(jù)應用”才能擁抱“大數(shù)據(jù)”時代,從數(shù)據(jù)中攫取價值,笑看風云變換,穩(wěn)健贏取未來。

大數(shù)據(jù)時代讀書心得篇二

“大數(shù)據(jù)”概念早在1980年就有國外的學者提出,可是最近幾年才廣泛受到大家的關注。當“大數(shù)據(jù)”這個概念傳到中國的時候,瞬間引起了轟動。隨即,各種有關“大數(shù)據(jù)”的資料和書籍充斥的我們的視野。隨意打開某個電子商務平臺圖書類頁面,在搜索框中搜索“大數(shù)據(jù)”三個字,就會出現(xiàn)好多本有關“大數(shù)據(jù)”的書籍??墒牵幸粋€很有趣的現(xiàn)象就是:幾乎所有的平臺上,出現(xiàn)的第一本關于“大數(shù)據(jù)”的書籍一定是《大數(shù)據(jù)時代》。一點進去,這本書推薦欄里的第一句話就是:迄今為止全世界最好的一本大數(shù)據(jù)專著。同時,為這本書做推薦的都是各行業(yè)的精英領袖。所有“大數(shù)據(jù)”方面的書籍也是這本書銷量最高,評價最好。

我從來不會因為哪本書暢銷和很多人推薦就盲目跟風的去看一本書。因為我知道通常在這種情況下選擇一本書,整個閱讀的體會和感受是無法遵從自己的內心的,整個過程都很容易夾雜著別人對這本書的感受。所以通常我讀書的節(jié)奏大多都是跟不上“潮流”的,但往往經(jīng)過風雨洗禮之后沉淀下來的都是精華。坦白講,閱讀這本書的初衷并不是因為我想從書中獲取到多少大數(shù)據(jù)方面的精華,只是很想知道對于這么一個很直白的名詞,作者是怎么寫出這么厚的一本書的。這種初衷或許很無知和幼稚,可就是這種“愚蠢”的好奇心,讓我更透徹的看到書中的精華。

在看《大數(shù)據(jù)時代》這本書之前,我的所有讀后感都是集中在書籍給了我什么思考。對于這本書的讀后感,除了觀點碰撞之外,我還會加上大部分個人看這本書的體會。因為這本書,已經(jīng)完全讓我模糊了大多數(shù)人口中的“全世界最好的書”是一種什么標準。也許《大數(shù)據(jù)時代》真的無法承載那么高的贊美!

大數(shù)據(jù)時代的入門書。

看完這本書,我隨意調查了一些閱讀過這本書并且給這本書絕對好評的朋友。詢問他們這本書好在哪里?大多數(shù)的回答是說《大數(shù)據(jù)時代》這本書讓對大數(shù)據(jù)一無所知的他們了解了大數(shù)據(jù)這個概念,同時通過很多案例說明原來大數(shù)據(jù)能有這么大的用處,影響會有這么大!僅此而已。我看完這本書最大的感受是這本書分為上、下兩部分。前120多頁為上部分,后120多頁為下部分。之所以說《大數(shù)據(jù)時代》是一本關于大數(shù)據(jù)的入門書,是因為這本書用了前面120多頁的篇幅反復的強調大數(shù)據(jù)的出現(xiàn)對社會發(fā)展影響很大,并且要人們轉變小數(shù)據(jù)時代慣有的思想。所以整本書的前半部分就強調大數(shù)據(jù)時代的三個轉變:1、大數(shù)據(jù)利用所有的數(shù)據(jù),而不再僅僅依靠一小部分數(shù)據(jù),不再依賴于隨機采樣。2、大數(shù)據(jù)數(shù)據(jù)多,不再熱衷于追求精確性,也不再期待精確性。3、大數(shù)據(jù)時代不再熱衷于尋找因果關系,而是追求相關關系。所以整個上半部分沒什么可詳說的。我們重點聊聊本書的后半部分。

既然一直都在強調大數(shù)據(jù)對我們的意義,總要有具體體現(xiàn)。整本書中,我感觸最大的一個案例就是某公司通過分析大數(shù)據(jù)發(fā)現(xiàn):新品發(fā)布的時候,舊一代的產(chǎn)品可能會出現(xiàn)短暫的價格上漲。因為人們在心理上就認為新產(chǎn)品的推出,舊產(chǎn)品就會便宜,從而就會提高購買量。這個發(fā)現(xiàn)和我們平常的心理是完全違背的,而且如果不用數(shù)據(jù)來證明,直接講道理給大家可能還是無法相信。這就是大數(shù)據(jù)對我們很多傳統(tǒng)思維的顛覆。一旦涉及到思維的改變,往往就會引起整個社會的大變動。

大數(shù)據(jù)這個概念的出現(xiàn),讓大數(shù)據(jù)逐漸發(fā)展形成一條價值鏈。在這條價值鏈上,數(shù)據(jù)本身、技能和思維是最重要的環(huán)節(jié)。隨著互聯(lián)網(wǎng)技術的發(fā)展,越來越多的公司都能收集到大量的數(shù)據(jù),這些數(shù)據(jù)也會越來越公開。可是在這些公司中,不是所有的公司都有從數(shù)據(jù)中提取價值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。于是就會出現(xiàn)以下兩種公司,一種是掌握了專業(yè)技能但不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)新性用途才能的公司,另一種就是擁有超前思維,懂得怎樣挖掘數(shù)據(jù)的新價值的創(chuàng)新公司。短時間內,我們可能會感覺擁有創(chuàng)新思維,懂得挖掘出數(shù)據(jù)新價值的大數(shù)據(jù)思維是最重要的??墒堑鹊疆a(chǎn)業(yè)成熟之后,所有人都知曉了大數(shù)據(jù)的意義,所有人便開始挖掘自己的大數(shù)據(jù)思維。同時,隨著科技的進步,掌握大數(shù)據(jù)技術的也將成為常態(tài)。所以到后來,整個價值鏈的核心環(huán)節(jié)還是回到了數(shù)據(jù)本身。而到那時候,大數(shù)據(jù)的公開性也就越來越小。

在大談完大數(shù)據(jù)對人類發(fā)展的積極意義之后,作者也考慮到大數(shù)據(jù)時代的風險。這一部分是作者腦洞大開的精彩之處,同時也是最荒謬的一部分。書中說大數(shù)據(jù)時代將要懲罰未來犯罪,這樣可以在嫌疑人在可能犯罪之前就把犯罪行為給防止。這樣的社會,大數(shù)據(jù)儼然已經(jīng)延伸到了我們每個人生活的點滴。幾乎我們在生活中所做的一切都在大數(shù)據(jù)的“監(jiān)控”之下,我想到那時候,別說我們每個人的隱私已經(jīng)沒有的了,嚴重一點可以說是我們可能連人都不算了。在我們人的社會屬性中,自由權利是一項很重要的指標。通過大數(shù)據(jù)懲罰人的未來犯罪已經(jīng)否定了人的自由選擇能力和人的行為責任自負。同時,由于數(shù)據(jù)是永久保存,大數(shù)據(jù)預測也是通過每個人之前的數(shù)據(jù)來判斷,所以大數(shù)據(jù)同樣也否定了人的求善心理。還有,從現(xiàn)在各種大數(shù)據(jù)預測的結果來看,很多發(fā)言人都說大數(shù)據(jù)不是百分百的準確。所以利用大數(shù)據(jù)來判斷人的行為發(fā)展已經(jīng)違背了大數(shù)據(jù)不追求精確性的特征,這也是書中自相矛盾的地方。

對于一個新事物,如果能讓大家了解這個事物并且對此產(chǎn)生興趣,這已經(jīng)算是一本不錯的入門書了。

從小到大,雞湯對于我們來說一直都挺珍貴的。身體虛弱了,喝點雞湯能夠補充營養(yǎng)。心靈受傷了,看點心靈雞湯可以鼓舞人心??墒墙鼛啄辏藗兩钏教岣吡?,營養(yǎng)富余,雞湯已經(jīng)不是人們補營養(yǎng)的期待了。同樣,心靈雞湯也是如此。

心靈雞湯其實是一個很虛偽的東西。很多人都被心靈雞湯誘人的外表給迷惑。在我看來,心靈雞湯很大的一個特征就是:立人的志,但是就不告訴你實現(xiàn)志的方法。很多人每次在失意的時候就喜歡看心靈雞湯,希望能得到慰藉。看完后也覺得醍醐灌頂,感覺整個世界都亮了。但又有幾個人想過喝完這些雞湯之后你除了看似重拾夢想,你還獲得了什么?你知道怎么去做嗎?《大數(shù)據(jù)時代》就是這樣一本書。整本書從頭到尾都在向讀者講述大數(shù)據(jù)的意義,當然期間也會用相應的案例來證明大數(shù)據(jù)確實有這樣的能力。但是,整本書從沒有涉及到技術層面的問題?;蛟S對于大數(shù)據(jù)這種依靠互聯(lián)網(wǎng)技術的新事物,即使向讀者講技術,也沒有幾個人看得懂,可是整本書沒有一點關于大數(shù)據(jù)思維的技能引導。給出的案例中只有少數(shù)案例向讀者講述了這個公司為什么要利用大數(shù)據(jù)來解決這種問題,大多數(shù)都只是告訴讀者國外某家公司運用大數(shù)據(jù)得出了某種結論。同時,在本書中文譯作者寫的序里,強調自己翻譯這本著作的一大優(yōu)點是可以結合國內的案例來分析書中的理論,結果,看到最后一頁都沒有看到一個國內企業(yè)關于大數(shù)據(jù)運用的案例。

之所以我稱之為“心靈雞湯”,還有一個原因就是作者在書中大講特講的大數(shù)據(jù)的作用,事實上按照現(xiàn)在的經(jīng)濟發(fā)展水平和社會文明發(fā)展程度是很難實現(xiàn)的。書中很多時候的理論都是要建立在社會各項文明都發(fā)展健全的基礎上才能實現(xiàn)。

大數(shù)據(jù)的“傳銷手冊”

看到這個標題,大家可能會覺得我夸大其詞,受到如此多人好評的書怎么是“傳銷手冊”呢?對于這個表達,我只想說兩點:1、此說法僅代表我個人觀點,是否認同是個人問題。2、此說法主要針對本書的上部分。

我們都知道傳銷組織在發(fā)展下線的前期是要花大力氣去培訓的,也就是洗腦。而對于一個陌生又很難以理解的事物,最好的“洗腦”方式就是重復?!洞髷?shù)據(jù)時代》這本書就是運用這種方式,前半部分為了讓讀者能夠接受“大數(shù)據(jù)”這個概念,作者反反復復提醒讀者大數(shù)據(jù)不是隨機采樣、不追求精確和不尋找因果關系。同時用很多看似很通俗易懂其實看完后還是不知道說了什么的案例來讓人信服大數(shù)據(jù)的作用。書中的后半部分雖然也是用這種方式來感染讀者,可后半部分中作者的暢想和對大數(shù)據(jù)的威脅分析還是對讀者有一些實質意義的,所以后半部分的“傳銷”影響就不是很重要。

大數(shù)據(jù)時代是未來的趨勢,這誰都不會否認。大數(shù)據(jù)改造了我們的生活,改變著我們的世界。不管它是以一種什么樣的姿態(tài)面向世界,它都沒有錯,因為大數(shù)據(jù)只是一種工具。但當人類開始質疑甚至恐懼大數(shù)據(jù)的時候,人類就該思考自己是否利用好這個好工具了。

大數(shù)據(jù)時代讀書心得篇三

《大數(shù)據(jù)時代》是英國維克托·邁爾-舍恩伯格教授的著作,這本書也被尊為國外大數(shù)據(jù)研究的先河之作。這本書最大的優(yōu)點就在于作者利用上百個例子來對大數(shù)據(jù)的方方面面做了詳細解說,讓外行也很容易理解。結構上,作者通過大數(shù)據(jù)時代的思維變革、商業(yè)變革和管理變革三個角度依次闡述,條理清晰。

所謂"大數(shù)據(jù)",按作者的說法,就是"所有數(shù)據(jù)"。隨著計算機運算速度和存儲能力的發(fā)展,收集數(shù)據(jù)變得越來越簡單,儲存數(shù)據(jù)的成本越來越低。在過去,由于技術限制,人們做統(tǒng)計時只能收集有限的數(shù)據(jù)做樣本,其中要考慮隨機樣本的選擇,努力減小因樣本問題出現(xiàn)的誤差;統(tǒng)計結果往往不能重復使用,造成數(shù)據(jù)利用率低。而現(xiàn)在則可以做到"樣本=總體"。數(shù)據(jù)的增多帶來不可避免的精確性問題。"小數(shù)據(jù)"時代,一個樣本的錯誤就可以造成對總體估計的失敗,幸運的是,"大數(shù)據(jù)"時代對精確性不再那么要求苛刻——也無法要求太嚴格——數(shù)據(jù)的數(shù)量足以彌補這一缺陷。在對思維變革這一部分的闡述中,最重要也是全書的核心觀點就是大數(shù)據(jù)時代,我們應該從追求"因果關系"的舊思維方式向追求"相關關系"轉變。在我看來,這實際上是通過大數(shù)據(jù)來透視一種事物的發(fā)展趨勢,而很多精確學科領域依然需要探尋"因果關系"解決更有針對性的問題,所以,這局限了這一轉變只能在特定的領域發(fā)生。作者自己也說,"大數(shù)據(jù)的相關性將人們指向了比探討因果關系更有前景的領域。"。

大數(shù)據(jù)時代的數(shù)據(jù)獲取方式是多種多樣,數(shù)據(jù)形式也是千變萬化,任何文字、行為、萬物都可以被數(shù)據(jù)化后用來分析。對這些數(shù)據(jù)的利用,不僅要考慮到其初次使用價值,更要放眼它未來可能的用途以提高數(shù)據(jù)的利用率。當然數(shù)據(jù)并不是無限使用,時效、環(huán)境的變化肯定會對數(shù)據(jù)提出新的要求,所以數(shù)據(jù)的折舊也是應當考慮的。這又引出了對數(shù)據(jù)這一無形資產(chǎn)的估值可能性。對于facebook,twitter這樣的公司來說,數(shù)據(jù)就是他們的核心,如何在資產(chǎn)負債表上給他們一個公正的體現(xiàn)正是我們需要考慮的。

大數(shù)據(jù)時代的價值鏈由三部分構成,我把它們簡化為"生產(chǎn)—分析—使用"三個環(huán)節(jié),這對應書中的三種類型公司:第一種是基于數(shù)據(jù)本身的公司,第二種是基于技能,第三種則是基于思維。在大數(shù)據(jù)早期,技能和思維最有價值,但作者認為,最終,大部分的價值還是必須從數(shù)據(jù)本身來挖掘。這是假定了一個成熟的市場,人人都了解了大數(shù)據(jù)的用途。

對于普通人來說,大數(shù)據(jù)時代最關心的還是隱私問題。不知不覺中,個人的一舉一動都暴露在政府甚至私人企業(yè)之下,還面臨潛在的泄露風險。對此,作者提出了使用者承擔責任的解決辦法,而不是過去那種流于形式的使用授權。大數(shù)據(jù)甚至能預測一個人的犯罪動機,這給監(jiān)管者帶來的難題是,預測一個人要犯罪,懲罰還是不懲罰?在這點上,社會達成"個人僅需對行為而非動機負責"的共識非常重要。

大數(shù)據(jù)時代的風險控制靠的是"算法師",類似會計師一樣的職業(yè),對大數(shù)據(jù)的準確度或有效性進行鑒定。這能在一定程度上防止數(shù)據(jù)濫用的發(fā)生和數(shù)據(jù)獨裁。當今的法律亦需對大數(shù)據(jù)監(jiān)管進行修訂補充。

當代大數(shù)據(jù)發(fā)展主要由科技公司推動,相信在不久的將來更多的傳統(tǒng)領域會意識到大數(shù)據(jù)的重要性。但我們也應該保持清醒,大數(shù)據(jù)并不是萬能藥,對某些領域或環(huán)節(jié),使用大數(shù)據(jù)是一種簡單且實用的選擇;但對某些領域,盲目使用大數(shù)據(jù)只會適得其反。

大數(shù)據(jù)時代讀書心得篇四

讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。

“在小數(shù)據(jù)時代,我們會假象世界是怎樣運作的,然后通過收集和分析數(shù)據(jù)來驗證這種假想。”“隨著由假想時代到數(shù)據(jù)時代的過渡,我們也很可能認為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y(tǒng)計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經(jīng)脫離實際”來“終結”量子力學。對此我很高興,因為統(tǒng)計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。

近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領域里隱含的固有偏見”,跟作者一起先把統(tǒng)計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。

當我們人類的數(shù)據(jù)收集和處理能力達到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調查為基礎的統(tǒng)計學了。但是由統(tǒng)計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!

《大數(shù)據(jù)時代》第16頁“大數(shù)據(jù)的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關系規(guī)則。兩者似乎是做同一件事??纱髷?shù)據(jù)要的“不是因果關系,而是相關關系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。

可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。

其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那么大數(shù)據(jù)會不會通過正視混雜性,放棄因果關系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區(qū)別在于人有邏輯思維而機器沒有?!洞髷?shù)據(jù)時代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現(xiàn)科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現(xiàn)在就趁早跳樓。

還好我知道自己對什么統(tǒng)計學、量子力學、邏輯學和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。

所以想向《大數(shù)據(jù)時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數(shù)據(jù)時代的邏輯思維。

大數(shù)據(jù)時代讀書心得篇五

文中清晰的闡述了大數(shù)據(jù)的基本概念和特點,并列出明確的觀點。不管對于產(chǎn)業(yè)實踐者,還是對于政府和公眾機構,都非常具有價值。作者將本書分為3個部分。第一部分提出了大數(shù)據(jù)時代處理數(shù)據(jù)理念上的三大轉變:抽樣等于全體;要效率不要絕對精確;要相關不要因果;第二部分作者從萬事萬物數(shù)據(jù)化和數(shù)據(jù)交叉復用的巨大價值兩個方面,講述驅動大數(shù)據(jù)戰(zhàn)車在材質和智力方面向前滾動的最根本動力;最后一部分,作者描繪了大數(shù)據(jù)帝國前夜的脆弱和不安,包括產(chǎn)業(yè)生態(tài)環(huán)境、數(shù)據(jù)安全隱私、信息公正公開等問題。

本書觀點擲地有聲,作者觀念高屋建瓴,從很多實例和經(jīng)驗中萃取普適性觀念。例子詳實豐富,囊括了進百個學術和商業(yè)實例。

引言提出了大數(shù)據(jù)將給生活、工作于思維帶來重大的變革。一個例子是20__年h1n1流行病毒背景下谷歌通過檢測檢索詞條,處理了4.5億個不同的數(shù)據(jù)模型,通過預測并與20__年、20__年美國疾控中心記錄的實際流感病例進行對比后,確定了45條檢索詞條組合,并將其用于一個特定的數(shù)學模型后,預測的結果與官方數(shù)據(jù)的相關系數(shù)高達97%。按照傳統(tǒng)的信息返回流程,通告新流感病毒病例將有一到兩周的延遲。對于飛速傳播的疾病,信息滯后兩周是致命的。而谷歌運用大數(shù)據(jù)技術,以前所未有的方式,通過海量數(shù)據(jù)分析得出流感所傳播的范圍,為世界預測流感提供了一種更快捷的預測工具。此外,我聯(lián)想到原淘寶董事長馬云通過大量數(shù)據(jù)分析得出20__年經(jīng)濟疲弱,為其商家提前做好迎接經(jīng)濟危機提供了時間緩沖。(補充并清晰描述詳細)關于大數(shù)據(jù)在商業(yè)領域的應用,farecast公司是一個成功的典型范例。該公司由奧倫·埃齊奧尼創(chuàng)辦,利用機票的銷售數(shù)據(jù)來預測未來的機票價格,旨在幫助用戶在購買機票方面做出預測,并對機票價格走勢預測的可信度標示出來供消費者查考。farecast系統(tǒng)利用近十萬億條價格記錄預測的準確度達75%,使得使用farecast票價預測工具購買機票的旅客,平均每張機票節(jié)約50美元。而處理如此多的數(shù)據(jù)離開了大數(shù)據(jù)技術將無法進行。

也正是由于我們進入了一個前所未有的信息化時代,人們擁有了如此多的數(shù)據(jù),才提供給我們利用大數(shù)據(jù)的分析處理手段,創(chuàng)造新的價值。也許有人以為我們大數(shù)據(jù)時代的還未來臨。其實大數(shù)據(jù)技術早已滲透到我們中間,它被應用在垃圾郵件的過濾,新浪微博技術平臺,谷歌翻譯以及輸入文字的自動糾錯等。

文中提出的一個觀點是,預測是大數(shù)據(jù)的核心。其實從過去的時代人們就利用掌握的數(shù)據(jù)進行各種分析,從而對經(jīng)濟等各方面進行預測、矯正。只是進入了大數(shù)據(jù)時代人們掌握的數(shù)據(jù)爆炸性的速度在增長,從而數(shù)據(jù)的存儲和分析數(shù)據(jù)分方法成了釋放大數(shù)據(jù)能量的關鍵。

關于不是隨機樣本而是整體數(shù)據(jù)中。作者指出了隨機取樣是小數(shù)據(jù)時代用最少的數(shù)據(jù)獲取最大價值的做法。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說明了使用全部數(shù)據(jù)而非樣本的意義。喬布斯成為世界上第一個對自身所有dna和腫瘤dna進行排序的人。喬布斯曾開玩笑說“我要么是第一個通過這種方式戰(zhàn)勝癌癥的人,要么就是最后一個因為這種方式死于癌癥的人”。雖然最后難免死于癌癥但這種獲得所有數(shù)據(jù)而不是僅樣本的方法將他的生命延長了幾年。同樣,從事跨境匯款業(yè)務的xoom公司偵破一起犯罪集團的詐騙也是由于使用了整體數(shù)據(jù)。初此之外,他還列舉了日本“相撲”等來證明使用全體數(shù)據(jù)的重要性。

作者同時也指出隨著數(shù)據(jù)使用的越來越多,其得出的結果并一定能越來越精確,畢竟數(shù)據(jù)不能保證百分之百的正確,特別是大數(shù)據(jù)時代各種結構化與非結構化類型的數(shù)據(jù)聚集在一起難免導致結果的不太精確。大數(shù)據(jù)時代要求我們重新審視精確性的優(yōu)劣。作者特別舉了谷歌翻譯成功的例子。谷歌翻譯之所以優(yōu)于ibm的candide系統(tǒng)并不是因為它擁有更好的算法機制。和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數(shù)據(jù),并且接受了有錯誤的數(shù)據(jù)。(其語庫來自于未經(jīng)過濾的網(wǎng)頁內容,會包含一些不完整的句子、拼寫錯誤、語法錯誤以及其他各種錯誤)。

在不是因果關系,而是相關關系的篇章中。作者指出在大數(shù)據(jù)時代往往知道是什么要比知道為什么來的更實在。作者列舉了林登的亞馬遜推薦系統(tǒng)的成功,證實了大數(shù)據(jù)在分析相關性方面的優(yōu)勢以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數(shù)據(jù)信息的先鋒和代表,從以前廣為人事的啤酒和尿布的案例,以及作者舉的有關蛋撻和颶風天氣的案例,都說明了掌握了相關關系對于其策略的幫助。建立在相關關系分析法基礎上的預測是大數(shù)據(jù)的核心。aviva保險公司利用幾百種生活方式的數(shù)據(jù),如愛好、長瀏覽網(wǎng)頁等間接的預測出哪些人更可能患高血壓、糖尿病和抑郁癥。ups國家快遞公司通過使用預測性分析檢測其全美6萬輛車隊。進行防御性的修理,節(jié)約巨大得的成本。這些都充分顯示了大數(shù)據(jù)在預測方面的優(yōu)勢。

本書第二部分講的是大數(shù)據(jù)時代的商業(yè)變革。

作者用莫里繪制導航圖的例子告訴我們,遠在信息數(shù)字化之前,對數(shù)據(jù)的運用就已經(jīng)開始了。莫里利用大量的人力去分析多年保存的航海記錄,他從這些大量的數(shù)據(jù)中獲取到新的利用價值。繪制的圖表幫助商人節(jié)約一大筆錢,使年輕的海員們間接獲取了成千上萬名經(jīng)驗豐富的航海家的指導。日本先進工業(yè)技術研究所越水重臣教授通過安裝壓力傳感器將人屁股特征數(shù)據(jù)化,進而形成對乘客身份的特征識別。這項技術為汽車防盜系統(tǒng)提供了方案。公司,致力于為顧客預測商品的價格,通過收集處理海量的價格信息,預測準確率高達77%,幫助顧客在購買一個產(chǎn)品時節(jié)約了大約100美元。r部門通過分析來自210個國家的15億信用卡用戶的650億條交易記錄,分析得出商業(yè)發(fā)展和客戶消費趨勢,如通過分析發(fā)現(xiàn)如果一個人下午四點左右給汽車加油的話,他很可能在接下來的一個小時內去購物或者去餐館吃飯,且在這一小時里大約花費35到40美元。商家正可以利用這個分析結果,在加油的小票背面附加上附近商店的優(yōu)惠券。

這些例子都證明了大數(shù)據(jù)蘊藏著巨大的商業(yè)價值。根據(jù)提供價值的不同來源,大數(shù)據(jù)價值鏈包括三大構成部分。包括第一種是基于數(shù)據(jù)本身的公司。這些公司擁有大量數(shù)據(jù)或者至少可以收集到大量數(shù)據(jù),卻不一定有從數(shù)據(jù)中提取價值或者用數(shù)據(jù)催生創(chuàng)新思想的技能。第二種是基于技能的公司。它們通常是咨詢公司、技術供應商或者分析公司。它們掌握了專業(yè)技能但并不一定擁有數(shù)據(jù)或者提出數(shù)據(jù)創(chuàng)性用途的才能。比如說,沃爾瑪和pop-tarts這兩個零售商就是借助天睿公司的分析來獲得營銷點子,天睿就是一家大數(shù)據(jù)分析公司。第三種是基于思維的公司。皮特.華登,jetpac的聯(lián)合創(chuàng)始人,就是通過想法獲得價值的一個例子,他通過用戶分享到網(wǎng)上的旅行照片來為人們推薦下一次旅行目的地。對于某些公司來說,數(shù)據(jù)和技能并不是成功的關鍵。挖掘數(shù)據(jù)的新價值的創(chuàng)新思維才是這些公司脫穎而出的優(yōu)勢所在。

大數(shù)據(jù)成為許多公司競爭力的來源,未來可能整個行業(yè)的結構會發(fā)生改變,大公司和小公司最有可能成為贏家。如今的核心競爭力在于快速而廉價地進行大量的數(shù)據(jù)存儲和處理。當然公司要根據(jù)自己的情況進行調整。大數(shù)據(jù)向小數(shù)據(jù)時代的贏家以及那些線下大公司(如沃爾瑪、聯(lián)邦快遞、寶潔公司、雀巢公司、波音公司)提出了挑戰(zhàn)。同時,大數(shù)據(jù)也為小公司帶來了機遇。大數(shù)據(jù)也將會影響國家競爭力。當制造業(yè)已經(jīng)大幅轉向發(fā)展中國家,而大家都爭相發(fā)展創(chuàng)新行業(yè)的時候,工業(yè)化國家因為掌握了數(shù)據(jù)以及大數(shù)據(jù)技術,所以仍然在全球競爭中占據(jù)優(yōu)勢,但這個優(yōu)勢很難持續(xù)。隨著技術的發(fā)展,西方世界在大數(shù)據(jù)技術的優(yōu)勢將會慢慢消失。對于大公司而言,好消息是大數(shù)據(jù)技術可以加劇優(yōu)勝劣汰。一旦公司掌握了大數(shù)據(jù),它不但可能超過對手還可能遙遙領先。

文章第三部分講了大數(shù)據(jù)帶來無數(shù)好處的同時帶來的不良影響以及如何面對這些影響。包括如數(shù)據(jù)的收益的處理問題以及數(shù)據(jù)中用戶資料的隱私和決策過程帶來的影響。作者在保護個人隱私方面提出了幾種想法。一種是使用數(shù)據(jù)時征詢數(shù)據(jù)所有個人的知曉和授權。第二個技術途徑就是匿名化。作者同時也指出了這兩種方式的難度。一方面收集到的數(shù)據(jù)可能會被后續(xù)的多次利用。另一方面,匿名化會在數(shù)據(jù)收集越來越多和數(shù)據(jù)的相互結合關聯(lián)使用時變得無效。作者列列舉電影《少數(shù)派報告》的情節(jié)說明越來越依賴數(shù)據(jù)時,大數(shù)據(jù)可能將我們禁錮在可能性之中。當然通過分析犯罪的常發(fā)地與常發(fā)時間,合理安排警力會對治安防范提供不小的幫助。作者還指出不能盡信數(shù)據(jù)的分析結果,因為不能保證獲取分析結果來源的數(shù)據(jù)準確性。大數(shù)據(jù)在給我們生活提供便利的同時,也讓隱私保護的法律手段失去了作用。我們必須杜絕對數(shù)據(jù)的過分依賴。

在高速邁進大數(shù)據(jù)時代的同時,人類信息管理準則需要重新定位,這將帶動社會核心價值觀的轉變。大數(shù)據(jù)時代,對原有規(guī)范的修修補補已經(jīng)不足以抑制大數(shù)據(jù)帶來的風險。保護個人隱私就需要對個人數(shù)據(jù)處理器對其政策和行為承擔更多責任。同時必須重新定義公正的概念,以確保人類行為的自由。作者提出了解決這些問題的方向。如個人隱私保護方面,可以讓使用者承擔更多的社會責任。將責任從民眾轉移到數(shù)據(jù)使用者有很多意義,也有充分的理由。因為他們更清楚將如何使用數(shù)據(jù)且是數(shù)據(jù)應用最大的受益者。關于公正方面簡單的講就是個人可以并應為他們的行為而非傾向負責。就像公司有內部會計和外部審計人員一樣,大數(shù)據(jù)時代,公司將設置專門的人員--內部和外部算法師對大數(shù)據(jù)活動進行監(jiān)督。還有可能出現(xiàn)第三方的機構對大數(shù)據(jù)行為進行監(jiān)督和衡量。作者甚至考慮到對大數(shù)據(jù)存在的壟斷情況進行分析并在反壟斷反面給了建議。最后結語中作者提出大數(shù)據(jù)提供給人們的只是參考答案,提醒我們在利用這個工具時要銘記人類的作用是無法完全替代的。

大數(shù)據(jù)時代是信息化社會發(fā)展必然趨勢,我們只有緊緊跟隨時代發(fā)展的潮流,在技術上、制度上、價值觀念上做出迅速調整并牢牢跟進,才能在接下來新一輪的國際競爭中擺脫受制于人的弱勢境地,才能把握發(fā)展的方向,沖破與西方國家的差距。對于一個國家如此,對于一個企業(yè)亦是如此。在如此快速的到來的大數(shù)據(jù)時代,我們還有很多知識需要學習,許多思維需要轉變,許多技術需要研究。公司的規(guī)劃中,也需充分考慮到大數(shù)據(jù)對于公司的未來發(fā)展所帶來的機遇和挑戰(zhàn)。對于掌握大量數(shù)據(jù)的公司,需要考慮有多少數(shù)字化的數(shù)據(jù),又有哪些可以通過大數(shù)據(jù)的分析處理而帶來有價值的用途?比如國內目前的社交網(wǎng)站,購物網(wǎng)站等都掌握了用戶的大量的數(shù)據(jù)信息。在大數(shù)據(jù)時代制勝的良藥也許是創(chuàng)新的點子,也許可以利用外部的數(shù)據(jù),通過多維化、多層面的分析給其他企業(yè)或個人帶來價值。

大數(shù)據(jù)時代讀書心得篇六

4月13日下午,在湖南大學東樓205參加了關于《大數(shù)據(jù)時代》的讀書交流活動。通過相互交流學習,使我更深層次的理解了大數(shù)據(jù)時代的利與弊,機遇和挑戰(zhàn)。在寫心得體會前,我想再重新審視一下關于大數(shù)據(jù)的歷史沿革和現(xiàn)實意義。

首先,最早提出“大數(shù)據(jù)”時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來。”“大數(shù)據(jù)”在物理學、生物學、環(huán)境生態(tài)學等領域以及軍事、金融、通訊等行業(yè)存在已有時日,卻因為近年來互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關注。大數(shù)據(jù)作為云計算、物聯(lián)網(wǎng)之后又it行業(yè)又一大顛覆性的技術革命。云計算主要為數(shù)據(jù)資產(chǎn)提供了保管、訪問的場所和渠道,而數(shù)據(jù)才是真正有價值的資產(chǎn)。企業(yè)內部的經(jīng)營交易信息、物聯(lián)網(wǎng)世界中的商品物流信息,互聯(lián)網(wǎng)世界中的人與人交互信息、位置信息等,其數(shù)量將遠遠超越現(xiàn)有企業(yè)it架構和基礎設施的承載能力,實時性要求也將大大超越現(xiàn)有的計算能力。如何盤活這些數(shù)據(jù)資產(chǎn),使其為國家治理、企業(yè)決策乃至個人生活服務,是大數(shù)據(jù)的核心議題,也是云計算內在的靈魂和必然的升級方向。

其次,進入20xx年,大數(shù)據(jù)(bigdata)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),并命名與之相關的技術發(fā)展與創(chuàng)新。它已經(jīng)上過《紐約時報》《華爾街日報》的專欄封面,進入美國白宮官網(wǎng)的新聞,現(xiàn)身在國內一些互聯(lián)網(wǎng)主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進了投資推薦報告。數(shù)據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來發(fā)展,雖然很多企業(yè)可能并沒有意識到數(shù)據(jù)爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多的意識到數(shù)據(jù)對企業(yè)的重要性。正如《紐約時報》20xx年2月的一篇專欄中所稱,“大數(shù)據(jù)”時代已經(jīng)降臨,在商業(yè)、經(jīng)濟及其他領域中,決策將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗和直覺。哈佛大學社會學教授加里·金說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程?!?/p>

最后,隨著云時代的來臨,大數(shù)據(jù)(bigdata)也吸引了越來越多的關注。著云臺的分析師團隊認為,大數(shù)據(jù)(bigdata)通常用來形容一個公司創(chuàng)造的大量非結構化和半結構化數(shù)據(jù),這些數(shù)據(jù)在下載到關系型數(shù)據(jù)庫用于分析時會花費過多時間和金錢。大數(shù)據(jù)分析常和云計算聯(lián)系到一起,因為實時的大型數(shù)據(jù)集分析需要像mapreduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作?!按髷?shù)據(jù)”在互聯(lián)網(wǎng)行業(yè)指的是這樣一種現(xiàn)象:互聯(lián)網(wǎng)公司在日常運營中生成、累積的用戶網(wǎng)絡行為數(shù)據(jù)。這些數(shù)據(jù)的規(guī)模是如此龐大,以至于不能用g或t來衡量。大數(shù)據(jù)到底有多大?一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部內容可以刻滿1.68億張dvd;發(fā)出的郵件有2940億封之多(相當于美國兩年的紙質信件數(shù)量);發(fā)出的社區(qū)帖子達200萬個(相當于《時代》雜志770年的文字量);賣出的手機為37.8萬臺,高于全球每天出生的嬰兒數(shù)量37.1萬……,截止到20xx年,數(shù)據(jù)量已經(jīng)從tb(1024gb=1tb)級別躍升到pb(1024tb=1pb)、eb(1024pb=1eb)乃至zb(1024eb=1zb)級別。國際數(shù)據(jù)公司(idc)的研究結果表明,20xx年全球產(chǎn)生的數(shù)據(jù)量為0.49zb,20xx年的數(shù)據(jù)量為0.8zb,20xx年增長為1.2zb,20xx年的數(shù)量更是高達1.82zb,相當于全球每人產(chǎn)生200gb以上的數(shù)據(jù)。而到20xx年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200pb,全人類歷史上說過的所有話的數(shù)據(jù)量大約是5eb。ibm的研究稱,整個人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內產(chǎn)生的。而到了20xx年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達到今天的44倍。

首先,談談大數(shù)據(jù)帶給生活的轉變。大數(shù)據(jù)已經(jīng)是信息產(chǎn)業(yè)發(fā)展的必然趨勢,可以說,大數(shù)據(jù)現(xiàn)在已經(jīng)開始慢慢滲透入我們的生活,如:現(xiàn)在流行的打車軟件、三維立體化社區(qū)的建立、某些從事生產(chǎn)銷售的行業(yè)利用大數(shù)據(jù)來優(yōu)化規(guī)模和實現(xiàn)利益最大化。而我們很多人對大數(shù)據(jù)還很陌生,只是被動的適應著大數(shù)據(jù)給生活帶來的改變。大數(shù)據(jù)時代是以云計算為基礎的,所以,要實現(xiàn)大數(shù)據(jù),相關的很多的硬件設備都要更新?lián)Q代,信息處理系統(tǒng)、信息傳輸系統(tǒng)、信息反饋系統(tǒng)、信息決策系統(tǒng)都將面臨新的挑戰(zhàn),相關產(chǎn)業(yè)都要重新調整產(chǎn)業(yè)結構,在那時,可以夸張的說,信息就是黃金,信息就是石油。大數(shù)據(jù)時代的到來會解放更多的勞動生產(chǎn)力,勢必將會更加加劇生產(chǎn)力過剩的現(xiàn)狀,社會兩極分化現(xiàn)象會更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來的可怕局面。大數(shù)據(jù)時代的到來會使人們的生活節(jié)奏急速加快,信息的時效性決定了它的流通速率,人們的生活節(jié)奏要跟上信息流通的速率,就不得不加快自己的節(jié)奏,人們會越來越忙,到那時,就像現(xiàn)在的日本,可能想找個人聽你說說話,真的是一件很難的事。

第二,關于數(shù)據(jù)管理的看法。大數(shù)據(jù)時代,數(shù)據(jù)管理是一件很重要的工作,如何才能避免自己的數(shù)據(jù)被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹立信息安全防范的意識,不主動泄露信息,要管理好自己身邊的信息設備;技防,就是要運用軟件來管理和處理數(shù)據(jù),經(jīng)常檢查更新數(shù)據(jù)庫,定時查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數(shù)據(jù)一定要備份保留,而且應當做到備份與原始文件是物理隔離,無關的信息應當及時刪除,減輕硬盤的壓力。

三、怎么保護自己的隱私。隱私,顧名思義,就是不愿意讓別人看到的東西,所以,在大數(shù)據(jù)時代,更要管理好自己的隱私,以免對自己和家人造成麻煩和損失。越是隱私的信息,越要遠離網(wǎng)絡,不要再公開的社交網(wǎng)絡儲存和展示個人圖片、資料等信息,免得被非法人士采用和竊取。建議還是用紙質的日記代替電腦日記,避免信息傳播范圍太大,管理好自己的日記本。研發(fā)一種新的硬件連接器,總是以隨機碼來保護自己真實ip地址,提高網(wǎng)絡安全的可靠性,加強對聯(lián)網(wǎng)信息的管理和保護。

不論我們情不情愿,大數(shù)據(jù)時代都會到來,現(xiàn)實社會是我們高喊著走向大數(shù)據(jù)時代,其實大數(shù)據(jù)時代已經(jīng)向我們走來,所以與其被動接受,不如主動學習,從中找到自己的出路,成為大數(shù)據(jù)時代的建設者和受益者。

大數(shù)據(jù)時代讀書心得篇七

讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。

本書從思維、商業(yè)、管理三個方面闡述了在大數(shù)據(jù)時代在下的變革,這些變革涉及到我們生活的方方面面,幾乎其影響程度可以與兩次工業(yè)革命相媲美。作者在第一部分提出了三個比較令人震驚的觀點,也就是大數(shù)據(jù)的精髓在于我們分析信息時的三個轉變,這三個轉變將改變我們的理解和組建社會的方法。并且作者將生活,工作思維的大變革和這幾個方面緊緊聯(lián)系在一起。

第三個改變是不是因果關系而是相關關系,在大數(shù)據(jù)時代,我們更需要了解一個東西是什么,而不是為什么,要找到關聯(lián)無,通過一個良好的關聯(lián)物的相關關系可以幫助我們捕捉預測未來。

這三個方面是大數(shù)據(jù)時代所給我們帶來的思維上的改變,所謂思路決定出路,思路有了創(chuàng)新,有了拓展,相應的社會也就會有很大的變化。緊接著第二部分作者從萬事萬物數(shù)據(jù)化和數(shù)據(jù)交叉復用的巨大價值兩個方面,講述驅動大數(shù)據(jù)戰(zhàn)車在材質和智力方面向前滾動的最根本動力。第三部分則是闡述了大數(shù)據(jù)時代下的弊端以及在管理上的措施。個人認為本書的精髓部分是第一部分,第一部分的三個觀點涉及的面很廣,包括統(tǒng)計學、邏輯學、哲學等。后兩個部分都是以第一部分這三個觀點為基礎展開闡述的。

這本書給我感觸最深的.就是這三個轉變,或者說是三個觀點,可以說是哲學上說的世界觀,因為世界觀決定方法論,所以這三個觀點對傳統(tǒng)看法的顛覆,就會導致各種變革的發(fā)生。

首先是第一個,作者認為在抽樣研究時期,由于研究條件的欠缺,只能以少量的數(shù)據(jù)獲取最大的信息,而在大數(shù)據(jù)時代,我們可以獲得海量的數(shù)據(jù),抽樣自然就失去它的意義了。放棄了隨機分析法這種捷徑,采用所有的數(shù)據(jù)。作者用大數(shù)據(jù)與喬布斯的癌癥治療例子說明了使用全部數(shù)據(jù)而非樣本的意義,列舉了日本“相撲”等來證明使用全體數(shù)據(jù)的重要性。

這個觀點足以引起統(tǒng)計學乃至社會文明的變革,因為統(tǒng)計抽樣和幾何學定理、萬有引力一樣被看做文明得以建立牢固的基石。我對這個觀點還是比較認同的,如果真能收集到整體的數(shù)據(jù)而且分析數(shù)據(jù)的工具也足夠先進,自然是全體數(shù)據(jù)研究得出的結果更令人信服。但是這個觀點也過于絕對,就算是在大數(shù)據(jù)時代要想收集到全體數(shù)據(jù)還是不太可能實現(xiàn)的,因為收集全體數(shù)據(jù)要付出的代價有時會很大。比如說,你要檢測食品中致癌物質是否超標,你不可能每一件食品你都檢測一遍吧。

第二,要效率不要絕對的精確。作者說,執(zhí)迷于精確性是信息缺乏時代和模擬時代的產(chǎn)物,只有5%的數(shù)據(jù)是結構化且能適用于傳統(tǒng)數(shù)據(jù)庫的。如果不接受混亂,剩下95%的非結構化數(shù)據(jù)都無法被利用。作者是基于數(shù)據(jù)不可能百分之百正確的考慮而做出這樣的判斷的,如果采用小數(shù)據(jù)一個數(shù)據(jù)的錯誤就會導致結果的誤差很大,但是如果數(shù)據(jù)足夠多、數(shù)據(jù)足夠雜那得出的結果就越靠近正確答案。大數(shù)據(jù)時代要求我們重新審視精確性的優(yōu)劣,甚至還說到大數(shù)據(jù)不僅讓我們不再期待精確性,也讓我們無法實現(xiàn)精確性。谷歌翻譯的成功很好地證明了這一點,谷歌的翻譯系統(tǒng)不像candide那樣精確地翻譯每一句話,它谷歌翻譯之所以優(yōu)于ibm的candide系統(tǒng)并不是因為它擁有更好的算法機制,和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數(shù)據(jù),并且接受了有錯誤的數(shù)據(jù)。

而在閱讀這本書時,發(fā)現(xiàn)這本書中爭議最大的一個觀點,不僅是讀者,就算是本書的譯者也在序言中明確地說到他不認同“相關關系比因果關系更重要”的觀點。作者覺得相關關系對于預測一些事情已經(jīng)足夠了,不用花大力氣去研究他們的因果關系。作者用林登的亞馬遜推薦系統(tǒng)的成功,證實了大數(shù)據(jù)在分析相關性方面的優(yōu)勢以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數(shù)據(jù)信息的代表,從啤酒和尿布的案例,以及作者舉的有關蛋撻和颶風天氣的案例,都說明了掌握了相關關系對于他們策略的幫助。

一句話,知道是什么就夠了,不用知道為什么。很明顯作者所舉的例子都是屬于商業(yè)領域的,但是對于其他領域來說這個觀點就值得商榷了。比如說,在科學研究領域,你需要知其然也需要知道其所以然,找到事件發(fā)生的原理。用文中的一個例子說明,喬布斯測出整個基因圖譜來治療癌癥,但是你治療癌癥你必須知道癌癥發(fā)病的原理,知道哪一段基因導致了這種疾病,不可能只是說收集各種數(shù)據(jù),然后利用其相關性來判斷哪里出現(xiàn)了問題。

過度依賴所帶來的后果。也用《少數(shù)派的報告》這部電影來說明如果癡迷于數(shù)據(jù)會導致我們將生活在一個沒有獨立選擇和自由意志的社會,如果一切變?yōu)楝F(xiàn)實,我們將被禁錮在大數(shù)據(jù)的可能性之中。所以書中提出了幾種解決方法,一種是使用數(shù)據(jù)時征詢數(shù)據(jù)所有個人的知曉和授權。第二個技術途徑就是匿名化。毫無疑問,大數(shù)據(jù)將會給社會管理帶來巨大的變革。

在這個信息爆炸的時代,大數(shù)據(jù)給人類社會的方方面面帶來了巨大的變革,這是社會發(fā)展的潮流,不可逆轉,我們只有順應這種潮流,把握住大數(shù)據(jù)時代變革的思想,才能在時代潮流中成為佼佼者,在思維上思路上略高一籌,才能在行動中占得先機!

大數(shù)據(jù)時代讀書心得篇八

對于暢銷書刊、熱點話題、時尚科技,始終不太感興趣。書刊,喜歡有一定年份的。話題,鐘情于務虛的觀點。新奇的產(chǎn)品于我無緣,習慣使用成熟的科技產(chǎn)品。既不清高,也非冷漠,就是要與現(xiàn)實保持一定的距離,給自己留一點思考的空間。這一習慣最近破了例。由于工作的原因,耳濡目染,“大數(shù)據(jù)”這個新興概念開始頻繁步入我的視野。按捺不住內心的好奇,網(wǎng)購《大數(shù)據(jù)時代》,手不釋卷,三天讀完,頗有收獲。此書有如下特點。

首先,作者站在理論的制高點上,條理清楚地闡述了大數(shù)據(jù)對人類的工作、生活、思維帶來的革新,大數(shù)據(jù)時代的三種典型的商業(yè)模式,以及大數(shù)據(jù)時代對于個人隱私保護、公共安全提出的挑戰(zhàn)。其次,文中的事例貼近現(xiàn)實生活,貼近時代,令讀者既印象深刻,又感同身受。此外,作者沒有使用大量的專業(yè)術語,沒有假裝一副專業(yè)的面孔??v觀全書,遣詞造句,均通俗易懂。

作者認為大數(shù)據(jù)時代具有三個顯著特點。

一、人們研究與分析某個現(xiàn)象時,將使用全部數(shù)據(jù)而非抽樣數(shù)據(jù)。

二、在大數(shù)據(jù)時代,不能一味地追求數(shù)據(jù)的精確性,而要適應數(shù)據(jù)的多樣性、豐富性、甚至要接受錯誤的數(shù)據(jù)。

三、了解數(shù)據(jù)之間的相關性,勝于對因果關系的探索?!笆鞘裁础北取盀槭裁础敝匾?。

作者指出,隨著技術的發(fā)展,數(shù)據(jù)的存儲與處理成本顯著降低,人們現(xiàn)在有能力從支離破碎的、看似毫不相干的數(shù)據(jù)礦渣中抽煉出真知爍見。在大數(shù)據(jù)時代,三類公司將成為時代的寵兒。一是擁有大數(shù)據(jù)的公司與組織。如政府、銀行、電信公司、全球性互聯(lián)網(wǎng)公司(阿里巴巴、淘寶網(wǎng))。二是擁有數(shù)據(jù)分析與處理技術的專業(yè)公司,如亞馬遜、谷歌。三是擁有創(chuàng)新思維的公司,他們可能既不掌握大數(shù)據(jù),也沒有專業(yè)技術,但卻擅長使用大數(shù)據(jù),從大數(shù)據(jù)中找到自己的理想天地。

面對即將來臨的大數(shù)據(jù)時代,個人將如何應對自如?這是個嚴肅的問題。

大數(shù)據(jù)時代讀書心得篇九

這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運作上的應用,以及它對現(xiàn)代商業(yè)運作的影響。

《大數(shù)據(jù)時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對現(xiàn)象的解剖提出對這一現(xiàn)象的解釋。然后在通過解釋在對未來進行預測,并對未來可能出現(xiàn)的問題提出自己看法與對策。

下面來重點介紹《大數(shù)據(jù)時代》這本書的主要內容。

《大數(shù)據(jù)時代》開篇就講了google通過人們在搜索引擎上搜索關鍵字留下的數(shù)據(jù)提前成功的預測了20xx年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關的數(shù)據(jù)。同時google的預測與政府數(shù)據(jù)的相關性高達97%,這也就意味著google預測數(shù)據(jù)的置信區(qū)間為3%,這個數(shù)字遠遠小于傳統(tǒng)統(tǒng)計學上的常規(guī)置信區(qū)間5%!而這個數(shù)字就是大數(shù)據(jù)時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時代“樣本=總體”的思想。我們都知道當樣本無限趨近于總體的時候,通過計算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質。而之前采取的“樣本總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數(shù)據(jù)的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯(lián)網(wǎng)終端與計算機的出現(xiàn)使數(shù)據(jù)的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數(shù)據(jù)時代的主流,同時大數(shù)據(jù)時代本身也是建立在大批量數(shù)據(jù)的存儲與處理的基礎之上的。

接下來,維克多又通過了ibm追求高精確性的電腦翻譯計劃的失敗與google只是將所有出現(xiàn)過的相應的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系google詞庫就會出現(xiàn)翻譯,雖然有的時候的翻譯很無厘頭,但是大多數(shù)時候還是正確的,所以google的電腦翻譯的計劃的成功,表明大數(shù)據(jù)時代對準確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時代是建立在大數(shù)據(jù)的基礎住上的,所以大數(shù)據(jù)時代追求的是全方位覆蓋的數(shù)字測度而不管其準確性到底有多高,因為大量的數(shù)據(jù)會湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時大量的數(shù)據(jù)也會無限的逼近事物的原貌。

之后,維克托又預測了一個在大數(shù)據(jù)時代催生的重要職業(yè)——數(shù)據(jù)科學家,這是一群數(shù)學家、統(tǒng)計學與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個人隱私在大數(shù)據(jù)時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用數(shù)據(jù),是否侵犯了個人隱私。

無論如何,大數(shù)據(jù)時代將會到來,不管我們接受還是不接受!

我覺得《大數(shù)據(jù)時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),比如你在相關的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學家”們利用,從而再將相關數(shù)據(jù)賣給各大網(wǎng)店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網(wǎng)上留下的痕跡。

我喜歡這本書是因為它給我展現(xiàn)了一個新的世界。

大數(shù)據(jù)時代讀書心得篇十

有人說現(xiàn)在是讀圖時代,除去小說、心靈雞湯以外,現(xiàn)在的暢銷書基本都有圖片,這本書是一個特例(書里唯一的圖是出品方湛廬文化做的)。

首先嘗試解析一下作者的三大觀點,這三大觀點是大數(shù)據(jù)業(yè)者很喜歡引用的三句話:

1不是隨機樣本,而是全體數(shù)據(jù)。

我想所有人都能意識到對全體數(shù)據(jù)的分析優(yōu)于對隨機樣本的分析,但在現(xiàn)實中我們經(jīng)常拿不到全體數(shù)據(jù):一是對象的特性:比如炸彈的威力,你不可能把所有炸彈都炸掉來得到全體數(shù)據(jù);二是數(shù)據(jù)的收集方法,每一種方法都有適用的范圍,不太可能包羅萬象;三是數(shù)據(jù)分析的角度,戰(zhàn)斗機只能統(tǒng)計到飛回來的飛機上的彈孔,而墜毀的則無法統(tǒng)計,沃德通過分析飛回來的戰(zhàn)斗機得出來最易導致墜毀的薄弱點;四是處理能力跟不上,就像以前的天氣預報太離譜是因為來不及算那些數(shù)據(jù)?!安蓸臃治鍪切畔⑷狈r代和信息流通受限制的模擬數(shù)據(jù)時代的產(chǎn)物”,作者顯然只關注了一部分原因。

從語言的理解上看,什么是全體數(shù)據(jù),究竟是“我們需要的所有數(shù)據(jù)”,還是“我們能收集到的所有數(shù)據(jù)”,書中的很多商業(yè)案例中,處理的只是“我們能收集到的所有數(shù)據(jù)”,或者說是“我們認為的全體數(shù)據(jù)”。人對自然的認識總是有限的,存在主義認為世界沒有終極的目標。書中舉例“farecast使用了每一條航線整整一年的價格數(shù)據(jù)來進行預測”,而“整整一年”就是一個采樣,或者是“我們需要的所有數(shù)據(jù)”。

從歷史的角度看,國外的托勒密建亞歷山大圖書館唯一的目的是“收集全世界的書”,實現(xiàn)“世界知識總匯”的夢想,國內的乾隆匯編四庫全書,每個收集的過程都有主觀因素在里面,而他們當時都認為可以收集全部的書籍,到最后,我們也沒有得到那個夢中的全體。

2不是精確性,而是混雜性。

由此衍生出一個問題,大數(shù)據(jù)的品質如何控制:一、本身就不要求精確,但是不精確到何種程度是需要定義的,否則就亂套了,換個角度,如果定義了容錯度,那符合條件的都是精確的(或者說我這句話還是停留在小數(shù)據(jù)時代?這里的邏輯我沒有理順)。就像品質管理大師克勞斯比提出過零缺陷理論,我一直覺得是一個偽命題,缺陷是一定存在的,就看如何界定了;二、大量非結構化數(shù)據(jù)的處理,譬如說對新聞的量化、情感的分析,目前對非sql的應用還有巨大的進步空間。

“一個東西要出故障,不會是瞬間的,而是慢慢地出問題的”?!巴ㄟ^找出一個關聯(lián)物并監(jiān)控它,我們就能預測未來”。這句話當然是很認同,但不意味著我們可以放棄精確性,只是說我們需要重新定義精確度。之于項目管理行業(yè),如果一個項目出了嚴重的問題,我們相信,肯定是很多因素和過程環(huán)節(jié)中出了問題,我們也失去了很多次挽救的機會。而我們一味的`容忍混雜性的話,結果顯然是不能接受的。

3不是因果關系,而是相關關系。

這是本書對大數(shù)據(jù)理論的最大的貢獻,也是最受爭議的地方。連譯者都有點看不下去了。

相關關系我實在是太熟了,打小就學的算命就是典型的“不是因果關系,而是相關關系”。算命其實是對趨向性的總結,在給定條件下,告訴你需要遠離什么,接近什么,但不會告訴你為什么那樣做。

我們很多時候都在說科學,然而,什么是科學,沒有人能講清楚。我對科學的認識是:一、有一個明確的范圍;二、在這個范圍內樹立一個強制正確的公理;三、有明確的推演過程;四可以復制。科學的霸道體現(xiàn)在把一切不符合這四個條件的事物都斥為偽科學、封建迷信,而把自己的錯誤都用不符合前兩條來否決。從這個定義來看,大數(shù)據(jù)不符合科學。

混沌學理論中的蝴蝶效應主要關注相關關系。它是指對初始條件敏感性的一種依賴現(xiàn)象,輸入端微小的差別會迅速放大到輸出端,但能輸出什么,誰也不知道。

人類一旦放棄了對因果關系的追求,也就放棄了自身最優(yōu)秀的品質:意志力。很多人不愿意相信算命是擔心一旦知道了命運,就無法再去奮斗。即使我相信算命,也在探求相關關系中的因果要素。我放棄第一份工作的原因之一是厭倦了如此確定的明天:一個任務發(fā)出去,大概能預測到哪些環(huán)節(jié)會出問題,只要不去follow,這些環(huán)節(jié)十有_會出問題。

解析完這三大觀點,下面是我對大數(shù)據(jù)理論的一些疑惑。大數(shù)據(jù)是目前風行的反饋經(jīng)濟中的重要一環(huán),在金融、互聯(lián)網(wǎng)行業(yè)的應用最為廣泛,而這些行業(yè)都是大家所認為的高薪領域。很多時候我就在想,所謂無形的手所產(chǎn)生的趨勢究竟是不是無形的。比如幾家公司強推一個概念,說這是趨勢,不久就真的變成趨勢了。我們身邊活生生的例子就是天貓的雙十一和京東的618,一個巨頭開路,無數(shù)人跟風,自然就生造出購物節(jié),至于合理不合理,追究的意義也不大,因為很多事情是沒有可比性的。這和沒有強制控制中心的蜂群思維又不一樣。

1數(shù)據(jù)獨裁。個人意志將受制于集體意志,個人的自由在哪里?用大數(shù)據(jù)預測來懲罰人的行為又確定的違反了無罪推定的原理。

2所有數(shù)據(jù)都來源于過去,大數(shù)據(jù)分析出來的確定性結果是否意味著我們在重復過去?拉普拉斯的決定論已經(jīng)被認為是錯誤的,愛因斯坦也說過“上帝不會跟宇宙玩骰子”,但霍金不同意這句話。

大數(shù)據(jù)時代讀書心得篇十一

在看《大數(shù)據(jù)》之前,我只知道社會越來越數(shù)字化了,看完之后,才覺悟到:人類將迎來一個新的時代。

數(shù)字化已經(jīng)把我們帶入一個信息時代,大數(shù)據(jù)卻把我們卷進了一場科技風暴之中,這本書中,作者為我們開啟了一個更包容更廣闊的新時代,大數(shù)據(jù)把社會的方方面面融合在了一起,曾經(jīng)看似因果聯(lián)系緊密的事物,可能變得不再那么重要;毫無關聯(lián)的事物,可能隱藏著重要的信息,從科技、商業(yè),到醫(yī)療、政治、教育、文化,大數(shù)據(jù)一概席卷囊括,它改變著我們的傳統(tǒng)思維,為這個時代注入了新鮮的血液,就像作者書中所說:“這項技術終將改變我們所居住的星球上的許多東西?!?/p>

大數(shù)據(jù)最顯著的影響是對于電子商務,通過大數(shù)據(jù),最先洞察出潛在市場的,也必然最先占領市場。而電子商務對實業(yè)的沖擊又是勢不可擋,可見,掌握了大數(shù)據(jù)就主導了市場,擁有了先進的科技才能擁有堅實的競爭力。在醫(yī)療方面,曾經(jīng)的非典時期,就是一個很好的例證,正是有大數(shù)據(jù)的預測功能,才使疫情得到了控制。在更小的方面,他也同樣改變著我們的生活,書中提到美國著名計算機專家奧倫·埃齊奧尼發(fā)明了飛機機票價格預測軟件,就是利用大數(shù)據(jù)造福我們生活的很好例子。

大數(shù)據(jù)不僅節(jié)省了時間,提高了效率,更將人類帶入一個新的文明階段。從分析因果總結經(jīng)驗,轉變?yōu)樗鸭瘮?shù)據(jù)預測未來;由原來的滯后性變?yōu)楝F(xiàn)在的預見性——大大提高了人類認識世界、改造世界的能力,變被動為主動。大數(shù)據(jù)為我們掀開了歷史新紀元,不敢想象它將會為我們帶來什么,或許會出現(xiàn)新奇的生活方式,從未有過的職業(yè),聞所未聞的商業(yè)模式,百家爭鳴的文化高峰;也或許會解開更多未解之謎,探索到宇宙之外的秘密。總之,毫無疑問的是,大數(shù)據(jù)為我們帶來的未來是超乎想象的。

這本書中作者提到最多的是:改變我們的傳統(tǒng)思維,摒棄精確性轉向宏觀。從總結因果轉向預測。這個世界正以驚人的速度向前發(fā)展,數(shù)據(jù)大爆炸的波及范圍遠超乎我們的想象,單純靠人類的主觀判斷力是多么的有限,大數(shù)據(jù)早晚會取而代之這一現(xiàn)象,這必將影響我們的生活和工作,我們也只有認清這種趨勢,改變思維,調整步伐,緊跟時代才行。即使不能與時代同步,也盡量做到避免固步自封,認識大數(shù)據(jù)、利用大數(shù)據(jù)趨利避害,為我們的生活造福!

大數(shù)據(jù)時代讀書心得篇十二

這兩年,大數(shù)據(jù),云計算的思想就像小蘋果的音樂一樣,傳的到處都是,每一個公司不管是互聯(lián)網(wǎng)公司還是傳統(tǒng)企業(yè),都標榜自己的大數(shù)據(jù)。

1、實體物聯(lián)網(wǎng)與虛擬物聯(lián)網(wǎng)。

曾幾何時,物聯(lián)網(wǎng)的概念鬧得風生水起,龐大的物聯(lián)網(wǎng)能夠讓世間大量的物體,都能夠被檢測并聯(lián)網(wǎng),包括了人、車、房等一切能夠被聯(lián)網(wǎng)的物體,這些物體都能夠以種方式被感知他的存在,并對其信息記錄在案,以供使用。在若干年前,這還是一種看似遙不可及的事物,要對每個物體都貼上一個所謂的rfid的標簽,顯得不切實際。如今,隨著手機的大量使用,人類本身也被加入了物聯(lián)網(wǎng)中。為什么要物聯(lián)網(wǎng)?是為了獲取什么?要知道物聯(lián)網(wǎng)獲取了什么,只需要看看在一個物體在沒有加入物聯(lián)網(wǎng)與加入物聯(lián)網(wǎng)之后,我們多出了哪些東西便能夠知曉。那么,很明顯,我們需要通過某種方式來獲取該物體的信息,這種存儲下來的信息,就叫做——數(shù)據(jù)。

物聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)是實體的物品之間的信息,而現(xiàn)在的互聯(lián)網(wǎng)上,占最大數(shù)據(jù)量的,是虛擬物品,或者叫做網(wǎng)絡虛擬物品。由于網(wǎng)絡物體是直接寄生于網(wǎng)絡,具有能夠方便的接入網(wǎng)絡的特征,因此,在獲取實體物體信息還有一定難度的時期,占有很大優(yōu)勢。但今后實體的物聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)量一定會不斷增加,或許,能夠超越網(wǎng)絡上的物物相連數(shù)據(jù)量。

網(wǎng)絡的廣泛使用,使得信息的產(chǎn)生于傳遍變得容易,每個接入網(wǎng)絡的人都以一定的角色存在,都是網(wǎng)絡的信息的創(chuàng)造者。對于所產(chǎn)生的信息而言,每個接入網(wǎng)絡的人又身兼多角,對于網(wǎng)絡服務商,他是網(wǎng)絡使用者的角色;對于門戶網(wǎng)站而言,他是使用的用戶;對于社交網(wǎng)站而言,我們則扮演一個虛擬或者真實的網(wǎng)絡角色;對于瀏覽器而言,他是一系列的瀏覽網(wǎng)頁、一些列鼠標動作的角色…不同的角色取決于對方需要從我們的行為中獲取哪些信息。將網(wǎng)絡上各種角色看成是虛擬的物體,那么,這種虛擬物體構成的虛擬物聯(lián)網(wǎng)便產(chǎn)生了巨大的數(shù)據(jù)量。經(jīng)歷過一直以來缺乏信息獲取渠道的日子,現(xiàn)在,既然信息獲取變得如此容易,那么,必然迎來信息量暴增的時代——大數(shù)據(jù)時代。

2、思維的轉變。

技術的改變,使得我們思維方式也要隨之發(fā)生變化。在過去的小數(shù)據(jù)時代,由于獲取信息、存儲信息、整理信息都是費時費力的活,我們只能精打細算,捉摸著如何以最小的代價、最快的方式來收集盡可能準確的信息。之所以會有抽樣統(tǒng)計的方式,是受技術所限,無法獲得全體的樣本,或者就算獲取了也無法在合理的時間內進行處理。由于信息獲取代價大,使得我們不得不在獲取信息前,就把一切都想清楚,才能夠著手處理。這就像在計算機出現(xiàn)的初期,使用紙袋來編碼的時期,一次出錯的代價太大,所以人們不得不在輸入前將代碼驗證過無數(shù)遍之后才敢輸入到機器中。而現(xiàn)代計算機讓編碼的效率大大提升,這才使得人們能夠創(chuàng)造出更加強大的軟件。人們不需要在著手編碼前就對代碼過分深思熟慮,因為機器會幫助你解決一些問題。因此,那些擔心由于獲取數(shù)據(jù)太方便,進行數(shù)據(jù)處理、分析代價太小而使人們變得懶惰或者做事欠考慮的家伙,真是杞人憂天。歷史上,技術的進步都會提升人類的生產(chǎn)力,但卻沒有讓人們變得懶惰,因為與此同時,欲望也隨之增長。人類只會變得更偉大。

因此,大數(shù)據(jù)時代,這個數(shù)據(jù)更加全面的時代,我們可以涉足一些之前由于缺乏數(shù)據(jù)而無法涉及的領域,例如——預測。這是一個令人興奮的領域,但其實這個領域早有苗頭,而且大家都是受益者。我們平時使用的輸入法中的智能聯(lián)想功能,能夠根據(jù)我們之前輸入的文字,來預測我們接下來有可能輸入的文字,以節(jié)省我們的輸入時間。這種算法里,沒有人工智能,而只有人們大量的輸入習慣的統(tǒng)計,通過大量數(shù)據(jù)的統(tǒng)計來預測,是一個統(tǒng)計學的方式而非加入了特有的規(guī)則或者邏輯。這便引出了在大數(shù)據(jù)時代,對于信息處理的一種重要方式,基于統(tǒng)計,得出不同個體的相關關系,卻無需了解其因果關系,而我們則受益于相關關系。這種方式,看似有些投機取巧,卻能夠在關鍵時刻令我們處于優(yōu)勢地位。我們已經(jīng)習慣了先知道某些事物的因果邏輯,繼而推斷出相應的結果。但世間總會有一些令人無法用合理的邏輯進行解釋的現(xiàn)象,若通過大數(shù)據(jù)分析,我們能夠跳過邏輯階段直接享用某些一些結果(沃爾瑪?shù)钠【萍幽虿及咐?,豈不樂哉。當然,嚴密的邏輯永遠是值得尊敬的。

3、互聯(lián)網(wǎng)的黏性。

在經(jīng)歷過了從廣度上通過新花樣來吸引用戶的時代,由于技術的提高,一個創(chuàng)業(yè)者在一個新的領域開辟的東西很容易被其他人所復制。在這個時候,深度很重要。特別是購物網(wǎng)站、微薄、門戶網(wǎng)站這類信息量大的網(wǎng)站,越是了解一個用戶,優(yōu)勢就越大。所以,在技術已經(jīng)不是最重要的因素的時代,如何增加用戶的黏性、忠誠度便是首要的。通過用戶之前的信息,來推測用戶的喜好,給用戶推薦相應的信息或物品。當你越了解一個用戶,而別人卻不了解時,這個用戶就越離不開你。微薄中有他的智能排序功能、新聞門戶中有“今日頭條”應用,各類購物網(wǎng)站有他的推薦算法(但這個純粹為了增加消費而非增加用戶黏性),都能夠根據(jù)用戶之前的瀏覽、偏好來給出相應的推薦。這些的基礎,都是擁有用戶的行為記錄,否則,都無從談起。

在手機這個拼硬件的時代,單純靠硬件來取勝已經(jīng)很難了。硬件靠組裝、軟件靠安卓,手機廠商已經(jīng)變得沒有核心競爭力。而三星為了增加用戶黏性,所做的便是為用戶提供更加貼心的服務,不僅做手機,還做平臺,將用戶的各類數(shù)據(jù)記錄在他的平臺中,而這數(shù)據(jù),必將大有作為。然后,如果哪天,三星也出智能體重計、智能手表這類產(chǎn)品,那么也不稀奇了。各類數(shù)據(jù)同步、整合,為使用者提供各方面貼心的服務,很酷吧。

各行各業(yè),都在瘋狂的抓緊時機,獲取數(shù)據(jù),擁有足量的數(shù)據(jù),那一切就變得皆有可能。

大數(shù)據(jù)時代讀書心得篇十三

舍恩伯格的《大數(shù)據(jù)時代》被人推崇為最佳書籍,今年安泰讀書會的重頭戲。雖然主講人最后放了個香港大黃鴨般的鴿子,但現(xiàn)場討論氛圍依舊非常熱烈——而且還是在沒幾個人讀完的情況下,也就意味著——大數(shù)據(jù)對我們的影響,已經(jīng)深入到生活的方方面面。這本書對這個大規(guī)模產(chǎn)生、分享和應用數(shù)據(jù)的新的大時代進行了闡述和厘清,作者圍繞“要全體不要抽樣、要效率不要絕對精確、要相關不要因果”三大理念,通過數(shù)十個商業(yè)和學術案例,剖析了萬事萬物數(shù)據(jù)化和數(shù)據(jù)復用挖掘的巨大價值。

無處不在的大數(shù)據(jù):各種云計算,谷歌的神通,亞馬遜的推送,天涯人肉,微博萬能等等等等,我們掌握了新的工具,也獲取了以前從未有過的各種信息。大數(shù)據(jù)拉近了我們與現(xiàn)實的距離,“地球村”變成了“地球屋”,仿佛所有人所有事物都觸手可及,而這些牛逼哄哄的互聯(lián)網(wǎng)巨頭就在客廳展示著世界的每一寸光景。如作者所言“大數(shù)據(jù)開啟了一次重大時代轉型。就像望遠鏡讓我們能夠感受宇宙,顯微鏡讓我們看清微生物一樣,大數(shù)據(jù)要改變的是,我們的生活方方面面以及理解世界的方式”。比如,谷歌通過全球搜索分析,比國際疾病控防中心更早更準地預測了流感爆發(fā)。

然而,事實真的是這樣嗎?首先,從應用角度出發(fā),低廉的運算能力和存儲空間,讓以前的樣本分析顯得非常簡陋——一些從全體數(shù)據(jù)挖掘出來,忽略精確而從大量數(shù)據(jù)的簡單算法得出來的結論顛覆了常識。但個人覺得,這只是統(tǒng)計學的終極目標——并沒有非常大的跨越,可能終結了回歸分析,有效性驗證等手段,但依舊還是統(tǒng)計。而革命性在于關注相關關系而非因果關系?,F(xiàn)場討論從神學角度挑戰(zhàn)了因果關系的不可能——或者說人類用簡單思考的邏輯來定義因果,以及用之前小數(shù)據(jù)演繹出大概率事件來推導因果,都是不正確的。真正的因果關系應該屬于上帝的范疇,人類如果真的完全掌握之后,會統(tǒng)治整個宇宙。

但我覺得,無需從神學觀點來討論,而可以借鑒量子力學對經(jīng)典力學的顛覆——在原子層面上,經(jīng)典力學會失效——那么在大數(shù)據(jù)層面上,普通的抽樣調查直觀反映會失效。而且從量子力學角度是很難推導經(jīng)典力學的公式,那么從現(xiàn)在的慣有思維,也難以推導出大數(shù)據(jù)的因果關系。同時現(xiàn)場有討論,是否計算機可以精確地模擬每個原子,然后完整地展現(xiàn)微觀到宏觀的化學反應細節(jié)?我覺得首先是計算能力不足,其次即便設定原子的運動條件真的正確,計算結果未知但宏觀結果我們卻已經(jīng)知道——牛頓的經(jīng)典力學足以應付日常絕大部分情況了。好比切西瓜,究竟刀頭的鐵原子和西瓜的有機分子如何作用,真的重要嗎?回歸到商業(yè)領域,如果我們可以提高相關性的準確度,從而提高投入效率,那就已經(jīng)足夠了。本來一個產(chǎn)品受到一半客戶喜歡,但如果通過大數(shù)據(jù)挖掘到更好的定位,有百分之八十的客戶喜歡,那么價值已經(jīng)非常可觀了。

大數(shù)據(jù)時代的社會倫理——很大的命題,但重點都在討論如何保護個人隱私。因為手機越來越智能,網(wǎng)絡越來越快,個人的信息也越來越透明——隱形幾乎完全不可能。我想說的是,作為硬幣的另外一面,我們無法舍棄:互聯(lián)網(wǎng)只不過是讓人與人之間碎片的關系得以統(tǒng)一,其實各種人肉和信息只不過是坊間傳聞的升級罷了。當我們住在擁擠的小區(qū),三公里走完一圈的縣城,半小時散步完的村落,人和人之間有隱私嗎?現(xiàn)在只不過是把這個范圍放大到了一個地球而已。硬幣的一面是人和人之間有溝通的需要,去團結對抗世界的未知,那么另外一面就是隱私的缺乏。與其說是要在大數(shù)據(jù)時代保護自己的信息不被泄露,不如站起來維護自己和他人的隱私,從法律和道德的角度來尊重人與人之間的權利。在一個互相尊重的環(huán)境下,你可以穿熱褲,他也可以穿長裙走上街頭;在一個互相踐踏的社會中,人人都得帶著面具生活。

在思維變革部分,作者講述的重點是:樣本=總體,我們需要對全部數(shù)據(jù)的占有和分析;因此,數(shù)據(jù)缺乏時代的精確性不必執(zhí)迷,接受混雜基于大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復雜算法更有效;樣本推斷的因果關系不重要了,知道“是什么”的相關關系,或者結果就可以了。對于我自己最受用的是什么呢?是大數(shù)據(jù)的產(chǎn)業(yè)鏈。產(chǎn)業(yè)鏈包括大數(shù)據(jù)平臺、大數(shù)據(jù)技術提供方、大數(shù)據(jù)理念提供方。我認為大數(shù)據(jù)平臺是整個產(chǎn)業(yè)鏈條的核心,沒有數(shù)據(jù),再好的技術和理念都會是無米之炊。那么大數(shù)據(jù)平臺在當前的中國社會有哪些呢?所有的互聯(lián)網(wǎng)公司,物聯(lián)網(wǎng)公司,物流,快消品等等,實際上任何公司都是數(shù)據(jù)平臺公司,只不過之前沒有好好的利用數(shù)據(jù),而更多的是用經(jīng)驗來管理公司和迎合客戶需求。現(xiàn)在不一樣了,我們完全可以用數(shù)據(jù)來驅動公司管理和客戶管理,畢竟數(shù)據(jù)是不會騙人的。

大數(shù)據(jù)幫助我們把未來的迷霧撥開了一點,但好比《沉重的肉身》當中討論的,更多的選擇權并不能帶給人幸福——因為知道自己不能做不能得到的也更多了。解決工作模式,生存意義,幸福之道等問題,關鍵還是看自己如何看待和使用這些新式工具以及新結論。引用《神探伽利略》里面的臺詞:可被重復的,一定有道理存在。那么現(xiàn)在重復的越來越多,更需要保持探索和敬畏之心,人才不會迷路。

大數(shù)據(jù)時代讀書心得篇十四

大數(shù)據(jù)時代的到來,給人們的生活、工作、學習等方方面面帶來了巨大的變革。信息爆炸和海量數(shù)據(jù)的涌現(xiàn),使得人們既感到興奮也感到困惑。為了更好地適應這個新時代,我觀看了《大數(shù)據(jù)時代第集》這部紀錄片,對于大數(shù)據(jù)時代帶來的影響有了更深入的理解和體會。

第一段:紀錄片揭示數(shù)據(jù)充斥我們生活的方方面面。

《大數(shù)據(jù)時代第集》的開場,向觀眾展示了一個龐大而精密的數(shù)據(jù)收集系統(tǒng)。從各個環(huán)境中,包括手機定位、購物產(chǎn)生的交易記錄、社交媒體上的消息等,都不斷產(chǎn)生并被收集起來。這使得我們的生活無時不在與數(shù)據(jù)相交,幾乎人人都成為數(shù)據(jù)的生成者與被生成者。

第二段:大數(shù)據(jù)對商業(yè)和消費者的影響。

大數(shù)據(jù)不僅為商業(yè)帶來了前所未有的機遇,也為消費者帶來便利。通過對海量數(shù)據(jù)的分析,企業(yè)可以更好地了解市場趨勢和消費者的行為模式,從而調整產(chǎn)品策略和市場推廣方案。例如,紀錄片中提到了亞馬遜利用大數(shù)據(jù)優(yōu)化倉儲和物流,從而提高了交易效率和客戶滿意度。消費者也因此受益,他們可以通過推薦算法等技術獲得更符合個人需求的產(chǎn)品和服務。然而,大數(shù)據(jù)也為消費者帶來了隱私泄露和信息濫用的風險。

第三段:大數(shù)據(jù)在社會管理中的應用。

紀錄片進一步揭示了大數(shù)據(jù)在社會管理中的廣泛應用。政府通過對交通數(shù)據(jù)、公共衛(wèi)生數(shù)據(jù)等的深度分析,可以更好地制定交通規(guī)劃和疫情防控策略。大數(shù)據(jù)還幫助警察從海量監(jiān)控視頻中找到犯罪線索,提高了犯罪偵查的效率。然而,大數(shù)據(jù)的應用也帶來了一些爭議,例如在抗擊新冠疫情過程中,社交媒體上的大數(shù)據(jù)分析被用于實名制和處罰非法外出等措施,引發(fā)了個人隱私權和公共安全之間的權衡和討論。

第四段:個人隱私保護的重要性。

大數(shù)據(jù)時代的到來,使得個人隱私保護變得愈發(fā)重要。紀錄片中提到了歐盟制定的《通用數(shù)據(jù)保護條例》,旨在加強對個人數(shù)據(jù)的保護。我們也需要在日常生活中保護好自己的個人信息,不隨意泄露給他人。同時,社會各界也應加強法律法規(guī)的制定和監(jiān)管力度,確保大數(shù)據(jù)應用的合理性和合法性。

紀錄片最后提到了大數(shù)據(jù)時代對個人發(fā)展和教育的影響。大數(shù)據(jù)使得人才需求不再僅僅停留在專業(yè)技能層面,數(shù)據(jù)科學和數(shù)據(jù)分析技能成為了追求職業(yè)發(fā)展的熱門方向。在教育方面,大數(shù)據(jù)也可以為學生提供個性化的學習和教學方案,促進學生的全面發(fā)展。

總結:

《大數(shù)據(jù)時代第集》這部紀錄片給我?guī)砹藢Υ髷?shù)據(jù)時代的全新認識。大數(shù)據(jù)的涌現(xiàn)為商業(yè)、消費者、社會管理和個人發(fā)展等帶來了巨大的機遇和挑戰(zhàn)。我們需要認識到大數(shù)據(jù)的廣泛應用并保護好個人隱私,同時也應關注大數(shù)據(jù)在社會中的不公正應用,并尋找解決之道。只有合理應用和平衡發(fā)展,才能使大數(shù)據(jù)更好地為社會進步和個人發(fā)展作出貢獻。

大數(shù)據(jù)時代讀書心得篇十五

世界正邁入大數(shù)據(jù)、云計算的時代,人類朝著數(shù)據(jù)化、數(shù)字化的方向發(fā)足狂奔,我們原有的科學、技術、工作和生活方式正在被信息技術所改寫,很多科學領域會被大數(shù)據(jù)技術所替代,也會崛起很多新興科學家和職業(yè),譬如數(shù)據(jù)科學家、數(shù)據(jù)中間商等。大數(shù)據(jù)會顛覆很多的產(chǎn)業(yè)和行業(yè),甚至一夜之間就能變換運營模式,因為在大數(shù)據(jù)面前,人類不會再向以前那樣追尋著“為什么”,更多的是在樣本和概率面前做著商業(yè)決策的調整,“快”和“實用”更能滿足大眾的需求。

數(shù)據(jù)之大,漫無邊際,無窮無盡,包含著我們人類的一呼一吸,一舉一動。處在大數(shù)據(jù)帝國的前夜,眺望星空,這是個最好的時代,因為數(shù)據(jù)時代轉折的重要性,不亞于黑猩猩站立起來行走劃時代,很多科幻片里的場景會出現(xiàn)在我們的日常;這也會是個最壞的時代,因為人類最終會為此走向哪里,只有蒼穹能知道!

當我們擁有海量數(shù)據(jù)時,絕對的精準不再是我們追求的主要目標,我們樂于接受數(shù)據(jù)的紛繁復雜,也只有接受不精確性,我們才能打開一扇從未涉足的世界的窗戶。

大數(shù)據(jù)時代讀書心得篇十六

如今說起新媒體和互聯(lián)網(wǎng),必提大數(shù)據(jù),似乎不這樣說就out了。而且人云亦云的居多,不少談論者甚至還沒有認真讀過這方面的經(jīng)典著作——舍恩佰格的《大數(shù)據(jù)時代》。維克托·邁爾——舍恩伯格何許人也?他現(xiàn)任牛津大學網(wǎng)絡學院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,曾任哈佛大學肯尼迪學院信息監(jiān)管科研項目負責人。他的咨詢客戶包括微軟、惠普和ibm等全球頂級企業(yè),他是歐盟互聯(lián)網(wǎng)官方政策背后真正的制定者和參與者,他還先后擔任多國政府高層的智囊。這位被譽為:大數(shù)據(jù)時代的預言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應的理論功底,就能與之進行一場思想上的對話。

一讀。

舍恩伯格分三部分來討論大數(shù)據(jù),即思維變革、商業(yè)變革和管理變革。在第一部分“大數(shù)據(jù)時代的思維變革”中,舍恩伯格旗幟鮮明的亮出他的三個觀點:一、更多:不是隨機樣本,而是全體數(shù)據(jù);二、更雜:不是精確性,而是混雜性;三、更好:不是因果關系,而是相關關系。對于第一個觀點,我不敢茍同。一方面是對全體數(shù)據(jù)進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對于簡單事實進行判斷的數(shù)據(jù)分析難道也要采集全體數(shù)據(jù)嗎?我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數(shù)據(jù)分析的專家,他認為一定可以找到一種數(shù)理統(tǒng)計方法來進行分析,并不一定需要全部數(shù)據(jù)。聯(lián)系到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數(shù)據(jù)不是指數(shù)量而是指范圍,即大數(shù)據(jù)的隨機樣本不限于目標數(shù)據(jù),還包括目標以外的所有數(shù)據(jù)。我認為大數(shù)據(jù)分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。

我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。“大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的復雜算法更有效?!备哂泻暧^視野和東方哲學思維。對于舍恩伯格的第三個觀點,我也不能完全贊同。“不是因果關系,而是相關關系。”不需要知道“為什么”,只需要知道“是什么”。傳播即數(shù)據(jù),數(shù)據(jù)即關系。在小數(shù)據(jù)時代人們只關心因果關系,對相關關系認識不足,大數(shù)據(jù)時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數(shù)據(jù)從何而來?為何而用?如果我們完全忽略因果關系,不知道大數(shù)據(jù)產(chǎn)生的前因后果,也就消解了大數(shù)據(jù)的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。

世間萬物的復雜性多樣化并非非此即彼那么簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什么語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出“不是因果關系,而是相關關系?!边@一論斷時,他在書中還說道:“在大多數(shù)情況下,一旦我們完成了對大數(shù)據(jù)的相關關系分析,而又不再滿足于僅僅知道‘是什么’時,我們就會繼續(xù)向更深層次研究的因果關系,找出背后的‘為什么’?!盵i]由此可見,他說的全體數(shù)據(jù)和相關關系都在特定語境下的,是在數(shù)據(jù)挖掘中的選項。

大數(shù)據(jù)研究的一大驅動力就是商用,舍恩伯格在第二部分里討論了大數(shù)據(jù)時代的商業(yè)變革。舍恩伯格認為數(shù)據(jù)化就是一切皆可“量化”,大數(shù)據(jù)的定量分析有力地回答“是什么”這一問題,但仍然無法完全回答“為什么”。因此,我認為并不能排除定性分析和質化研究。數(shù)據(jù)創(chuàng)新可以創(chuàng)造價值,這是毫無疑問的。舍恩伯格在討論大數(shù)據(jù)的角色定位時仍把它置于數(shù)據(jù)應用的商業(yè)系統(tǒng)中,而沒有把它置于整個社會系統(tǒng)里,但他在第二部分大數(shù)據(jù)時代的管理變革中討論了這個問題。在風險社會中信息安全問題日趨凸顯,數(shù)據(jù)獨裁與隱私保護成為一對矛盾。如何擺脫大數(shù)據(jù)的困境?舍恩伯格在最后一節(jié)“掌控”中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:“大數(shù)據(jù)并不是一個充斥著算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來?!敝x謝舍恩伯格!讓大數(shù)據(jù)討論從自然科學回到人文社科。由此推斷,《大數(shù)據(jù)時代》不是最終答案,也不是標準答案,只是參考答案。

此外,在閱讀此書之前還必須具備一些數(shù)據(jù)科學的基本知識和基本概念,比如說什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來就比較好懂了。

再讀。

概念是研究的邏輯起點,“大數(shù)據(jù)”到底是什么?在百度上搜索到的解釋是,“大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊?!贝髷?shù)據(jù)的4v特點:數(shù)量(volume)、速度(velocity)、品種(variety)和真實性(veracity)。但舍恩伯格認為大數(shù)據(jù)并非一個確切的概念。他在書中的一段詮釋更具人文色彩和社會意義:“大數(shù)據(jù)是人們獲得新的認知、創(chuàng)造新的價值的源泉;大數(shù)據(jù)還是改變市場、組織機構,以及政府與公民關系的方法?!盵ii]其實,概念的界定要看研究者從哪個角度來研究它而定。

科學家的治學態(tài)度是嚴謹?shù)?,而人文學家更具有想象力。一些對大數(shù)據(jù)不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格認為大數(shù)據(jù)的核心是預測?!按髷?shù)據(jù)不是要教機器像人一樣思考。相反,把數(shù)學算法運用到海量的數(shù)據(jù)上來預期事情發(fā)生的可能性。”[iii]舍恩伯格甚至不回避大數(shù)據(jù)所產(chǎn)生的負面影響,他在第七章里談到讓數(shù)據(jù)主宰一切的隱憂。我覺得這是實事求是的科學態(tài)度。在量子力學里有一個測不準原理:一個微觀粒子的某些物理量(如位置和動量,或方位角與動量矩,還有時間和能量等),不可能同時具有確定的數(shù)值,其中一個量越確定,另一個量的不確定程度就越大。它是解釋微觀世界的物理現(xiàn)象,信息社會中的大數(shù)據(jù)會不會也有類似情況呢?如果我們再把凱文·凱利的《失控》對比來讀的話就更有意思了,這樣我們對整個物質世界及至人類社會就有了更全面更深刻的洞察,從物理王國到生物世界,再到信息社會。從公共衛(wèi)生到商業(yè)應用,從個人隱私到政府管理,大數(shù)據(jù)無處不在。與此同時,從哪個角度探討用什么方法研究,舍恩伯格都不會忘記大數(shù)據(jù)服務人類造福人類的終極目的和價值所在?!按髷?shù)據(jù)并不是一個充斥著運算法則和機器的冰冷世界,其中仍需要人類扮演重要角色。人類獨有的弱點、錯覺、錯誤都是十分必要的,因為這些特性的另一頭牽著的是人類的創(chuàng)造力、直覺和天賦。偶爾也會帶來屈辱或固執(zhí)的同樣混亂的大腦運作,也能帶來成功,或在偶然間促成我們的偉大。這提示我們應該樂于接受類似的不準確,因為不準確正是我們之所以為人的特征之一?!盵iv]用中國話來說就是“人無完人”,人類在收獲大數(shù)據(jù)帶來的紅利的同時也要承受它帶來的危害。這不是對立統(tǒng)一的辯證唯物主義?我把它看作帶著歐洲批判學派色彩的科學發(fā)展觀。

問題是研究的價值基點,“大數(shù)據(jù)”不是舍恩伯格研究的問題,而是研究對象,他研究的是數(shù)據(jù)處理和信息管理問題,同時也討論信息安全和網(wǎng)絡倫理問題,還引發(fā)哲學上的思考,哲學史上爭論不休的世界可知論和不可知論轉變?yōu)閷嵶C科學中的具體問題??芍允墙^對的,不可知性是相對的?!按髷?shù)據(jù)”之所以為大是因它引發(fā)人類生活、工作和思維的大變革,從這個意義上來看,《大數(shù)據(jù)時代》的意義不僅在于它討論了若干重大問題,而且對研究者開出了一個問題清單,從而引發(fā)更多人來探討這些有趣的問題。

《大數(shù)據(jù)時代》實際上主要是一本討論數(shù)據(jù)挖掘的書,數(shù)據(jù)挖掘與數(shù)據(jù)分析是不同的概念,數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中自動搜索隱藏于其中的有著特殊關系性的信息的過程。數(shù)據(jù)挖掘通常與計算機科學有關,并通過統(tǒng)計、在線分析處理、情報檢索、機器學習、專家系統(tǒng)(依靠過去的經(jīng)驗法則)和模式識別等諸多方法來實現(xiàn)上述目標。而數(shù)據(jù)分析的目的是把隱沒在一大批看來雜亂無章的數(shù)據(jù)中的信息集中、萃取和提煉出來,以找出所研究對象的內在規(guī)律。數(shù)據(jù)挖掘主要運用計算機來進行處理,而數(shù)據(jù)分析既要用計算機也要人工分析,是計算機科學與人文價值判斷的統(tǒng)一結合。換言之,《大數(shù)據(jù)時代》并不是一本討論大數(shù)據(jù)所有問題的書。

《大數(shù)據(jù)時代》也是一本討論互聯(lián)網(wǎng)發(fā)展的書,從數(shù)字化到數(shù)據(jù)化,同時有濃厚的未來學色彩。當文字變成數(shù)據(jù),我們進入了互聯(lián)網(wǎng);當方位變成數(shù)據(jù),我們進入了物聯(lián)網(wǎng);當溝通變成數(shù)據(jù),我們進入了下一代互聯(lián)網(wǎng)。一切可量化,萬物皆數(shù)據(jù),正是當今互聯(lián)網(wǎng)世界的真實寫照。面對于這樣的世界及世界的未來,在《大數(shù)據(jù)時代》出現(xiàn)最多的詞是“思維”和“方法”,因此也可以把這本書視為思維科學應用研究的書。

此外,在閱讀此書之前還必須具備一些數(shù)據(jù)科學的基本知識和基本概念,比如說什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來就比較好懂了。

三讀。

今年國慶節(jié)前一天,中共中央政治局們來到中關村搞集體學習,調研、講解、討論創(chuàng)新驅動發(fā)展戰(zhàn)略。包括、在內的七位全部出動來到中關村,這是歷史上沒有過的,百度、聯(lián)想和小米的負責人,有了一次直面最高層匯報工作的機會。雷軍和柳傳志,講解的都是本公司的各種情況,李彥宏則沒有講百度的廣告業(yè)務發(fā)展得如何好,而是講起了大數(shù)據(jù)。在講解中,李彥宏認為大數(shù)據(jù)有兩個重要價值,一是促進信息消費,加快經(jīng)濟轉型升級;二是關注社會民生,帶動社會管理創(chuàng)新。這些價值也是目前黨和國家領導人最為重視的,可見《大數(shù)據(jù)時代》既有理論價值也有現(xiàn)實意義。

當今大數(shù)據(jù)正在影響著新聞傳媒業(yè),大數(shù)據(jù)新聞、大數(shù)據(jù)營銷、輿情分析、受眾(用戶)研究……數(shù)據(jù)分析師變身新聞編輯,大數(shù)據(jù)正改變新聞生產(chǎn)流程、大數(shù)據(jù)在創(chuàng)造傳媒新業(yè)態(tài)。“不妨想象一下,隨著數(shù)據(jù)的進一步增加,坐擁用戶資源的新媒體們完全有能力通過數(shù)據(jù)挖掘,分析用戶癖好,向電視臺定制一部電視劇甚至向好萊塢定制一部電影。到那個時候,電視臺一如那些家電廠商們,曾經(jīng)產(chǎn)業(yè)鏈的上游‘王者’,將徹底成為一個產(chǎn)業(yè)鏈最低端的內容代工廠?!盵v]然而,情形也遠沒有人們想象的那么樂觀,李彥宏指出目前多數(shù)所謂的大數(shù)據(jù)公司其實還是空殼子,因為數(shù)據(jù)還沒有完全開放。他認為必須在政府層面上推動才能真正實現(xiàn)大數(shù)據(jù)的開發(fā)與利用。我在討論大數(shù)據(jù)時代的輿情監(jiān)測與預警時說道:“經(jīng)典自由主義傳播學說對媒體的定位:秉持公正、客觀立場的媒體被稱為代表公眾監(jiān)督政府行為的‘看門狗’。其實,媒體既是公眾利益也是國家利益的‘看門狗’。要看好門就要瞭望、洞察社情民意,傳統(tǒng)媒體信息反饋渠道單一,視野、人力十分有限。而開放互動的新媒體平臺卻大有可為。作為公共信息發(fā)布平臺的微博可以成為政府及時了解社情民意,從而選擇正確治理路徑的‘導盲犬’。”[vi]遺憾的是目前我國的數(shù)據(jù)平臺還沒有完全開放,真正的大數(shù)據(jù)時代還沒有到來。

與國內不少教科書寫法的專著相比,國外的書寫得更有趣,尤其是大學者寫的,不僅視野開闊,而且能夠深入淺出?!洞髷?shù)據(jù)時代》不到22萬字,卻有上百個學術和商業(yè)的實例,豐富翔實的例子讓讀者感到通俗易懂,深奧的理論看起來也不費勁。這恐怕與舍恩伯格既是學者也是專家,既有理論又有實踐有關。反觀我們些學者故弄玄虛而示高明,實際上是把讀者拒之門外。我覺得優(yōu)秀的科學家也應該是一個科普作家,優(yōu)秀的學者也應該是一個不錯的傳播者。當然國外學術著作也有一個翻譯問題,這本書譯得還不錯。此外,《大數(shù)據(jù)時代》還附有不少it界名流的推薦意見,雖是出版商的發(fā)行所為,對解讀此書也不無益處。

除了《大數(shù)據(jù)時代》,舍恩伯格還有一本《刪除》也值得一讀。要研究大數(shù)據(jù)不能只讀一本書,該書譯者周濤教授還推薦了三部國內出版的大數(shù)據(jù)方面的專著:《證析》、《大數(shù)據(jù)》、《個性化:商業(yè)的未來》。相比《大數(shù)據(jù)時代》的宏大視野,這些書就大數(shù)據(jù)某一局部問題給出深刻的介紹和洞見。我也推薦讀一讀中國工程院李國杰院士和中科院計算所副總工程學旗合寫的文章《大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領域——大數(shù)據(jù)的研究現(xiàn)狀與科學思考》。

雖說開卷有益,但是由于每個人的時間精力有限,對于一個研究者來說,不讀什么書甚至比讀什么書更重要。我認為書有三種:有用的書,主要是應用類的專業(yè)書;無用的書,主要是形而上的思想類;無字的書,人間百態(tài),社會現(xiàn)實??善氐粦珡U。對于學生來講這三類“書”都該讀一些,對于研究者則要讀哪些解決關鍵問題的書,《大數(shù)據(jù)時代》就是這樣一部書。當然,并非第一個讀者都是研究大數(shù)據(jù)的,但進入大數(shù)據(jù)時代,還有什么東西與數(shù)據(jù)完全沒有關系呢?麥肯錫全球研究機構認為,未來十年里有12項對經(jīng)濟發(fā)展產(chǎn)生重大影響的技術,其中包括三項新媒體技術:移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和云計算。這三項新媒體技術都與大數(shù)據(jù)密切相關,而這些新媒體新技術的發(fā)展都影響著當今的新聞傳播業(yè)。閱讀此書至少給我們研究新聞傳播學帶來一些啟迪。我覺得一本書的價值不在于讓你頂禮膜拜,而是引發(fā)廣泛而深入的討論。

“凡是過去,皆為序曲?!弊x完此書,我們對大數(shù)據(jù)的認識才剛剛開始。

【本文地址:http://aiweibaby.com/zuowen/19025390.html】

全文閱讀已結束,如果需要下載本文請點擊

下載此文檔