隨著大數據時代的到來,我們生活中的方方面面也都離不開大數據的存在,那么關于大數據我們真的了解嗎?或許在很多方面我們都對大數據有一定錯誤的認知,今天就隨千鋒小編一起來看看關于大數據的常見無解有哪些。
數據不等于信息
經常有人把數據和信息當作同義詞來用。其實不然,數據指的是一個原始的數據點(無論是通過數字,文字,圖片還是視頻等等),信息則直接與內容掛鉤,需要有資訊性(informative)。數據越多,不一定就能代表信息越多,更不能代表信息就會成比例增多。有個簡單的例子:
備份,很多人如今已經會定期的對自己的硬盤進行備份。這個沒什么好多解釋的,每次備份都會創造出一組新的數據,但信息并沒有增多。
信息不等于智慧
現在我們去除了數據中所有重復的部分,也整合了內容類似的數據,現在我們剩下的全是信息了,這對我們就一定有用嗎?不一定,信息要能轉化成智慧,至少要滿足一下三個標準:
第一,可破譯性。這可能是個大數據時代特有的問題,越來越多的企業每天都會生產出大量的數據,卻還沒想好怎么用,因此,他們就將這些數據暫時非結構化的存儲起來。這些非結構化的數據卻不一定可破譯。
第二,關聯性。無關的信息,至多只是噪音。
第三,新穎性。這里的新穎性很多時候無法僅僅根據我們手上的數據和信息進行判斷。舉個例子,某電子商務公司通過一組數據/信息,分析出了客戶愿意為當天送貨的產品多支付10塊錢,然后又通過另一組完全獨立的數據/信息得到了同樣的內容,這樣的情況下,后者就不具備新穎性。不幸的是,很多時候,我們只有在處理了大量的數據和信息以后,才能判斷它們的新穎性。
其實,對于大數據的問題涉及到很多層面,以上所說的僅僅是一小部分,如果你想了解更多,可以到千鋒大數據培訓看一看!