話題:
工業(yè)大數(shù)據(jù)可視化面臨的難點有哪些 |
183.17.229.* 2020-09-14 13:16:02 |
數(shù)據(jù)可視化技術(shù)**代應(yīng)該是報表軟件,通過報表系統(tǒng)能夠把復(fù)雜的數(shù)據(jù)整理成規(guī)則的表格,并配以漂亮的圖形,比如柱圖、餅圖、折線圖等等。第二代當屬BI(BusinessIntelligence)了,BI比起簡單的報表又更進了異步,它已經(jīng)不單單是一個工具軟件,而是一套完整的解決方案,可以將企業(yè)中現(xiàn)有的數(shù)據(jù)進行**的整合,快速準確的提供報表并提出決策依據(jù),幫助企業(yè)做出明智的業(yè)務(wù)經(jīng)營決策。
進入大數(shù)據(jù)時代,數(shù)據(jù)可視化這個說法慢慢的流行起來,究其原因,一個是因為大數(shù)據(jù)的展示比起以前的數(shù)據(jù)展示有不同的地方,**的難點就是面對如此巨大的數(shù)據(jù),如何比較好的展示給用戶,成為前臺程序員面臨的難題。另一個是隨著近幾年技術(shù)的發(fā)展,我們可以通過更多的形式,例如三維模型、動畫、視頻、動態(tài)交互式頁面、手機APP等將數(shù)據(jù)以展示、推送、提醒、互動等等模式提供給用戶,其復(fù)雜度上升了一個數(shù)量級,因此,漸漸地,數(shù)據(jù)可視化就成為一個專門的領(lǐng)域,成為了大數(shù)據(jù)時代的一個研究分支,無數(shù)**的工程師和設(shè)計者為這個領(lǐng)域做出了貢獻。
具體到工業(yè)大數(shù)據(jù)領(lǐng)域,其可視化又有自己獨特的特點,呈現(xiàn)出與互聯(lián)網(wǎng)大數(shù)據(jù)可視化不同的難點和方向,我總結(jié)了一下,工業(yè)大數(shù)據(jù)可視化有以下幾個特點:
數(shù)據(jù)量呈現(xiàn)海量趨勢,且更新頻率極高。由于工業(yè)大數(shù)據(jù)主要來源于傳感器的數(shù)據(jù)采集,因此其數(shù)據(jù)量相比傳統(tǒng)互聯(lián)網(wǎng)大數(shù)據(jù)只多不少,而且,它的更新頻率極高,傳感器按照恒定的頻率快速更新。在這種情況下,如何保證監(jiān)控頁面的數(shù)據(jù)實時更新,還能夠讓監(jiān)控人員看數(shù)據(jù)的變化,就是需要研究的問題。當某個數(shù)據(jù)每秒更新10次,那么,屏幕上的數(shù)字直接變化就是無意義的,因為監(jiān)控人員根本就一個數(shù)字都看不到。如何兼顧數(shù)字的更新頻率與視覺效果,就成為可視化的**個難題。
大量的監(jiān)控點,無法進行**地顯示。一臺普通的設(shè)備,可能就有上百個傳感器,再加上相關(guān)的視頻、環(huán)境、人員等等監(jiān)測,可能會有幾百個監(jiān)測數(shù)據(jù)是這個設(shè)備需要的,那么,這么多的數(shù)據(jù)如何在有限的屏幕上進行排列,如何取舍,成為可視化的第二個難題。
整體與局部如何**地結(jié)合。一個企業(yè)會有許多下屬的分子公司,下屬企業(yè)又會有車間、工作面等等工作場景,每個工作場景又會有許多設(shè)備。這樣層層嵌套的可視化局面如何比較好的結(jié)合,在保障使用人員看到整體的時候,還能夠同時關(guān)注到局部的數(shù)據(jù)變化,是可視化的第三個難題。
局部與細節(jié)如何兼顧。在一個局部的數(shù)據(jù)展示中,我們還希望看到數(shù)據(jù)的細節(jié),包括相關(guān)的數(shù)據(jù)、歷史的數(shù)據(jù)、異常的數(shù)據(jù)、數(shù)據(jù)的趨勢、數(shù)據(jù)的預(yù)測等等,能否把握好局部與細節(jié)的展示關(guān)系,是可視化的第四個難題。
如何實現(xiàn)工業(yè)數(shù)據(jù)的**檢索和**推送。也就是常說的“數(shù)據(jù)找人”,在互聯(lián)網(wǎng)企業(yè),利用大數(shù)據(jù)分析用戶的使用習(xí)慣和興趣愛好,尋找其感興趣的話題進行推送已經(jīng)是常見做法了,但在工業(yè)大數(shù)據(jù)領(lǐng)域,如何實現(xiàn)?一個報警信息,推送給誰?當前還是靠提前設(shè)好的規(guī)則,未來能否實現(xiàn)智能化,怎么實現(xiàn),相關(guān)的應(yīng)用還是比較少,這是可視化的第五個難題。
如何將數(shù)據(jù)轉(zhuǎn)化為**地信息提供給用戶。舉個生活中的例子,某路口實時車流100輛/分鐘,這是數(shù)據(jù),“嚴重擁堵”,這是信息。能否很好地將數(shù)據(jù)轉(zhuǎn)化為信息是可視化的第六個難題。
工業(yè)大數(shù)據(jù)可視化面臨的難點有哪些.中琛魔方大數(shù)據(jù)分析平臺(www.zcmorefun.com)表示相對而言,純技術(shù)的問題反而不是問題的關(guān)鍵,比如三維建模技術(shù)、圖表自動生成技術(shù)、數(shù)據(jù)檢索技術(shù)等。可視化更多的是對用戶和業(yè)務(wù)的理解,以及在這個基礎(chǔ)上對數(shù)據(jù)的深刻認識。 |
183.17.231.* 2020-09-21 13:12:33 |
大數(shù)據(jù)分析的過程是怎樣的
數(shù)據(jù)分析是指將整體分解為單獨的部分,以進行單獨檢查。數(shù)據(jù)分析是一個過程,用于獲得原始數(shù)據(jù)并將其轉(zhuǎn)換成用于由用戶決策有用的信息。收集并分析數(shù)據(jù)以回答問題,檢驗假設(shè)或推翻理論。
統(tǒng)計學(xué)家約翰·圖基(John Tukey)在1961年將數(shù)據(jù)分析定義為:“分析數(shù)據(jù)的程序,解釋此類程序結(jié)果的技術(shù),計劃數(shù)據(jù)收集以使其分析更容易,更精確或更準確的方式以及所有的機制和結(jié)果適用于分析數(shù)據(jù)的(數(shù)學(xué))統(tǒng)計信息。”
可以區(qū)分幾個階段,如下所述。這些階段是迭代的,因為后期階段的反饋可能會導(dǎo)致早期階段的其他工作。
1、數(shù)據(jù)的需求
要進行數(shù)據(jù)分析,數(shù)據(jù)是必須的,它是根據(jù)指導(dǎo)分析的人員或客戶的要求指定的。將在其上收集數(shù)據(jù)的實體的一般類型稱為實驗單位(例如,個體與群體)。可以指定和獲得有關(guān)人口的特定變量(例如男女人數(shù),收入水平等)。數(shù)據(jù)可以是數(shù)字的也可以是分類的(即數(shù)字的文本標簽)。
2、數(shù)據(jù)的收集
數(shù)據(jù)的收集來源方式很多,它是是從各種來源收集的。數(shù)據(jù)分析師可以將需求傳達給數(shù)據(jù)的管理人員,如組織內(nèi)的信息技術(shù)人員。還可以從環(huán)境中的傳感器(例如監(jiān)控,衛(wèi)星等)收集數(shù)據(jù)。也可以通過采訪,從在線資源下載或閱讀文檔來獲取數(shù)據(jù)。
3、數(shù)據(jù)的處理
數(shù)據(jù)的處理是用于將原始信息轉(zhuǎn)換為可操作的情報或知識的情報周期的各個階段在概念上類似于數(shù)據(jù)分析中的各個階段。
最初獲得的數(shù)據(jù)必須經(jīng)過處理或組織以便分析。例如,這些可能涉及將數(shù)據(jù)以表格格式(即結(jié)構(gòu)化數(shù)據(jù))放置在行和列中,以進行進一步分析,例如在電子表格或統(tǒng)計軟件中。
4、數(shù)據(jù)的清理
數(shù)據(jù)一旦經(jīng)過組織和處理,數(shù)據(jù)很有可能不完整,可能會包含重復(fù)項或包含錯誤。由于數(shù)據(jù)輸入和存儲方式存在問題,因此需要清理數(shù)據(jù)。數(shù)據(jù)清理是防止和糾正這些錯誤的過程。常見任務(wù)包括記錄匹配,識別數(shù)據(jù)不正確,現(xiàn)有數(shù)據(jù)的整體質(zhì)量,重復(fù)數(shù)據(jù)刪除和列分段。還可以通過各種分析技術(shù)來識別此類數(shù)據(jù)問題。例如,利用財務(wù)信息,可以將特定變量的總數(shù)與被認為可靠的單獨發(fā)布的數(shù)字進行比較。高于或低于預(yù)定閾值的異常量也可以進行檢查。數(shù)據(jù)**有幾種類型,具體取決于數(shù)據(jù)類型,例如電話號碼,電子郵件地址,雇主等。用于異常值檢測的定量數(shù)據(jù)方法可用于**可能輸入錯誤的數(shù)據(jù)。可以使用文本數(shù)據(jù)拼寫檢查器來減少輸入錯誤的單詞的數(shù)量,但是很難判斷單詞本身是否正確。
5、探索性數(shù)據(jù)分析
當我們**數(shù)據(jù)后,就可以對數(shù)據(jù)進行分析。數(shù)據(jù)分析師可以應(yīng)用稱為探索性數(shù)據(jù)分析的各種技術(shù)來開始理解數(shù)據(jù)中包含的消息。探索的過程可能會導(dǎo)致額外的數(shù)據(jù)清理或額外的數(shù)據(jù)請求,因此這些活動本質(zhì)上可能是迭代的。可能會生成描述性統(tǒng)計信息(例如平均值或中位數(shù))以幫助理解數(shù)據(jù)。數(shù)據(jù)可視化還可以用于檢查圖形格式的數(shù)據(jù),以獲得有關(guān)數(shù)據(jù)中消息的其他信息
6、建模和算法
可以將稱為算法的數(shù)學(xué)公式或模型應(yīng)用于數(shù)據(jù),以識別變量之間的關(guān)系,例如相關(guān)性或因果關(guān)系。一般而言,可以開發(fā)模型以基于數(shù)據(jù)中的其他變量評估數(shù)據(jù)中的特定變量,其中某些殘余誤差取決于模型的準確性(即,數(shù)據(jù)=模型+錯誤)。
推論統(tǒng)計包括測量特定變量之間關(guān)系的技術(shù)。例如,可以使用回歸分析來建模廣告的變化(自變量X)是否解釋了銷售的變化(因變量Y)。用數(shù)學(xué)術(shù)語來說,Y(銷售額)是X(廣告)的函數(shù)。可以將其描述為Y=aX+b+誤差,其中設(shè)計模型時,當模型在給定的X值范圍內(nèi)預(yù)測Y時,a和b將誤差最小化。分析師可能會嘗試建立描述數(shù)據(jù)的模型,以簡化分析并傳達結(jié)果。
7、數(shù)據(jù)的展示
一旦分析了數(shù)據(jù),就可以以多種格式將其報告給分析用戶,以支持他們的要求。用戶可能會有反饋,這會導(dǎo)致其他分析。因此,許多分析周期都是迭代的。
在確定如何傳達結(jié)果時,分析人員可以考慮使用數(shù)據(jù)可視化技術(shù)來幫助將信息清晰**地傳達給聽眾。數(shù)據(jù)可視化使用信息顯示(例如表格和圖表)來幫助傳達數(shù)據(jù)中包含的關(guān)鍵消息。表格對可能查找特定數(shù)字的用戶很有幫助,而圖表(例如,條形圖或折線圖)則可能有助于解釋數(shù)據(jù)中包含的定量信息。
大數(shù)據(jù)分析的過程是怎樣的.中琛魔方大數(shù)據(jù)分析平臺(www.zcmorefun.com)表示大數(shù)據(jù)分析的過程和結(jié)果都要依托于一個強大的計算機基礎(chǔ)架構(gòu),這對于處理大數(shù)據(jù)信息也是至關(guān)重要的,如果要開發(fā)一些交互的系統(tǒng),那么對于滿足不同的用戶需求是很重要的。 |