在當(dāng)前的數(shù)據(jù)管理環(huán)境中,企業(yè)必須處理數(shù)量難以想象的多樣化、分散的數(shù)據(jù)。在這種孤立的數(shù)據(jù)和內(nèi)容的復(fù)雜性中,有價(jià)值的業(yè)務(wù)洞察和機(jī)會(huì)就會(huì)丟失。
毫不奇怪,過去十年見證了企業(yè)數(shù)據(jù)管理的范式轉(zhuǎn)變,導(dǎo)致知識(shí)圖譜利用的增加。知識(shí)圖譜提供統(tǒng)一的信息訪問、靈活的數(shù)據(jù)集成和數(shù)據(jù)管理任務(wù)的自動(dòng)化,對(duì)各行業(yè)的許多系統(tǒng)和流程產(chǎn)生巨大影響。
知識(shí)圖譜的價(jià)值主張知識(shí)圖譜還可以充當(dāng)中央樞紐,不僅匯集實(shí)際數(shù)據(jù),還匯集元數(shù)據(jù)。這使企業(yè)能夠全面了解所有信息,并更好地理解其不同部分之間的關(guān)系。
使用語義建模技術(shù)(例如本體和受控詞匯)允許知識(shí)圖譜定義數(shù)據(jù)之間的精確含義和關(guān)系。這解決了困擾傳統(tǒng)數(shù)據(jù)管理系統(tǒng)的模糊性問題。
知識(shí)圖譜的另一個(gè)獨(dú)特能力是,它們可以通過利用背景知識(shí)作為解釋的上下文來增強(qiáng)其專有信息。這意味著除了圖譜中包含的數(shù)據(jù)之外,還可以集成外部知識(shí)源,以提供對(duì)數(shù)據(jù)更豐富、更全面的理解。
數(shù)據(jù)的價(jià)值取決于我們有效使用它的能力。如今,企業(yè)擁有的大量數(shù)據(jù)需要實(shí)時(shí)處理、理解和利用。傳統(tǒng)的數(shù)據(jù)管理方法已不足以滿足當(dāng)前的需求。越來越多的企業(yè)意識(shí)到以不同方式管理數(shù)據(jù)的重要性,以降低成本、改善維護(hù)、釋放潛在收入并獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。
知識(shí)圖譜為許多數(shù)據(jù)管理挑戰(zhàn)提供了可行的解決方案。它們適合每個(gè)組織,無論其規(guī)模大小,并且可以輕松處理現(xiàn)代數(shù)據(jù)生態(tài)系統(tǒng)固有的多樣性和缺乏集中控制的問題。
讓我們來看看企業(yè)數(shù)據(jù)管理當(dāng)今面臨的一些挑戰(zhàn)以及知識(shí)圖譜如何解決這些挑戰(zhàn)。
挑戰(zhàn)1:數(shù)據(jù)源和類型的多樣性傳統(tǒng)上,數(shù)據(jù)表示與特定格式緊密耦合,這決定了數(shù)據(jù)的組織和存儲(chǔ)方式。因此,信息和通信技術(shù)基礎(chǔ)設(shè)施需要支持跨各種系統(tǒng)的各種數(shù)據(jù)格式和類型。這還包括以超出其原始目的的方式使用的遺留系統(tǒng)。
隨著數(shù)據(jù)的目的或用途隨著時(shí)間的推移而變化,可以修改底層模型,而無需完全重構(gòu)數(shù)據(jù)。這種靈活性使企業(yè)能夠更好地響應(yīng)不斷變化的業(yè)務(wù)需求或數(shù)據(jù)要求。
挑戰(zhàn)2:斷開數(shù)據(jù)與現(xiàn)實(shí)世界的聯(lián)系當(dāng)以直觀的方式組織和訪問信息時(shí),關(guān)系數(shù)據(jù)庫(kù)有很大的局限性。“關(guān)系數(shù)據(jù)庫(kù)”是一個(gè)矛盾的說法。在此類數(shù)據(jù)庫(kù)中,關(guān)系并不是一等公民。它們僵化的表格結(jié)構(gòu)無法捕捉現(xiàn)實(shí)生活數(shù)據(jù)固有的復(fù)雜性和豐富的互連性,這通常會(huì)導(dǎo)致妥協(xié)、簡(jiǎn)化和阻抗不匹配。
因此,傳統(tǒng)的數(shù)據(jù)管理解決方案通常依賴于人類的努力,以符合可用軟件的方式組織現(xiàn)實(shí)世界的信息。這需要大量的前期規(guī)劃和模式設(shè)計(jì)來確定如何存儲(chǔ)、連接和查詢數(shù)據(jù)。
相比之下,知識(shí)圖譜直觀地組織信息。通過實(shí)現(xiàn)數(shù)據(jù)的富有表現(xiàn)力和靈活的表示,圖形結(jié)構(gòu)捕獲不同信息之間的關(guān)系并提供更豐富的上下文。這使企業(yè)能夠以密切反映其對(duì)該領(lǐng)域理解的方式處理數(shù)據(jù)。它還可以帶來更好的洞察、決策和數(shù)據(jù)資源的利用。
許多企業(yè)未能正確使用他們的數(shù)據(jù),因?yàn)閿?shù)據(jù)的表示方式掩蓋了其含義和底層建模假設(shè)。這限制了數(shù)據(jù)在這些假設(shè)被明確硬編碼的系統(tǒng)中的可用性。它還使得與其他系統(tǒng)集成數(shù)據(jù)或在不同環(huán)境中利用數(shù)據(jù)變得困難。
知識(shí)圖譜中數(shù)據(jù)的表示符合人類和機(jī)器都可以明確解釋的形式含義。這樣可以清楚地理解其內(nèi)容。這種語義形式主義支持自動(dòng)推理,從而產(chǎn)生新的數(shù)據(jù)驅(qū)動(dòng)的見解以及識(shí)別隱藏的模式或關(guān)系。
通過利用知識(shí)圖譜的語義豐富性,企業(yè)可以更好地執(zhí)行重要任務(wù),例如回答復(fù)雜查詢、進(jìn)行預(yù)測(cè)或生成建議。他們可以跟蹤流經(jīng)企業(yè)的數(shù)據(jù)、監(jiān)控其質(zhì)量、發(fā)現(xiàn)錯(cuò)誤并追蹤其源頭,從而減少不良數(shù)據(jù)質(zhì)量和數(shù)據(jù)重復(fù)。知識(shí)圖提供基于豐富且鏈接的元數(shù)據(jù)的高質(zhì)量數(shù)據(jù)。
挑戰(zhàn)4:剛性和脆弱模式數(shù)據(jù)管理的傳統(tǒng)方法要求基于對(duì)所有需求的假定理解,預(yù)先定義詳盡的數(shù)據(jù)模式。然而,從一開始就完全掌握業(yè)務(wù)案例的復(fù)雜性并捕獲單個(gè)模式中所有可能的屬性和關(guān)系幾乎是不可能的。
業(yè)務(wù)的動(dòng)態(tài)性質(zhì)和不斷變化的數(shù)據(jù)需求使得期望單個(gè)模式長(zhǎng)期保持適用和有效是不可想象的。不斷變化的技術(shù)、市場(chǎng)趨勢(shì)和業(yè)務(wù)需求需要適應(yīng)性強(qiáng)的數(shù)據(jù)管理方法。
好消息是知識(shí)圖譜能夠以靈活且可擴(kuò)展的方式對(duì)數(shù)據(jù)進(jìn)行建模。隨著新數(shù)據(jù)需求的出現(xiàn),它們?cè)试S添加或修改模式元素,而無需對(duì)現(xiàn)有結(jié)構(gòu)進(jìn)行徹底檢修。這使企業(yè)能夠跟上不斷變化的業(yè)務(wù)需求和未來需求。
挑戰(zhàn)5:數(shù)據(jù)孤島數(shù)據(jù)孤島是高效使用數(shù)據(jù)的最大障礙之一,企業(yè)通常會(huì)轉(zhuǎn)而使用點(diǎn)對(duì)點(diǎn)數(shù)據(jù)集成作為快速解決方法。然而,每次集成都會(huì)顯著增加開發(fā)時(shí)間、復(fù)雜性、資源和工作量,從而減慢依賴及時(shí)和準(zhǔn)確信息的關(guān)鍵業(yè)務(wù)流程。
最重要的是,這種方法往往無法解決根本問題。當(dāng)數(shù)據(jù)被隔離并限制在特定系統(tǒng)或部門內(nèi)時(shí),就會(huì)出現(xiàn)數(shù)據(jù)孤島。此類集成僅在選定的系統(tǒng)之間建立直接連接,從而導(dǎo)致集成環(huán)境分散。
另一方面,知識(shí)圖譜的互聯(lián)性質(zhì)使企業(yè)能夠更有效地重用現(xiàn)有數(shù)據(jù)資產(chǎn),并輕松整合外部第三方數(shù)據(jù)源。這使他們能夠在全球信息背景下利用其專有知識(shí),并增強(qiáng)業(yè)務(wù)分析、決策和創(chuàng)新。
在構(gòu)建知識(shí)圖譜時(shí)使用開放標(biāo)準(zhǔn)不僅可以確?;ゲ僮餍圆⒋龠M(jìn)多個(gè)領(lǐng)域數(shù)據(jù)的集成,而且還可以避免專有格式和供應(yīng)商鎖定。它們連接不同數(shù)據(jù)集中的記錄之間的實(shí)體以獲得 360 度視圖。知識(shí)圖譜擅長(zhǎng)提供以實(shí)體為中心的視圖,其中包含跨異構(gòu)數(shù)據(jù)源的數(shù)據(jù)。
挑戰(zhàn)6:昂貴的數(shù)據(jù)管理正如我們已經(jīng)討論過的,處理各種數(shù)據(jù)格式和類型、對(duì)手動(dòng)工作的依賴以及永無休止的數(shù)據(jù)集成項(xiàng)目給企業(yè)數(shù)據(jù)管理的總體成本和時(shí)間安排帶來了壓力。
知識(shí)圖譜方法提供了許多具有成本效益的好處。例如,重用數(shù)據(jù)的能力使企業(yè)能夠更好地利用不同應(yīng)用程序、項(xiàng)目和團(tuán)隊(duì)的現(xiàn)有數(shù)據(jù)資產(chǎn)。使用鏈接開放數(shù)據(jù)引導(dǎo)系統(tǒng)可以降低數(shù)據(jù)采集和維護(hù)的成本。靈活的圖形模型消除了詳盡(且昂貴?。⒚嫦蛭磥淼哪J皆O(shè)計(jì)和重新設(shè)計(jì)的需要。這個(gè)清單還可以一直列下去。
挑戰(zhàn)7:時(shí)間和資源有限對(duì)于各行各業(yè)的大多數(shù)企業(yè)來說,大部分?jǐn)?shù)據(jù)仍未開發(fā)、不可見、無法訪問,只有一小部分?jǐn)?shù)據(jù)得到積極使用。大量數(shù)據(jù)與有限的處理能力之間的差異阻礙了他們提取有意義的信息和得出可行見解的能力。
通過捕獲概念之間豐富的語義關(guān)系,知識(shí)圖譜以實(shí)現(xiàn)推理能力、復(fù)雜的分析和隱藏模式的發(fā)現(xiàn)。它們構(gòu)成了每個(gè)人工智能和分析平臺(tái)的強(qiáng)大支柱,使用戶能夠?qū)崟r(shí)發(fā)現(xiàn)數(shù)據(jù)中鎖定的見解。
結(jié)論豐富的數(shù)據(jù)需要一個(gè)與我們對(duì)信息、領(lǐng)域和上下文的復(fù)雜理解相一致的數(shù)據(jù)模型。為了讓數(shù)據(jù)變得智能,我們需要放棄不靈活的數(shù)據(jù)模式,選擇能夠代表現(xiàn)實(shí)世界及其豐富而復(fù)雜的關(guān)系的數(shù)據(jù)模型。當(dāng)以具有正式語義的機(jī)器可讀格式完成此操作時(shí),它可以實(shí)現(xiàn)自動(dòng)推理,從而補(bǔ)充和促進(jìn)人類專業(yè)知識(shí)和決策。
語義知識(shí)圖譜滿足了這些要求,并在各個(gè)行業(yè)的許多數(shù)據(jù)和信息密集型服務(wù)中找到了應(yīng)用。通過將它們作為數(shù)據(jù)管理策略的基本組成部分,企業(yè)可以應(yīng)對(duì)現(xiàn)代數(shù)據(jù)環(huán)境的復(fù)雜性,并使他們的數(shù)據(jù)和決策更加智能、更快和數(shù)據(jù)驅(qū)動(dòng)。
- End -