知識圖譜(Knowledge Graph),是一種以圖結(jié)構(gòu)的方式存儲、管理和查詢知識的方法,它通過對海量非結(jié)構(gòu)化的信息進行形式化建模,構(gòu)建一個相互關(guān)聯(lián)、層次分明、可理解的知識網(wǎng)絡(luò)。知識圖譜通常由節(jié)點(node)和邊(border)組成。節(jié)點是實體或概念,邊則是實體之間或概念與概念之間的關(guān)系。其中每個實體都有其相關(guān)的屬性,這些屬性從多個角度定義了一個實體的特征。
定義
知識圖譜是一種以圖結(jié)構(gòu)的方式存儲、管理和查詢知識的方法,它將海量非結(jié)構(gòu)化的信息進行形式化建模,構(gòu)建一個相互關(guān)聯(lián)、層次分明、可理解的知識網(wǎng)絡(luò)。將數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),提供了從數(shù)據(jù)中獲取信息、進行決策分析的能力。
通過對海量非結(jié)構(gòu)化信息進行形式化建模,構(gòu)建一個相互關(guān)聯(lián)、層次分明、可理解的知識網(wǎng)絡(luò),為各種智能應(yīng)用提供了底層支撐,使得智能應(yīng)用可以無縫嵌入到各種知識圖譜之中。
層次結(jié)構(gòu)
按照層次結(jié)構(gòu)可以分為四層:數(shù)據(jù)層、本體層、知識表示層、應(yīng)用層。
數(shù)據(jù)層包含三元組、實體、屬性和關(guān)系。本體層描述實體及其關(guān)系,本體層提供實體及其關(guān)系的形式化表示,是知識圖譜的核心和基礎(chǔ)。知識表示層是將本體和關(guān)系從數(shù)據(jù)中抽象出來的過程,是知識圖譜的表現(xiàn)形式。應(yīng)用層包括應(yīng)用系統(tǒng)、知識庫和數(shù)據(jù)倉庫。
通過表示和計算將實體與實體之間的關(guān)聯(lián)關(guān)系轉(zhuǎn)化為有意義的語義信息,是知識圖譜中最重要的部分。知識表示法基于符號邏輯和抽象概念進行建模,其中符號邏輯主要用來表達概念之間的語義關(guān)系,抽象概念則用來表示概念所包含的內(nèi)涵。
查詢方式
查詢方式有基于關(guān)系和基于屬性兩種?;陉P(guān)系的查詢方式主要有傳統(tǒng)的查詢,即通過輸入關(guān)鍵字查詢實體之間的關(guān)系,并把關(guān)系映射到知識圖譜中;基于屬性的查詢方式則是通過輸入一個屬性來查詢多個實體,然后用它們之間的關(guān)系來表示知識圖譜。
通常情況下,節(jié)點都是實體,而邊則是實體之間或概念與概念之間的關(guān)系。在圖數(shù)據(jù)庫中,一個實體被標(biāo)記為邊,而一個實體被標(biāo)記為節(jié)點。
構(gòu)建的過程
從數(shù)據(jù)、概念、實體及關(guān)系等多個角度出發(fā),利用多個技術(shù)工具進行知識的抽取、融合、存儲和應(yīng)用。
一般來說,知識圖譜的構(gòu)建過程可以分為以下四個階段:
1.數(shù)據(jù)準(zhǔn)備:將數(shù)據(jù)中的實體及關(guān)系抽取出來,并對數(shù)據(jù)進行清洗和規(guī)范;
2.概念抽?。簩⒅R轉(zhuǎn)化為概念,并構(gòu)建主體框架;
3.關(guān)系抽?。簭母拍钪谐槿嶓w之間的關(guān)系,并將其映射為圖譜中的實體和屬性;
4.圖譜構(gòu)建:完成構(gòu)建。
常見問題
知識圖譜是指由一系列定義明確、相互關(guān)聯(lián)的實體以及它們之間的關(guān)系組成的網(wǎng)絡(luò)。它可以對數(shù)據(jù)進行可視化,支持高效的查詢和分析,并提供更多的信息和知識。
它可以是結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù),也可以是文本、視頻、圖像、語音等非結(jié)構(gòu)化數(shù)據(jù)。
知識圖譜是一個開放、共享和互操作的統(tǒng)一數(shù)據(jù)模型,可用于在不同類型的數(shù)據(jù)之間建立關(guān)聯(lián)關(guān)系,并支持在多種不同類型數(shù)據(jù)之間進行推理,其特點是對各種類型數(shù)據(jù)進行統(tǒng)一表達和存儲,并為各類知識之間的相互聯(lián)系和交互提供統(tǒng)一的接口。
(文章轉(zhuǎn)載于天潤融通)