當前位置:學問谷 >

行業範例 >數據庫操作系統 >

非結構化WEB數據庫與圖書館多媒體信息資源的組織利用論文

非結構化WEB數據庫與圖書館多媒體信息資源的組織利用論文

【內容提要】針對傳統關係數據庫在處理非結構化多媒體WEB信息中所存在的問題,結合圖書館多媒體數據庫的特點及特定技術要求,介紹了非結構化WEB數據庫的技術特點及其在組織與利用館藏多媒體信息資源中的作用。

非結構化WEB數據庫與圖書館多媒體信息資源的組織利用論文

【摘要題】信息資源建設

【關鍵詞】非結構化WEB數據庫/多媒體/信息資源/組織利用/關係數據庫

【正文】

1 非結構化WEB數據庫簡介

非結構化WEB數據庫,是指其字段長度可變,並且每個字段的記錄又可以由可重複或不可重複的子字段構成的基於INTERNET、INTRANET的數據庫,用它不僅可以處理結構化數據(如數字、符號等信息)而且更適合處理非結構化數據(全文文本、圖象、聲音、影視、超媒體等信息)並在互聯網上發佈。非結構化WEB數據庫主要是針對非結構化數據而產生的,與以往流行的關係數據庫相比,其最大區別在於它突破了關係數據庫結構定義不易改變和數據定長的限制,支持重複字段、子字段以及變長字段並實現了對變長數據和重複字段進行處理和數據項的變長存儲管理,在處理連續信息(包括全文信息)和非結構化信息(包括各種多媒體信息)中有着傳統關係型數據庫所無法比擬的優勢。

2 圖書館多媒體信息資源的特點及組織利用中的技術要求

2.1 圖書館多媒體信息的數據量非常大,象館藏影視資料和各種多媒體教育資料,其動態圖象信號,每秒可達數兆字節,一段幾分鐘的MP3音樂也有幾兆字節,即使經過壓縮、也十分巨大。如何對多媒體海量數據進行有效地組織、存儲並構成WEB數據庫提供給用户網上使用,技術要求很高。

2.2 館藏多媒體信息的數據類型很多,包括各種圖文數據、聲音數據、影視數據、超媒體數據、多種格式的隨書光盤等等,其數據長度不固定,結構上的差異大,使得處理這些數據十分困難,要求數據庫既能夠處理可變長度字段又能夠處理可重複的子字段。

2.3 多媒體信息處理在時間上要求很高,多媒體信息中的聲音和動態圖像對時間特別敏感,在使用這些信息時,必須保證其時間上的要求,否則將會使這些信息失真甚至變得毫無意義。

2.4 開發利用館藏多媒體信息資源經常要多種信息集成描述,比如某種多媒體,既有圖像,又有聲音,還有文字説明,這樣就會改變傳統的數據庫操作形式和數據庫接口,尤其對圖文並茂的數據庫的建立和查詢,需要統一語義描述。

基於多媒體信息資源的上述特點,要想使館藏豐富的多媒體信息資源得到充分利用,滿足信息用户不斷增長的信息需求,對多媒體信息處理提出了不同於普通信息處理技術的新要求:

(1) 多媒體數據庫元數據存儲技術要求

我們知道音頻、圖象、視頻等多媒體信息數據是非結構化的,它們不能用簡單的數字解析式表示,多媒體數據庫必須取得基於這些媒體對象內容及信息特徵的解釋,才能完成存儲及應用,這些解釋就稱為元數據,通過對元數據的歸類、整理、實現標準化的存儲是多媒體信息資源組織利用的關鍵。多媒體數據庫元數據存儲技術要求包括:文本元數據的存取,語音元數據的存取,圖象元數據的存取,視頻元數據的存取等方面的技術要求。

(2) 多媒體數據庫結構字段設計與數據記錄處理方面的要求

a.允許可變長字段、可重複字段、子字段和MARC字段。

b.數據庫記錄的數目與記錄長度,字段數目與字段長度,字段可重複次數不應受到限制。

c.允許建立可以快速存取的倒排文件和多媒體、多語言記錄表。

d.數據庫可自動接受和產生MARC和ISO2709記錄格式的文件,並且滿足對MEDADATA數據模式的支持功能。

(3) 基於WEB的多媒體信息檢索與信息發佈的技術要求

隨着用户對於信息需求的大量增加,以及對於多媒體信息的實效性要求,基於WEB的數據庫信息存儲的檢索越來越傾向於多媒體全文信息檢索的查詢語言,並且對於檢索結果的需求也側重於多媒體全文信息的獲取。與此同時,WEB數據庫的信息發佈形式開始更多地過渡到通過網絡瀏覽器以多媒體電子文檔的方式(B/S)傳輸給網上用户。也要求利用多媒體WEB傳輸技術,向用户提供主動的特定多媒體信息的推送服務。

3 非結構化WEB數據庫的特點及其在組織與利用多媒體信息資源中的作用

3.1 豐富的數據類型與靈活的數據結構,滿足多種類型館藏多媒體數據結構組織

根據非結構化多媒體數據信息的特殊性,非結構化WEB數據庫在進行存儲和管理多媒體信息時,整個數據庫的管理機制擯棄了傳統結構化關係數據庫對於信息採取定長和結構化定義和管理的侷限,它從多媒體數據模型入手,採用子字段、多值字段以及變長字段的機制,允許創建許多不同類型的非結構化或任意格式的字段,從而突破了關係數據庫非常嚴格的表結構,解決了關係數據庫模型過於簡單,不便於表達複雜嵌套的問題。非結構化WEB數據庫在數據類型上不僅支持字符型、數值型數據,而且由於具有很強的外部文件支持功能,使其可以支持如超長文本、圖像、聲音、動畫等多種多媒體擴展數據類型。與傳統關係數據庫相同之處是非結構化WEB數據庫的數據結構也是建立在二維表的基礎之上的,但它與關係數據庫不同的是:(1)非結構化WEB數據庫二維表的屬性長度是不可變的,在列的維度上可以隨意擴展,這就能較好地滿足多媒體數據處理時,需要靈活的可變長字段的要求。(2)非結構化WEB數據庫由於支持重複字段、子字段,使其可以在數據庫記錄中實現二維嵌套,解決了非結構化多媒體數據結構複雜、可能存在重複字段和多個嵌套子字段的問題。(3)非結構化WEB數據庫一個字段可以存放關係數據庫的一張表,它可以在一張表中壓縮關係數據庫中一對多的關係,因此利用非結構化WEB數據庫能很好地實現多種多媒體數據庫的集中組織與管理。

3.2 基於廣域網的'圖書館海量多媒體數據庫存儲管理機制的實現

圖書館多媒體信息資源數據庫是海量數據庫,支持基於廣域網的海量多媒體信息存儲和管理是非結構化WEB數據庫管理系統的主要功能之一,不僅存儲數據量大,而且存取速度快,同時檢索功能強、檢索速度快,在檢索速度方面一般不受信息量大的影響。以IBASE非結構化數據庫為例,每個數據庫最大的記錄數可達到1000萬條,每條記錄的最大長度可達64000字節。每個數據庫最多可有800個字段。

3.3 利用多種索引方式,實現多媒體全文檢索、媒體特徵檢索等多種檢索策略

館藏多媒體信息資源組織利用的關鍵是要實現多種方式的多媒體全文檢索,而要實現多種檢索方式,建立索引是前提,傳統關係數據庫支持的索引只限於單字段索引、複合索引等幾種方式,受其限制,關係數據庫檢索能力也受到很大限制。非結構化WEB數據庫由於有着靈活的數據結構,在其底層存儲機制變革的基礎上,採用先進的索引倒排擋技術,使它支持的索引方式比關係數據

庫要豐富得多,可以滿足極其複雜檢索的需要,實現對於海量多媒體信息的快速全文檢索功能,它支持字段索引、子字段索引和全文索引甚至可以支持人工標引索引,中英文混合索引等方式。配合非結構化數據庫的格式化語言,可以對同一字段進行若干種不同的索引,以滿足特殊檢索的需求,實現多種檢索策略。例如IBASE非結構化數據庫管理系統目前支持8種不同的索引方式,可以涵蓋所有關係數據庫所提供的90%以上的檢索方式,同時還提供了包括簡單檢索、組合檢索、字段檢索、右截斷檢索、全文檢索、擴展檢索、相關檢索、集合檢索、媒體特徵檢索等等大量關係數據庫所不具備的檢索方式和檢索策略。

3.4 集成WEB服務器和數據庫服務器,實現多媒體網絡信息發佈與多種服務功能

關係數據庫在基於因特網應用時,由於結構模型等原因的限制,不能與因特網完全地融合,需在WEB服務器與數據庫之間加入大量的中間件,從而在無形中加大了數據庫基於網絡應用的難度,給數據庫在因特網應用帶來了新的網絡瓶頸,應用服務器由於與數據庫頻繁交互,其本身的效率和數據庫檢索效率易造成因特網應用的阻塞。非結構化數據庫模型全部是基於因特網,採用WEB服務器和數據庫服務器緊密集成的方法,可以將目前傳統數據庫廠商由C/S結構擴展來的瀏覽器/WEB服務器加應用服務器/數據庫服務的三層體系結構,集成瀏覽器/WEB數據庫發佈系統(B/S)的因特網計算結構,使多媒體數據庫系統成為WEB的一個重要有機組成部分,實現在單一平台上融合所有多媒體數據庫和應用服務器的功能,這不僅大大減少了用户對多媒體數據庫額外硬件、中間件和其他昂貴的集成業務的需求,而且極大地縮短了用户開發和採用基於因特網應用的時間,有利於用户把更多時間用於多媒體信息資源的開發和描述,非結構化數據庫管理系統可以為系統建設者提供快速有效的方法實現基於WEB的多媒體數據庫的建立和信息檢索發佈,實現網上多媒體信息檢索、在線點播、閲讀,圖書館多媒體資源聯合編目和聯合建庫。同時,利用非結構化WEB數據庫還可以實現許多新的多媒體信息服務功能,如採用多媒體信息推送技術和郵件服務器功能實現定題服務和個性化多媒體信息服務。

【參考文獻】

1.朱繼團.非結構化類型網頁的全文檢索

系統設計.現代計算機,1998(9)

2.張忠友.基於IBASE非結構化網絡數據庫的IPAC圖書館網上資源發佈與檢索系統.中國信息導報,2001(2)

3.張忠友.數字化圖書館與非結構化數據庫.中國信息導報,2001(6)

4.李慧,顏顯森.數據庫技術發展的新方向——非結構化數據庫.情報理論與實踐,2001(4)

5.朱斌,宋先忠.非結構化數據的信息服務系統設計方法.計算機時代,2001(7)

6.田辛玲,劉衝嬌.電子化圖書館多媒體文獻服務系統的建設與實施.現代情報,2002(6)

7.蔡清萬.多媒體技術與數字圖書館建設.圖書館工作與研究,2001(2)

8.李娟.多媒體數據庫開發.情報理論與實踐,2001(1)

  • 文章版權屬於文章作者所有,轉載請註明 https://xuewengu.com/flhy/shujuku/gqk9m.html