心智圖資源庫 資訊管理學基礎
這是一個關於資訊管理學基礎的心智圖,資訊與資訊管理、資訊交流、資訊分佈、資訊服務等。
編輯於2023-12-04 20:19:25Il s'agit d'une carte mentale sur les anévrismes intracrâniens, avec le contenu principal, notamment: le congé, l'évaluation d'admission, les mesures infirmières, les mesures de traitement, les examens auxiliaires, les manifestations cliniques et les définitions.
Il s'agit d'une carte mentale sur l'entretien de comptabilité des coûts, le principal contenu comprend: 5. Liste des questions d'entrevue recommandées, 4. Compétences de base pour améliorer le taux de réussite, 3. Questions professionnelles, 2. Questions et réponses de simulation de scénarios, 1. Questions et réponses de capacité professionnelle.
Il s'agit d'une carte mentale sur les méthodes de recherche de la littérature, et son contenu principal comprend: 5. Méthode complète, 4. Méthode de traçabilité, 3. Méthode de vérification des points, 2. Méthode de recherche inversée, 1. Méthode de recherche durable.
Il s'agit d'une carte mentale sur les anévrismes intracrâniens, avec le contenu principal, notamment: le congé, l'évaluation d'admission, les mesures infirmières, les mesures de traitement, les examens auxiliaires, les manifestations cliniques et les définitions.
Il s'agit d'une carte mentale sur l'entretien de comptabilité des coûts, le principal contenu comprend: 5. Liste des questions d'entrevue recommandées, 4. Compétences de base pour améliorer le taux de réussite, 3. Questions professionnelles, 2. Questions et réponses de simulation de scénarios, 1. Questions et réponses de capacité professionnelle.
Il s'agit d'une carte mentale sur les méthodes de recherche de la littérature, et son contenu principal comprend: 5. Méthode complète, 4. Méthode de traçabilité, 3. Méthode de vérification des points, 2. Méthode de recherche inversée, 1. Méthode de recherche durable.
資訊管理學基礎
第一章 資訊與資訊管理
一、資訊
(一)資訊的概念
1.本體論層次
訊息是事物存在的方式和運動狀態的表現。
2.認識論層次
資訊是主體所感知或表達的事物存在的方式和運動狀態。
3.全資訊
同時考慮到事物存在方式和運動狀態的外在形式(語法資訊)、內在意義(語意資訊)和效用價值(語用資訊)的知識論層次上的信息稱為全資訊。
4.社會訊息
即為了特定的目的產生、傳遞、交流並應用於人類社會實踐活動,包括一切由人類創造的語言、符號和其他物質載體表達和記錄的數據、訊息、經驗、知識。
(二)訊息的特徵
1.資訊存在的普遍性與客觀性
⑴訊息是事物存在方式和運動狀態的表現,事物的存在和運動無時不有,無處不在,因而信息也就如影隨行,無時不有,無處不在。
⑵這種普遍存在的訊息也具有絕對性和客觀性。絕對性表現為資訊的存在不依主體而轉移;客觀性表現為資訊不是虛無縹緲的東西,它的存在可以被人感知,獲取,存儲,處理,傳遞和應用。
2.資訊產生的廣延性和無限性
⑴宇宙時空中的一切事物都有其存在的方式和運動狀態,都在不斷的產生訊息;而宇宙時空中的事物是無限豐富的,在空間上廣闊無邊,在時間上無限變化。
⑵因而資訊的產生是無限的,分佈也是無限的,即使在有限的空間和時間段中,事物也是無限多樣的,資訊自然也是無限的。
3.訊息在時間和空間的傳遞性
⑴訊息產生於事物的存在和運動,但訊息可以獨立於其發生源而相對獨立,可以由其他物質載體攜載在時間或空間中傳遞,在時間上的傳遞即是信息的存儲,在空間中的傳遞就是通信。
⑵訊息在時間和空間中傳遞的性質十分重要,它不僅使人類社會能夠進行有效的資訊交流和溝通,而且能夠進行知識和資訊的累積與傳播。
4.訊息對物質載體的獨立性
⑴資訊表徵事物的存在和運動,但訊息不是事物本身。這種「表徵」可以透過人類創造的各種符號、代碼和語言來表達,透過各種物質載體來記錄和存儲,透過光、聲、電等能量來負荷和傳遞。離開這些物質載體,訊息便無法存在。這說明訊息對物質載體具有依附性。
⑵但訊息具體地由哪一種物質載體來表達、記錄和負荷並不會改變訊息的性質和意義,這說明訊息對物質載體具有獨立性。載重訊息的物質載體的轉換並不會改變事物存在的方式和運動狀態的表現。這一性質使得人們有可能對資訊進行各種加工處理和轉換。
5.資訊對認識主體的相對性
⑴由於人們的觀察能力,認識能力,理解能力和目的不同,他們從同一事物中所獲得的資訊量也各不相同。
⑵即使他們的這些能力和目的完全相同,但他們在觀察事物時,選擇的角度不同,側面不一樣,他們所獲得的有關同一事物的信息量也肯定不同。資訊的這一性質說明實得資訊量是因人而異的。
6.資訊對利用者的共享性
⑴由於資訊可以脫離其發生源或獨立於其物質載體,並且在利用中不被消耗,因而可以在同一時間或不同時間被給眾多用戶利用,這就是資訊的共享性。
⑵資訊的共享性是資訊的一種天然屬性(本質屬性),它既有正面,也有負面面向。其積極方面是資訊在時間和空間上可以實現最大限度的共享,提高資訊利用效率,節約生產成本;其消極方面是共享給現代資訊管理中資訊產權的安排和控制帶來了很大難度。
⑺資訊的不可變換性與不可組合性
訊息一旦產生,就表達某種特定的含義,它不是包含在訊息中的各種要素的簡單算術和,因而不可能將這些要素以任意的順序排列和以不同的組合加以歸併而不損害訊息的含義。同樣,構成資訊的要素也是不能任意分割的。
⑻資訊產生與利用的時效性
⑴從訊息產生的角度看,訊息所表徵的是特定時刻事物存在的方式和運動狀態,由於所有的事物都在不斷變化,過了這一時刻,事物的存在方式和運動狀態必然會改變,表徵這方式和狀態的訊息也會隨之改變,也就是所謂時過境遷。
⑵從資訊利用的角度來看,資訊只有在特定的時刻才能發揮其效用。一則及時的訊息可能價值連城,一則過時的訊息則可能分文不值。這裡主要強調“特定時刻”,利用者要善於把握時機,只有時機適宜,資訊才能充分發揮效用。
(三)資訊的分類
1.依資訊描述的對象劃分
自然訊息,生物訊息,機器訊息,社會訊息
2.按資訊的性質劃分
文法訊息,語意訊息,語用訊息
3.從利用者觀察的角度和過程劃分
實在信息,先驗信息,實在信息
4.按訊息的傳遞方向劃分
縱向訊息,橫向訊息,網狀訊息
5.按資訊的內容劃分
經濟訊息,科技訊息,政治訊息,文化訊息,政策法規訊息,娛樂訊息
6.依資訊的作用來劃分
有用信息,無用信息,幹擾信息
7.依資訊的運作狀態劃分
連續性訊息,間隔性訊息,常規性訊息,突發性訊息
8.依資訊的流通管道劃分
正式訊息,非正式訊息
9.按資訊的記錄方式劃分
語聲訊息,影像訊息,文字訊息,數字訊息,計算訊息
10.按資訊的來源劃分
內部訊息,外部訊息
(四)資訊鏈中的數據、資訊與知識
資訊鏈由事實──資料──資訊──知識──智能五個要素構成。在資訊鏈中,與資訊緊密相關的是數據和知識。
1.數據
⑴資料:是載重或記錄資訊的依照一定規則排列組合的物理符號。它可以是數字,文字,圖像,也可以是聲音或電腦程式碼。
⑵人們對資訊的接收始於對資料的接收,對資訊的取得只能透過資料背景和規則的解讀。 “數據 背景=資訊”
2.訊息
資訊:是資料載重的內容,對於同一訊息,其資料表現形式可以多種多樣。訊息告訴我們:“這組符號表達什麼。”
3.知識
⑴知識:是資訊接收者透過對資訊的提煉與推理而獲得的正確結論,是人透過資訊對自然界,人類社會以及思考方式與運動規律的認識與掌握,是人的大腦透過思維重新組合的,系統化的資訊集合。知識告訴我們:“這組數據意味著什麼。”
⑵知識的傳輸模式:傳輸者的知識→資料→資訊→接收者的知識。可見,資訊能夠轉化為知識的關鍵在於資訊接收者對資訊的理解能力,對資訊的理解能力取決於接收者的資訊與知識準備。資訊只有同接收者的個人經驗、資訊與知識準備結合,也就是同接收者的個人背景融合才能轉化為知識。 “資訊 經驗=知識”
⑶由此可見,知識的獲取只能透過學習和體驗(實踐),而人的認識能力和理解能力為數據轉化為信息,信息轉化為知識,以及知識的有效融合,新知識的創造提供了必必不可少的條件。
4.智能
⑴智能:是解決問題的一種能力和方略,是在一定環境下針對特定的問題和目的而有效地獲得信息,處理信息形成知識和策略,利用策略來解決問題,從而成功地達到目的的能力。
⑵智能是被目的所啟動的知識,是知識在一定條件下的運動方式。
關係
從以上資訊鏈中的相關概念出發可以認為:
數據是資訊的原料,而資訊是知識的原料,知識的趨向是要成為人們決策的智慧方法。其中資料的外延涵蓋範圍最廣,資訊次之,知識最小。
二、資訊化與資訊社會
(一)訊息與物質和能量
⑴物質,能量和資訊是支配人類社會發展的三大基本要素,並稱當代社會的三大支柱資源。物質提供材料,能量提供動力,資訊提供知識。
⑵人類社會中物質和能量不斷從生產者流向使用者,這種客觀存在的物質與能量流在人的認識中反映為關於這種物質和能量運動的訊息。物質與能量流的運動也表現為另外的各種形態的物質與能量的流動,即相應的文獻,數據和信號的運動,其總匯構成信息流,可以認為信息就是社會生產領域中物化的流。
⑶訊息流反應物質能量流的運動,社會藉助訊息控制物質能量流的運動,左右它們的運動方向,進行科學分配,實行有效管理。
(二)資訊化
1.資訊化概念
資訊化:由於資訊、資訊科技在當今社會經濟發展中不可取代的巨大作用,無論政府或各行各業都在最大限度地利用資訊技術,充分開發資訊資源,提高自身的效能和效率,人們把這種現象稱為資訊化。資訊化是社會發展到一定階段的必然產物,其興起有著深刻的社會、經濟和科技背景。
2.資訊化內涵的包含要素
⑴資訊資源,資訊本身作為一種資源,在量的累積上必須要達到一定的高度,比較普遍地存在於人類社會的各個領域;
⑵資訊技術,現代資訊科技與網路技術的普及、利用度不斷提高;
⑶資訊觀念,人們對資訊的重要性以及其價值認識得到加強,人們教育程度和核心素養提升;
⑷資源共享,透過快速有效的資訊交流實現資訊資源在全社會範圍內的充分共享,產生社會和經濟效益。
3.資訊社會
⑴概念
資訊社會:是繼農業社會,工業社會之後人類社會的新形態。在資訊社會中,資訊成為比物質和能源更為重要的資源,以開發和利用資訊資源為目的的資訊經濟活動迅速擴大,逐漸取代工業生產活動成為國民經濟活動的主要內容。
⑴資訊社會的特徵
①資訊、知識和智能是社會發展的決定力量;
②資訊科技、資訊產業、資訊經濟成為科技、經濟和社會發展的主導因素;
③資訊勞動者、知識階層將發揮更大的作用;
④由於資訊科技的廣泛應用,對經濟和社會發展產生了巨大而深刻的影響,從根本上改變了人們的生活方式、行為方式和價值觀念。
(補充:社會資訊化)
1.概念
社會資訊化:是指人類社會發展過程中的一種特定現象,在這種現像出現時,人類對資訊的依賴程度越來越高,而對物質和能源的依賴程度相對較低。 (是以電腦資訊處理技術和傳輸手段的廣泛應用為基礎和標誌的新技術革命,影響和改造社會生活方式與管理方式的過程。)
2.社會資訊化的三個層次
⑴生產工具資訊化:經過自動控制,知識密集而實現。
⑵社會生產系統資訊化:經過對生產產業、部門以至整個國民經濟的自動化控制實現。
⑶社會生活資訊化:經過通訊系統、諮詢產業等設施實現。
3.社會資訊化的發展階段
普及資訊工業階段、建立與發展先進的通訊系統階段、企業資訊化階段、社會生活的全面資訊化
三、資訊管理概述
(一)資訊管理的概念及對象
1.資訊管理的概念
⑴狹義:資訊管理就是資訊本身的管理,即採用各種技術方法和手段對資訊進行組織,控制,存儲,檢索和規劃等,並將其引向預定目標。
⑵廣義:資訊管理不單單是資訊的管理,而是對涉及資訊活動的各種要素(信息,人,機器,機構等)進行合理的組織和控制,以實現資訊及有關資源的合理配置,從而有效地滿足社會的資訊要求。
⑶本書:對資訊管理是持廣義的理解。認為資訊管理的實質是人類綜合採用技術的,經濟的,政策的,法律的,人文的方法和手段,對資訊流(包括非正規管道和正規管道中的資訊流)進行控制,以提高資訊利用效率,最大限度地實現資訊效用價值為目的的一種活動。
2.資訊管理的對象
⑴資訊資源
①狹義的資訊資源概念是把資訊資源等同於知識、資料和訊息,也就是只是指資訊本身的集合。
②廣義的資訊資源概念是指資訊、資訊科技和資訊人員的有機集合。它是一個涉及資訊生產,處理,傳播,利用等整個資訊勞動過程的多要素的概念。其中包括資訊勞動的對象──訊息,資訊勞動的工具──電腦和通訊科技等資訊科技手段,資訊勞動者──資訊專業人員。上述三個要素相互連結相互作用,共同構成了具有統一功能的有機整體-資訊系統。
⑵資訊活動
①資訊從產生,傳播到收集,加工,再到吸收,利用的過程,就是一個完整的「資訊生命週期」。資訊活動就是資訊資源的開發利用過程。
②人類社會的資訊活動包括三個基本層次:即個人的,組織的和社會的資訊活動。
個人的資訊活動表現為個人對資訊資源的開發利用,其效率與個人的資訊意識和資訊能力有關,並受個別資訊環境的影響;
組織的資訊活動常以各類資訊系統的形式出現,資訊系統的發達程度能夠反映出各級組織的資訊資源開發利用程度。
隨著資訊活動的發展規模不斷擴大,資訊資源的開發利用對人類社會進步的影響日益顯著,在社會整體上就體現為一種新興產業-資訊產業的形成與發展。
(二)資訊管理的目標與任務
1.資訊管理的目標
⑴總目標
確保社會資訊流在不同管道中有序流動,資訊的開發和利用,在有領導,有組織的統一規劃和管理下協調一致,有條不紊的進行,使各類信息以更高的效率,效能,更低的成本在國家社會進步,經濟發展,人民物質文化水準提高中充分發揮作用。
⑵分目標
①資訊的生產與開發分目標:主要根據社會經濟的發展來合理組織規劃資訊的生產與開發,確保相關的潛在資訊能及時、經濟地轉化為現實的資訊資源,供人們使用。
②資訊利用分目標:主要依照社會化,專業化和產業化的原則合理組織資訊的流通和分配,確保資訊能得到充分有效的利用。
③資訊管理機制分目標:依照社會資訊過程的特徵與規律,建立科學合理的資訊管理機制,改善資訊開發所利用的保障體系。
2.資訊管理的任務
⑴宏觀層次
①制定資訊開發策略、策略、規劃、方針和政策,使資訊的開發活動在國家統一指導和管理下有條不紊地進行,使資訊的開發不僅成本低,價格廉,而且能很好地滿足國民經濟和社會發展的總體需要。
②制定資訊管理的法律,規章和條例,建立資訊管理的監督和保障體系,使資訊管理真正有法可依,有章可循,使生產和開發的資訊能夠得到充分,及時和有效的利用。
③綜合運用經濟,法律和行政手段協調各部門,各地區和各企業之間的關係,明確各級信息開發利用機構的責、權、利界限,使信息開發利用在平等互利的基礎上最大限度實現資源共享。
④加強國家資訊基礎設施和網路建設,使資訊的生產,開發利用和管理具有良好的硬體環境支援。
⑵微觀層次
①調查並了解組織或機構內部各類人員資訊需求,制定一個滿足不同需求的折位方案,以最大限度地滿足不同的需求。
②搞清組織或機構內外資訊來源及資訊取得管道,以便在需要時取得所需的資訊或向外傳輸資訊。
③選擇適用資訊技術,建立組織或機構內部資訊系統和網絡,確定資訊加工處理,存儲,檢索和傳遞方法,建立組織或機構內部的高效資訊保障體系。
④對資訊管理的績效進行評價,為改善資訊管理提供依據。
(三)資訊管理的視角
1.技術視角
資訊管理者研究用手工方式和電腦方式對資訊進行收集,加工處理,使之有序化存儲,便於快速檢索並傳遞給特定的利用者。這一直是資訊管理研究的重點和目標。
2.經濟視角
主要研究以資訊的生產,流通和利用為基礎的資訊市場,資訊產業,資訊經濟的形成,發展,特徵和運作模式,資訊資源的最佳化配置,資訊科技的評估選擇以及資訊經濟效益評估等方面的問題。資訊經濟學是此視角下資訊管理與經濟學相互交叉的研究領域。
3.行政和法律視角
立基於政府職能,運用行政手段和法律手段對資訊活動進行調節和控制,著眼於協調和解決社會資訊化過程中出現的新矛盾,新衝突,新的利害關係,促進社會更充分的利用信息,更好地發揮資訊的社會功能,為實現某種發展目標服務。資訊政策與資訊法律是此視角下的典型研究領域。
4.人文視角
立基於研究資訊流控制中的道德,倫理,文化因素的影響與建構。尤其是在網路環境下,人們的資訊行為僅依靠行政和法律手段是難以有效約束的,必須透過人文精神的培養來規範人們的行為,對資訊活動進行管理。在此視野下資訊倫理,網路倫理的研究對日益受到人們關注。
隨著人們對資訊技術,資訊管理的快速發展及其與人類社會相關性的認識不斷深入,一個動態的跨學科的研究正逐漸興起——社會資訊學。 (社會資訊學:是從資訊科技與組織機構和文化背景相互影響的角度對其設計,使用和共同進行的跨學科研究,是以一個計算機化的社會方面為研究對象的新領域,包括信息技術在社會和組織變化中的作業,以及社會的組織和實踐對資訊科技發展的影響。
(四)資訊管理流程:資訊生命週期管理(ILM)
1.資訊生命週期管理的涵義
資訊生命週期管理(ILM):是一種資訊管理模型,對資訊進行貫穿其整個生命週期的管理,從創建到使用到歸檔和處理,它是一種針對資訊主動管理的過程策略,其宗旨在於保護訊息傳播的連續性。
2.資訊生命週期管理的階段
⑴資訊創建(產生/發布)階段
創建階段是資訊生命週期的初始階段,也是進行資訊生命週期管理的起點。除了原先規範的資訊機構等資訊生產者之外,目前有相當一部分的資訊在網路環境下由使用者而產生,因此資訊的發布具有很大的自由度和隨意性,這就對資訊創建階段的規範性提出了更高的要求。在資訊建立階段需要保持文件格式,規格以及元資料描述的一致性。
⑵資訊採集階段
採集是資訊資源的發展和利用的基礎和起點。首先需要製定資訊的採集政策,明確資訊採集的內容和範圍,之後再採取相應的採集方法。關於資訊採集的方法通常有兩種:手動收集和自動獲取。手工採集的優點在於資訊在採集前要接受手動的一致性檢查,可以避免機器無法辨識的錯誤。自動獲取方式則可以利用相應的網絡程序來抓取捕獲網絡上的信息資源,特別對動態更新的信息,這種方式的效率更高,但其也存在信息價值無法判斷的缺陷。
⑶資訊組織階段
這一階段的任務是為資訊集合提供有序化的結構,使之形成一個有機化的整體,以便於對資訊的存取和利用。具體來說就是採用一定的方法將所採集到的大量的,分散的,雜亂的信息經過篩選,分析,標引,著錄,整序,優化,形成一個便於用戶有效利用的系統的過程。
⑷資訊儲存階段
資訊儲存是實現資訊價值的基礎,此階段的主要任務是依托相關儲存應用技術,將儲存在對應載體和媒體上的資訊從不可得狀態變為可得狀態,可得狀態變為可用狀態,低水平的使用狀態變為高水準的使用狀態,使得資訊的管理,共享,保護,備份,恢復,複製等功能以自動化的方式實現;在儲存網路中建立服務等級層次,將資訊轉移到相應的服務等級層次中。
⑸資訊利用階段
資訊利用是資訊生命週期管理的宗旨,資訊利用是使用者對所提供的資訊有效運用的過程。資訊生命週期管理的主要目標是確保資訊可以支援業務決策,為企業和使用者提供長期的價值。因此資訊必須便於存取和利用。資訊利用階段採用的主要方式包括:建立專業的資料庫;提供專業資訊導航;進行資訊加值服務。
⑹資訊清理(銷毀/回收)階段
隨著資訊老化失去價值,許多資訊總會在一段時期後沒有再繼續保存的價值。這時需要製定相關政策,對沒有保留或保存必要的資訊進行清理或銷毀。被清理或銷毀的資訊將從活動和非活動系統,以及資料倉儲等系統中清除。對一些不能輕率地進行銷毀操作的信息,需要對其進行遷移。因此這一階段的主要工作就是建立科學明確的資料回收(銷毀,清理,遷移)的規則。
3.基於管理視角和基於價值視角的資訊生命週期管理的區別
⑴二者對資訊生命週期階段的劃分方法不同。
①管理視角更多的是從管理角度出發,在追蹤一類型產品實際加工的具體流程或現有處理的業務流程上予以提煉,將資訊的生命週期過程予以分解。
②價值觀點主要是透過或試圖透過定量的方法,根據一定的測度指標來客觀的描述和模擬資訊的生命演化進程,然後根據生命曲線來劃分階段,或設定一些定量的識別指標來自動識別生命週期階段。
⑵兩者所描述的訊息生命起點不一樣。
①價值觀點是以資訊產生以後為研究起點,如文獻發表,專題出版等。
②管理觀點則涉及資訊產生之後是如何被收集,組織,儲存和利用的。
四、資訊管理的沿革及發展
(一)傳統管理階段
此階段以資訊來源管理為核心,以圖書館為象徵,同時也包含檔案管理和其他文獻資料管理。雖然人類對知識資訊的保存與管理早已有之,但作為一項專門的工作和事業的資訊管理則是在圖書館出現之後才興起和發展起來的。
⑴圖書館是人類社會生活發展到某個階段的產物。收藏和整理文獻記錄成為早期圖書館的存在方式和活動內容。隨著社會經濟,科技,文化的發展,文獻記錄的類型大量增加,圖書館作為最初的文獻收藏機構,逐漸與檔案館分流,成為知識和文獻收藏整理和提供利用的社會資訊交流中心機構即形成了獨立意義上的圖書館。
⑵圖書館對文獻的收藏以文獻的利用為目的。為有效解決「藏」與「用」之間的矛盾,圖書館引入了管理的概念。它除了包括對文獻本身的管理外,還包括對機構,人,文獻整理和提供過程的管理,因而已具有相當的綜合性和現代資訊資源管理的意識。
⑶由於文獻資訊的利用在時間和空間上的分佈都非常複雜,圖書館並不知此時此地之“藏”何時何地才能被“用”,這使得許多圖書館不得不著眼於文獻信息源的收全藏全,以備日後難以預料之用。這就是圖書館重視「源」的管理的根本原因。
⑷20世紀40年代後,情報危機開始出現,在科技領域出現了一類新興的專職資訊服務機構-科技資訊機構。從本質上看,科技資訊機構與圖書館之間並無特殊差異。尤其是在大量採用現代資訊科技時的圖書館從書籍世界進入資訊世界的背景下,圖書情報服務更具一體化。 1960年代以後,兩者都更重視「管理」並向「資訊管理」發展過渡。以「資訊源」為核心,以文獻為主要載體,以公益性服務為主要目標的傳統管理階段正在向資訊管理階段發展,從重視「源」的管理向注重「流」的控制過渡。
(二)技術管理階段
此階段以資訊流的控制為核心,以電腦為工具,以自動化資訊處理和資訊系統建造為主要工作內容。顯然,這是在電腦科技及相關資訊科技的高度發展和廣泛應用背景之下發展起來的新興資訊管理模式。
①計算機具有科學計算功能和資訊處理功能。 1940年代成功研製出第一台計算機,計算機發明研製不到十年就被應用於圖書館的文獻資訊加工和管理,目的是要提高文獻資訊加工處理和查找效率,實現對文獻資訊流的控制。
②隨著電腦科技的發展,電腦處理功能越來越強,使人們對文件的加工有可能從宏觀層次向微觀層次深入,從文獻的局部信息擴展到全文信息,極大地提高了人類對文獻信息的處理和管理能力,提高了圖書情報中心對文獻資訊流的自動化控製程度。
③技術管理階段著重於電腦科技處理資訊並對資訊流進行控制,技術因素占主導因素,技術專家唱主角。這一階段圍繞著電腦應用創造了許多資訊加工處理方法,系統設計發展理論。過度追求最先進技術的應用,完全忽略了資訊管理中其他因素的作用。
(三)資源管理階段
資訊資源管理這個概念的提出基於兩個背景:一方面是技術管理階段,純粹的技術手段不能實現對資訊的有效控制和利用;另一方面,也是更重要的原因,是當代社會經濟發展使得資訊成為重要的資源,迫切需要從經濟的角度思考問題,並對這種資源進行最佳化配置和管理。
⑴二十世紀70年代以後,人們開始關心人對於技術引起的變化作何反應,以及人對於技術應用的影響,並著手利用行政的,法律的,經濟的手段,從微觀與宏觀結合上協調社會資訊化過程中的各種矛盾,衝突和利益關係,妥善處理資訊管理中人與物的複合關係,這樣就逐步形成了資訊資源管理的想法與觀念。
⑵20世紀90年代以後,以網路為基礎的全球資訊高速公路徹底改變了人類資訊活動的方式。但是,高速資訊網並沒有透過高度的技術發展帶來一個真正高效有序的資訊空間,相反,網路的迅速擴張帶來的資訊污染,資訊混亂,資訊犯罪,資訊侵權,遠遠超出了傳統意義上的情報危機。
⑶目前網路數位資訊資源管理的研究,主要可分為以下幾個面向:①網路資源②圖書館③資訊網路④資訊檢索⑤資訊組織⑥元資料⑦用戶服務⑧評估⑨資訊資源共享⑩資訊資源開發利用資訊環境
(四)知識管理階段
知識管理正是在克服資訊管理固有的缺陷基礎上發展起來的,是一種重視與人打交道的資訊管理活動,其實質是將結構化與非結構化的資訊與人們利用這些資訊的規則聯繫起來。知識管理的前提是資訊及資訊系統的準確性,及時性,可用性,並能夠以易於利用的方式提供資訊。知識管理的主要目標是改善組織或機構獲取,分享和利用知識的能力。
⑴知識管理的實現必須以相應的資訊科技為條件,其成果最容易技術成果的形式表現出來。在1980年代以後,人工智慧,專家系統技術的發展對知識管理的產生發揮了較大作用,由於這些技術的發展和應用,提出了知識獲取,知識表達,知識庫系統,知識工程這樣一些在知識管理中廣為應用的是基礎性概念。 1990年代中期,隨著網路的普及和應用,知識管理迅速推廣。
⑵ 目前,知識管理系統,知識分享,知識轉移,知識管理策略是知識管理的重點主題。從技術上來看,知識管理可分為三個階段:①以知識庫為中心的知識管理階段;②以小範圍知識社群為中心的發展階段;③以社會計算,動態知識及其表現為代表的新的知識管理階段。目前Web2.0在知識管理,社會網絡和語義學之間建立一種聯繫,這必將促進基於語義網的知識管理的發展。
第二章 資訊交流
一、資訊交流的基本概念
(一)資訊交流的分類
1.自然資訊交流
自然訊息交流完全是自然物,包括非生物之間,生物之間以及人與非生物及生物之間的訊息交流與角色。這種作用或影響過程完全應循自然法則和法則,與人類的主觀意識不相關。是純粹自然的資訊交流,亦即本體論層次的資訊交流。
2.人與自然的訊息交流
人與自然的訊息交流是一種半自然,半社會的訊息交流,是一種半意識化的訊息交流,這種交流方式除了遵循自然的規則外,也隨人的認識而改變。 (認識並改造世界)
3.人與人的信息交流
人與人的社會訊息交流過程是人的主觀意識的互動。這種溝通方式也是最複雜,最高級的資訊交流形式,它依賴交流者雙方的意識及雙方的行為,而交流行為既受心理因素的影響,又因循一定的社會規則,同時與社會的其他方面相聯繫,構成整個社會運作的一個大系統。
(二)訊息交流的含義與特徵
1.含義
資訊交流:是指不同時間或不同空間上的認知主體(人或由人組成的機構、組織)之間借助於相應的符號系統所進行的知識,訊息,數據和事實等資訊的傳遞與交流的過程。
(共時/橫向資訊交流:在同一時間平面上實現,即此時此地或此時彼地的交流。主要功能是克服交流的空間障礙,達到及時的信息共享。交流手段包括:互聯網、傳真、電話、電報、廣播、電視、口語、實體等。
歷時/縱向資訊交流:在不同時間平面上,縱向檢視人類社會的資訊連結。主要功能在於消除交流的時間障礙,填補過去和現在的鴻溝,將古代與現代聯繫起來,為集中和發展提供條件。交流手段包括:刻製光碟、拷貝磁碟、錄音、錄影、照相、繪畫、文獻、檔案、古蹟、文物等。 )
2.特徵
⑴無論哪種形式的資訊交流過程必須有一個訊息傳遞者S,他是訊息的初始來源,實際上是訊息生產者;一個訊息接收者R,他實際上是訊息的最終利用者。
⑵資訊交流過程可以是直接的,如同時對面交流,也可以是間接的,如非同時、非對面交流。對於間接交流,至少應該有一個「人參與」的環節,我們將這種訊息傳遞稱為訊息鏈。資訊鏈的節點可以是人,也可以是人產生、傳遞的文獻或其他形式,也可以是幾種形式的混合。
⑶訊息交流實質上是單向傳遞,訊息的流動永遠是S流向R,是一種時間不可逆過程。
⑷資訊的來源必須是他人頭腦S所提供的訊息,而不是直接從自然或社會觀察而獲得資訊。
⑸訊息交流也必須是交流雙方的目的行為,即S與R均是要故意傳遞與接收訊息。 R有資訊需求,S有目的地提供。
(三)資訊交流行為
1.人的行為
⑴目的行為
訊息行為(言語、書寫、身勢等)
非資訊行為(體力勞動、機器操作等)
⑵非目的行為
潛意識狀態下的行為
2.資訊交流行為
⑴輸出行為(S行為)
書寫、言語、實體樣品、繪畫、符號特徵等
⑵接收行為(R行為)
閱讀、藝術品欣賞、電話、電視收聽收視等
(四)資訊交流的條件與要素
1.訊息發送者
也稱訊息傳遞者獲訊息生產者。它是資訊的初始來源,是資訊傳遞鏈上的初始環節,一般不是指資訊機構,圖書館,文獻中心等資訊傳遞的中繼站。
2.訊息接收者
或稱受信者。它是訊息的最後接受者或利用者。
3.交流通道
即資訊達到受信者所經過的管道。對於S和R而言,他們發送和接受訊息的基本通道仍是交流雙方的感官系統,包括視覺,聽覺,味覺,嗅覺,觸覺等,其他通道或技術系統僅僅是這些感官通道的擴展,延伸或變換。
4.符號體系
它是訊息傳遞交流時依附的載體。包括語言,文字,手勢,表情,信物,電腦語言等,同時也包括這些符號體系內部各符號元素之間互相聯繫與組織的方式及規則。
5.知識資訊庫
它是人腦知識資訊的總稱,包括人所創造的各種知識和訊息,是資訊交流的最根本來源和最終極的歸宿。
6.支持條件
它是資訊交流得以實現的保障。包括:①自然條件,如光、電、空氣在傳導資訊時的作用;②技術條件:包括各種通訊技術、儲存、處理技術等;③社會條件:即資訊交流的社會保障體系,如法律、政策、經濟條件、資訊機構及相關組織的建立。
二、資訊交流的模式
(一)香農-維弗的通訊模型
這個模型把資訊交流描述成一種單向的線性過程,整個過程有五個環節構成。 ⑴信源負責發出要傳遞的訊息,⑵此訊息會經過編碼器編碼而採用與所經通道相適應的訊號形式到達解碼器,⑶解碼器的功能與編碼器相反,⑷它將接收到的訊號還原為訊息並傳送到交流的目的地,即信宿。 ⑸噪音,指一切傳播者意圖以外的,對正常訊息傳遞的干擾,由此造成訊息失真。
通訊模型所面向的是機器之間的訊號傳遞,它反映出一種原始樸素的訊息傳播思想,為後來的許多交流傳播過程模式奠定了基礎。但同時模型也存在一些局限性,並不完全適用於人類社會的資訊交流傳播過程。
(二)拉斯韋爾的「5W」模式
5W模式,即用五個問題的回答來描述傳播行為,分別是誰(who),說了什麼(say what),透過什麼管道(in which channel),對誰(to whom),取得了什麼效果(with what effect)。 5w模式界定了傳播學的研究範圍和基本內容。影響極為深遠。
此模式在強調訊息發送方,接收者與溝通管道的同時,開始注重訊息本身的內容,以及溝通與傳播的效果,特別是對分析政治性傳播與宣傳十分適用。
(三)施拉姆模型
提出了資訊交流的三個模式。第一個模式與香農-維弗的通訊模型十分相似。在第二個模式中,施拉姆把溝通的簡單模式推進為一個較為複雜的模式,他指出兩個試圖溝通的個人必須累積有相當的共同經驗,即在信源和信宿之間,只有在其有共同經驗的範圍之內才真正有所謂的交流。第三個模式中施拉姆模式又進一步發展成一個顯示人類溝通的兩個個體之間有相互作用的模式,這個模式也被稱為施拉姆「循環模式」。此外也提出了能充分體現大眾傳播特質的“大眾傳播過程模式”,認為構成傳播過程的雙方分別是是大眾傳播與受眾,二者之間存在著傳遞與回饋關係。
施拉姆模式的特徵在於引進了回饋的概念,將回饋的過程與溝通者的互動過程連結起來,把訊息交流理解為一種互動的循環過程。這種模式更符合人的信息交流的實際情況。
(四)維克利的S-C-R模式
S代表訊息來源,C代表交流管道,R代表訊息接收方。資訊交流就是訊息從訊息來源出發,經過各種管道和媒介,而後傳遞到訊息接收方的過程。從形式來看,S-C-R模式的三個要素分別對應於通訊模型中的信源-通道-信宿。而與通訊模式的機器訊號傳遞相比,S-C-R模式強調的是人本社會傳播,與訊息來源和訊息接收者一樣,訊息管道也受到社會的影響,因而對訊息交流和傳遞的考察是放置在社會背景下來進行的,其間涉及許多人文因素,如社會地位和認知對個人吸收資訊的影響等。
維克利認為訊息交流和傳遞本身往往是互動的、雙向的,因而S-C-R模式中的各個要素之間的連結應是雙向性的。
(五)A.И.米哈伊洛夫廣義的科學交流系統模式
美國社會學家H.門澤爾提出了著名的「正式過程」和「非正式過程」交流模型,在這種模型下,社會中的資訊交流被分為正式交流和非正式交流。這個理論經蘇聯情報學家,教育家A.И.米哈伊洛夫整理得到了廣義的科學交流系統模式。這種模式將科學交流分為正式交流和非正式交流。
1.正式交流:是透過科學文獻資訊系統或「第三方」的控製而進行的資訊交流。 優點:⑴所獲得的資訊可靠程度高;⑵能夠從大量的文獻當中找到有關某一課題詳細、全面的科學資訊;⑶不需要與資訊生產者本人見面。 缺點:⑴資訊傳遞不及時;⑵透過文獻找出科學資訊需要一定的方法和技巧。
2.非正式交流:是指科學家、研究人員之間透過個人接觸進行的資訊交流,如彼此之間關於所作研究的直接對話,參觀同行的和科學技術展覽,對各類聽眾做口頭演講,交換信件等。 優點:⑴訊息間隔時間短;⑵選擇性且針對性強;⑶傳遞訊息時回饋迅速;⑷對所得到的訊息易於理解,並能給予適當的評價。 缺點:⑴資訊的可靠性和準確性難以檢驗;⑵往往只有少數人有參與直接交流的機會;⑶不可能為以後的加工進行情報累積。
三、資訊交流機制
(一)社會資訊流的形成
社會資訊流是一種普遍存在社會現象,是資訊從生產者R經過或不經過其他社會環節,最終轉移到利用者R的流動過程。 S與R是透過社會資訊流來連結的。
(二)資訊交流與傳播中的棧
1.資訊棧(W):是資訊從S向R流動過程中所經過的環節。它必須是人或人工系統,如出版機構,資訊機構,廣播系統,圖書館等,其功能是接收,處理,儲存和傳遞訊息。
2.棧交流:有訊息棧參與的社會訊息傳播過程,稱為「棧交流」。
3.零棧交流:S與R的直接交流稱為「零棧交流」。
(三)直接交流與社會代理人交流
依交流過程中有無資訊棧參與,資訊交流可分為直接交流(零棧交流)與間接交流(棧交流)。
1.資訊交流中的社會代理人(中介)
是指訊息交流雙方(S或R)在訊息交流過程中,由於無法直接將訊息傳遞給另一方(R或S),於是將訊息交流行為轉移到社會中的訊息棧,由訊息棧代理S或R來傳遞交流訊息,從而完成訊息交流。資訊棧稱為代理者(A),棧交流稱為社會代理交流。
2.直接交流與社會代理交流的區別
⑴直接交流是S-R的直接聯繫,它的媒介系統是純自然的、客觀的,沒有社會因素的介入。而社會代理交流則是藉助於社會系統的介入才完成的交流。直接交流生動,直觀,回饋迅速,時間間隔短,而社會代理交流,則沒有這些特徵。
⑵直接交流中來源資訊(即S提供的資訊)或需求資訊(R提出的資訊)是直接溝通的,是S或R的直接聯繫,其資訊內容不會受到社會系統的介入與控制。而社會代理交流的來源資訊和需求資訊均需由A代理,受A的影響。另一方面,許多專職的社會代理資訊機構對資訊的傳播具有監督和評價功能,比較嚴謹,直接交流則具有較大的隨意性。
⑶S-R直接交流時,都是共時交流,而社會代理交流中,既有共時交流,又有歷時交流。
⑷直接交流是S-R關係,社會代理是S-A-R關係,但S-A-R關係可以轉換成S-R關係,因為A是代理者。
⑸當A出現多層代理時,根據其傳遞性特點,可以將與其直接聯繫的一次代理視為全部代理。
(四)訊息傳遞模式
1.多向主動傳遞
這種方式是S或A針對整個社會的需要將自己生產或收集到的信息主動傳遞給事先未確定的接受者R。網路上提供的各種目錄,索引,文摘等工具就屬於多向主動傳遞模式。
2.單向主動傳遞
這種方式是S或A在調查了解使用者需求的基礎上,將資訊傳遞給事先確定的接受者R,它的主要形式是定題服務。這是專業資訊服務中的高階階段,所傳遞的訊息具有針對性和及時性,能充分發揮其效用。這種方式一般是S或A與R之間有固定的和較為密切的合作關係,S,A了解R的資訊需求,從而能夠準確,及時地提供資訊。
3.多向被動傳遞
這種方式事先也沒有確定的接收者,是A面向整個社會開展的資訊服務,如圖書館,資訊中心的書刊資料閱覽和借閱服務,網站資訊服務等。在這裡,來到資訊中心或圖書館的用戶,點擊網站資訊的用戶是主動的,而訊息傳遞本身是被動的,故也稱為無向被動傳遞。
4.單向被動傳遞
此方式主要指由S或A所進行的資訊諮詢服務。 S或A往往不了解R是誰,他們需要什麼樣的訊息,而是根據自己掌握的知識,經驗和資訊資源接受R的諮詢。諮詢是由R提出問題,對S或A來說是被動的,而訊息傳遞的對象又是特定的諮詢者R,而所以這種訊息傳遞稱為單向被動傳遞,也稱為有向被動傳遞。
上述傳遞模式特徵的比較
⑴多主動傳遞是專業資訊服務所進行的各種資訊傳遞中最基本,最重要的資訊傳遞,它構成資訊服務與資訊管理工作諸環節的核心,以它為中心環節形成資訊管理的工作流程。
⑵多傳遞一般較單向傳遞容易,因為單向傳遞有特定的目標,需要A花許多精力和時間去了解特定使用者的需求,難度自然增加。與被動傳遞比較主動傳遞較為容易,因為有較為充裕的時間進行準備。
⑶有向傳遞是資訊服務的理想目標,只有定向,才能將訊息傳遞給特定的利用者,從而最大限度的發揮訊息的效用。有向傳遞中最大量的是有向被動傳遞,有向被動傳遞開展以多項主動傳遞為基礎,反過來又可以發現多向主動傳遞中存在的問題和缺點,從而加以改進,使信息傳遞過程中各個環節不斷改進、完善。
四、網路資訊交流
(一)網路資訊交流的興起
網路作為一種新興的資訊載體,與傳統的載體相比,具有許多不可比擬的優勢,主要表現在:
⑴網路的傳播與更新速度快,提供了最快捷,最方便的傳播方式;
⑵資訊量大,內容豐富,在資訊數量和資訊類型上,對於傳統印刷型出版物是無法想像的;
⑶檢索方便,人們透過搜尋引擎E-mail,論壇等取得所需資訊,容易取得並便於保存;
⑷超文本和多媒體的結合,數據中包含與其他多媒體形式信息的鏈接,豐富了網絡信息內容,增加了網絡親和度;
⑸互動性強,這是網路媒體最獨特的特徵之一,使用者透過網路的互動性,可以及時獲取資訊以及其他使用者的回應和回饋,形成雙向交流。
(二)網路資訊交流的模式及特點
1.網路資訊交流模式
⑴此模式中,資訊使用者分為四種,分別為:
①網路資訊的生產者,主要是原始資訊的生產者,它既可以是個人,也可以是群體,如政府,企業等。
②網路資訊發佈者,將原始資訊透過資訊科技方式發佈在網路上,使用戶透過瀏覽頁面,透過資訊執行者得到所需資訊。
③網路資訊執行者,作為某個中間環節執行資訊使用者的資訊需求,然後將執行後的資訊傳給要求資訊的使用者。
④網路資訊使用者,指接受並利用資訊的個人或群體。
在主要交流管道中,資訊生產者生產的資訊經資訊發佈者發佈到互聯網上,互聯網不僅包括專用網絡,公用網絡,還包括各種其他的網絡,資訊使用者可以透過各種管道利用資訊。由於資訊交流是一個雙向的過程,資訊生產者也可以是資訊使用者,資訊發布者也可以是資訊執行者。同一用戶在網路條件下可以扮演多種角色。網路資訊的生產者與使用者可以重疊。
⑵依據網路資訊交流模式,可將網路資訊交流過程分為三個階段:
①資訊產生階段。資訊生產者的資訊透過資訊發布者發佈到網路上。原始資訊的來源很廣泛,一方面是出版商全面建立和提供數位化期刊,向網站提供遠程,虛擬的數位化館藏以及檢索,傳遞和長期保存服務,形成可廣泛利用的數位化資訊資源體系。另一方面資訊生產者可以直接在網站上生產資訊。這樣資訊生產者也行使了資訊發布者的責任。
②資訊交流階段。資訊生產者和資訊使用者藉助於電腦或終端,透過Internet或Web網站進行的網路資訊交流活動。從資訊流的角度來看,此模式資訊交流過程隱含有以下幾種最基本的資訊流過程:a)資訊生產者-網站-資訊生產者,表示資訊生產者與網站進行資訊的溝通與回饋。 b)資訊生產者-網站-資訊使用者,表示資訊生產者將自己生產的資訊透過網站傳遞給某一或多個資訊使用者。 c)訊息使用者-網站-資訊使用者,表示訊息使用者與網站進行資訊溝通與回饋。 d)資訊使用者-網站-資訊生產者,表示資訊使用者將自己的需求資訊透過網站傳遞給某個多個資訊生產者。這四種最基本的資訊流動過程,還可以複合成不同的交流過程。
③資訊獲取過程。資訊使用者直接瀏覽網頁或透過搜尋引擎向網路發出請求,透過資訊執行者取得所需資訊的過程。
2.網路環境下的正式交流與非正式交流
⑴傳統資訊交流:①非正式交流:是指訊息在資訊來源和資訊使用者間的直接傳遞,諸如座談,談論,報告,展覽,演示,參觀等,具有明顯的個體性。 ②正式交流:是指資訊部門借助於文獻資訊系統,以文獻為媒介,向資訊使用者進行資訊的間接傳遞,如文獻的蒐集,整理,存儲,檢索,綜合,研究,分析,提供等,其基本表現是已經正式出版發行的文獻的交流,具有明顯的社會性。 二者的主要差異在於資訊來源和資訊使用者是否透過文獻資訊系統並以文獻為媒介進行資訊的傳遞。
⑵網路環境下的資訊交流可依據是否有專職資訊人員的參與分為:正式資訊交流與非正式資訊交流。 ①在資訊由資訊來源到資訊使用者的資訊儲存與傳遞過程中,有專職資訊人員參與的交流為正式交流;②反之,沒有專職資訊人員參與的,自發性的個別交流屬於非正式資訊交流。這種劃分方法的實質是以交流資訊有無過濾和控制為標準的,對交流資訊進行嚴格審查控制,並將其透過資訊系統傳遞出去就是正式交流過程,反之就是非正式交流過程。
⑶網路環境下非正式交流相對於傳統非正式交流具有一些明顯的優點:①網路非正式交流可以不受時間和空間的限制,更方便,大大提高了交流的效率。 ②網路非正式交流的間隔時間更短,交流更迅速,更快捷,可非常方便地以即時方式與同行進行切磋交流。 ③網路非正式交流的成本較低。
3.網路資訊交流中的棧
我們把網路資訊交流所需的載體,使用工具和平台統稱為網路資訊交流的中介。根據中介對資訊交流內容控制度的不同,可以將其劃分為純技術型中介,內容選擇控制型中介和內容完全控制型中介。與之相對應,可以將網路資訊交流分為零棧交流,準棧交流和有棧交流。
⑴①純技術型中介:是指僅提供網路資訊交流的技術支援系統,不參與對交流內容的控制。 ②零棧交流:是指在網路資訊交流過程中僅有純技術型中介的參與,只是提供物理技術層面的支持,對交流內容不做幹預和控制,如發送E-mail,QQ交流,微信交流,手機簡訊等。
⑵①內容選擇控制型中介:是指可對交流內容進行過濾控制,但僅做刪除或屏蔽,而不對內容進行組織整理,例如BBS,個人網站,Blog,新聞組等。 ②準棧交流:即是指內容選擇控制型中介參與的交流,如果中介沒有對交流內容進行過濾操作,則對用戶來說相當於零棧交流;如果中介對交流內容做出了刪除或屏蔽的操作,對使用者來說則相當於有棧交流。
⑶①內容完全控制型中介:是指對網路資訊進行採集,控制,組織,存儲,發布和管理的中介。 ②有棧交流:就是指內容完全控制性中介所參與的網路資訊交流。如各大期刊資料庫商,各大網站,數位圖書館等機構。它們具有一整套嚴謹的訊息接收處理和傳遞的操作規範,對訊息進行品質控制,序化等處理,對訊息內容的控製程度最強,在訊息交流過程中擔當了非常充分的訊息棧角色。
(三)行動資訊交流
行動資訊交流是在行動網路興起和發展下的一種新興的資訊交流方式。行動網路是指從可連接到無線網路的行動裝置上使用網路連線的應用程式或基於瀏覽器存取網際網路。
行動網路的特性表現在:①持續的網路連結性;②位置感知;③互動功能。
(四)網路管理下的科學資訊交流
1.科學資訊交流的涵義及特點
⑴意義
①科學資訊交流過程:指從科學資訊的發布者到資訊使用者之間各環節的資訊工作流程,是專門針對科學資訊的一種資訊交流過程。一般可分為科學資訊的發布,傳遞,組織,存儲,檢索和服務等幾個基本環節。
②正式交流:透過科學文獻系統,利用科學文獻載體進行交流的過程被視為正式交流,又稱間接交流過程。
③非正式交流:主要依靠科學家,專家之間的個人接觸來進行,稱為非正式交流,又稱為直接交流過程。
⑵特點
①資訊流程濃縮融合,職能角色要素淡化,整個交流活動以資訊流動為主。
②資訊流速加快,流量加大。
③資訊機構的虛擬化。
④資訊交流方式增多,非正式資訊交流地位提升。
2.科學資訊交流的工具與及應用
ResearchGate,Mendely,Academia,科學網,學術公眾號等
補充
資訊失真的表現形式及其主要原因
⑴主要形式:①物理失真;②語意改變;③語用衰減
⑵主要原因:①技術或通道障礙;②資訊堆疊過多;③社會因素;④自然因素
第三章 資訊分佈
一、資訊產生與分佈中的馬太效應
(一)馬太效應的表現與功能形式
1.馬太效應
在社會訊息流的產生,傳遞和利用過程中,我們發現訊息及相關因素常常表現出明顯的核心趨勢和集中取向,如少數出版社會成為某類圖書的權威出版機構,少數作者因寫得最多,被引率最高而成為某一領域的核心作者,少數網站集中了大量用戶等,這就是資訊產生和分佈中的馬太效應。
馬太效應在人類社會中普遍存在,因而被廣泛的引申與應用。馬太效應真實地概括了人類社會生活中的慣性,描述了優勢和劣勢的累積過程:一經存在有優勢,這種優勢局面就會不斷加強,反之若處於劣勢,則這種不利條件也會繼續加劇。
2.馬太效應在文獻資訊分佈的表現
由馬太效應引起的資訊富集分佈表現為核心趨勢和集中取向。
⑴核心趨勢:如高產作者群體的形成,期刊資訊密度增大,高頻詞彙的確立等,都是資訊生產主體的主動期望與採取實際步驟的結果。
⑵集中取向:如一篇論文多次被引,一個網站被眾多用戶點擊,某些圖書頻繁地被借閱,這種富集是社會選擇和影響的結果,信息生產者基本上處於被動狀態。
(二)馬太效應的影響
1.馬太效應的正面影響
⑴在實際的資訊管理工作中:它可以幫助我們突出重點,摒棄平均,為資訊來源的選擇,獲取,評價和利用提供依據,為降低資訊管理成本,提高資訊利用效益提供指導和方法。
⑵在理論上:馬太效應描述的優點可以幫助我們認識資訊集中和分散的特徵,趨勢和規律,發現資訊管理學的基礎性定律。
2.馬太效應的負面影響
⑴馬太效應描述訊息對象的優勢和劣勢過度積累,容易使信息工作者按簡單的優勢進行進行信息選擇,評價,傳播和利用,走入極端,使信息工作者因循守舊,不思進取,不求變革創新,依經驗和簡單的規則從事複雜多變的資訊管理工作。
⑵馬太效應所形成的資訊分佈富集有時只是表面的、外在的。例如一篇論文被引次數多不一定表示它有較高的價值,一些有錯誤觀點或有爭議的論文也可能有較高的被引率。有的優勢累積過程帶有突發性和受統計學因素的影響,使得資訊價值失真。
⑶核心資訊來源是馬太效應優勢累積的結果,但如果過度注重核心資訊來源,就會忽略分佈在其他資訊來源中有價值的資訊。而核心資訊來源(如核心期刊)本身有一個發育過程,如果不加以控制,任其在某一方面的優勢過度積累,高度專門化,所含的資訊就會越來越單一,這對部分用戶或許有利,但它會失去更多的用戶,不利於資訊管理和資訊服務。
⑷資訊生產者的成長和數量對資訊的產生和分佈有較大影響,馬太效應青睞名人,拒絕新人的習慣勢力不利於新人成長,限制了新思想,新知識和新資訊的產生與傳播。以科技領域為例,所謂傑出新人的出現和成長由於受馬太效應的影響是很困難的,除非做出劃時代的成果一名驚人。然而循序漸進又是人才成長的普遍規律,一鳴驚人也需要長期積累,社會扶植,不斷突破。業已證明,人類的最佳創造年齡層在25歲~45歲之間,但由於馬太效應的視差,使得這一年齡段的新人和他們取得的成果被忽略,未能有效匯入社會信息流。
由上述分析可知,馬太效應的累積要適度,不能任其發展,為確保資訊產生和分佈比較科學合理,適當的干預是必需的。
二、訊息內容的離散分佈規律
(一)布拉德福定律
英國著名文獻資訊學家佈拉德福發現,某一學科領域中的相關論文在期刊中的分佈是不均勻的,而且具有明顯的集中與分散規律。他在長期的觀察和統計基礎上提出了有名的“布拉德福德分散定律”,簡稱為布拉德福德定律或布式定律:“如果將科學期刊按其刊載某個學科主題的論文數量,以遞減順序排列起來,就可以在所有這些期刊中區分出載文率最高的'核心'部分和包含著與核心部分同等數量論文的隨後幾區,這時核心區和後繼各區中所含的期刊數成1:a:a²的關係(a>1)
(二)齊夫定律
如果將一篇較長文章(約5000字以上)中每個字按其出現頻次遞減排列起來(高頻詞在前,低頻詞在後),運用自然數給這些詞編上等級序號,出現頻次最高的為1級,其次為2級…這樣一直到D級,如果用f表示詞在文章中出現的頻次,用r表示詞的等級序號,則有fr=c,c為常數。上式稱為齊夫定律。 (透過詞頻分佈來揭示訊息的分佈規律)
(三)網路資訊的內容分佈
在網絡條件下,資訊資源的分佈仍然滿足集中與分散的規律,但是網絡條件下的信息發布環境與傳統期刊出版條件相比有很大不同,因而這種集中與分散程度表現出了變化。
三、資訊生產者分佈規律
(一)洛特卡定律
1926年,美國統計學家洛特卡經過大量統計和研究,發表了一篇題為“科學生產率的頻率分佈”的論文,旨在透過對發表論著的統計來探明科技工作者的生產能力及對科技進步和社會發展所做的貢獻。直到1949年這項研究成果才引起學術界關注,並譽為洛特卡定律。根據洛特卡分析,在論文數x和作者數yx之間存在著下列一種關係:xⁿyx=c,可進一步寫成:f(yx)=c/x²,這就是著名的平方反比分佈。
(二)普賴斯定律
受洛特卡定律的啟示,普賴斯提出了核心生產者分佈的“平方根定律”,即在某一特定領域中,全部論文的半數係由該領域中全部作者的平方根的那些人撰寫的。 「那些人」無疑是核心或高產作者。此定律可表示為:∑(m 1~1)n(x)=√N,它簡潔地描述了資訊依生產者能力的分佈。
(三)網路資訊的生產分佈
網路條件下的資訊生產表現出不同的規律,生產者的分佈與資訊內容的專業化程度密切相關,資訊專業化程度越高,則生產者的集中程度就越明顯;反之,生產者的分散程度就越明顯。
四、資訊對時間的分佈規律
(一)指數成長率
1.普萊斯曲線: 如果我們以文獻量為縱軸,以歷史年代為橫軸,把各不同年代的文獻量在坐標圖上逐點描繪出來,然後以一光滑曲線連接各點,則可以十分近似地表徵文獻隨時間增長的規律,這就是著名的普賴斯曲線。透過對曲線分析,普賴斯最先註意到文獻成長與時間呈指數函數關係。
2.生長曲線:普賴斯指出,考慮物質的,經濟的,智力的及時間的影響和限制,文獻資訊的增長更趨近於生物的生長曲線,即最初生長或繁殖很快,隨著時間推移,其生長速度越來越慢,以致幾乎不增加了。
(二)逐漸過時率
1.文獻半衰期:是指某學科領域現時尚在利用的全部文獻中的一半是在多長一段時間內發表的。 「半衰期」大體上與某一學科領域的文獻中半數失效所經歷的時間相同。
2.普賴斯指數:即某一學科領域內,對發表年限不超過5年的文獻的引用次數與總的引用次數之比值。一般來說,普賴斯指數越大,半衰期就越小,文獻老化的速度越快。
3.文獻資訊老化的影響因素
⑴文獻成長:文獻的老化首先是與文獻的成長連結在一起的。文獻大量增加,顯示科學知識成長速率加快,新理論,新方法,新設計不斷產生,不斷完善,原來知識內容不全面,不完整的舊文獻逐漸被遺忘,引用頻率降低。如果引用半衰期的概念,就會發現文獻成長得越快,文獻的半衰期就越短,這就加速了文獻的老化。
⑵學科差異:不同學科的文獻老化速率差異很大。有些學科,如電子,醫學,化學化工等領域,由於研究工作活躍,不斷需要新方法,新試驗,投入的人力物力較多,知識更新快,文件的半衰期就短。而另一些學科,如動植物分類學,地理學等的發展主要是知識的積累,不是修正,所以相對來說穩定得多。
⑶學科發展階段的差異:即使是同一學科,不同的時期或階段,文獻的半衰期不盡完全相同。學科處於誕生和發展初期,文獻量指數成長,文獻的老化符合負指數函數,對應的曲線表現為負指數曲線。隨著學科研究的深入,進入相對成熟期後,科學文獻增長不再繼續保持原有的指數速率遞增,文獻增長速率變小,其相應的老化曲線也變得平緩,半衰期加長。
⑷資訊環境與需求:不同資訊使用者對文獻的需求是不同的,科研工作中的骨幹要了解本學科領域的世界前沿,因而對新文獻感興趣,剛踏上工作崗位的人員則還需要了解背景資料。此外國家與國家,地區與地區之間對文獻使用的年代也不完全相同,科學發達的國家對近期最新感興趣,欠發達國家則需要藉鑑別國已有的成果和經驗。
(三)網路資訊的時間分佈
1.網路資訊的成長規律
⑴單一網站網頁數量的成長規律。在成熟期的,僅存在正式交流過程的單一網站中,網頁累計數存在二次曲線成長規律。
⑵特定學科/主題領域中網頁數量的成長規律。指數成長模型在網路環境下研究知識管理主題領域網路學術資訊成長規律時具有強烈的適用性。
2.網路資訊的老化規律
網路資訊的老化是指網路資訊中情報的有效價值隨著時間的流逝逐漸衰減,利用率逐漸降低。造成網路資訊老化的因素主要有:
⑴網路資訊的成長。由於網路資訊總量的快速增加,單位量的網路資訊利用率降低,效用價值減少,呈現老化的特徵。
⑵網路資訊的更新。新的網路資訊的出現,導致舊有的網路資訊加速老化。
⑶網路資訊的消失。是指網路資訊從系統中刪除,不能再被存取和利用,這意味著網路資訊生命週期的結束。
⑷網路資訊的語用衰減。語用是指網路資訊對於接收者的效用價值。隨著接收者需求的實現,雖然網路資訊的客觀價值沒有改變,但接收者的效用價值卻因為他已接受了同類資訊而降低。此外,網路資訊的價值受時間的限制。
⑸其他。內因如網路資訊的類型,性質和發展階段等;外因如科技的進步,使用者需求的變化和社會環境的變化的等。
3.網路資訊半衰期
⑴借鏡文獻半衰期中的被引半衰期和引用半衰期的定義
①網路資訊被引半衰期:是指某一站點的全部資訊在某一時間段內被引用或被連結的所有資訊中較新的一半是在最近多長時間內發表的。
②網路資訊引用半衰期:是指某一站點的全部資訊在某一時間段內引用或連結的所有資訊中較新的一半是在最近多長時間發表的。
⑵以網路資訊研究物件特徵對網路資訊半衰期定義
①宏觀網路資訊資源半衰期:是指某主題領域網路資訊資源所含連結的鏈宿所指資源中較新的一半是在多長時間內產生的。
②微觀網路資訊資源半衰期:是指指向該網路資訊資源的全部其他網路資訊資源的1/2是在發布後的多長時間內出現的。
4.網路資訊生命週期
是指網路資訊從產生到失去效用價值所經歷的各個階段和整個過程。
第四章 資訊獲取
一、資訊來源的概念、屬性及特徵
(一)資訊來源的概念
資訊來源:人們在研究活動,生產經營活動,文化活動和其他一切活動中所產生的成果和各種原始記錄,以及對這些成果和原始記錄加工整理所得的成品(如數據庫,文摘索引雜誌等)都是藉以獲得資訊的源泉,簡稱資訊源。
(二)資訊來源的屬性與特徵
1.資訊來源的基本屬性
⑴客觀性
資訊來源中所蘊含的資訊是人類一切思維和社會活動的反映,資訊來源是人類知識和記憶的物質載體是客觀的。第一,它是一種客觀物;第二,資訊源所包含的知識存在的反應。
⑵可傳遞性
訊息源是訊息傳播過程中的第一要素,只有透過傳播到達接收者並被利用,才能發揮其作用。
⑶可激活性
訊息可被感知,辨識與利用,人腦對訊息源的訊息內涵進行感知,思維,分析,綜合,聯想的過程就是活化訊息源中的訊息,使其總是處於不斷傳播與使用的循環中,在循環過程中資訊可以持續調整,補充,改編與重組,使其所含內容的針對性更強。
2.資訊來源的特徵
⑴資訊來源的累積性
由於資訊是將人類的知識記載在物質的載體上,因此我們可以用物質的手段進行蒐集,整理,積累,使得人類所創造的知識,文化,技術可以不斷地延續,繼承和發展。
⑵資訊來源的複雜性
由於資訊是一切物質的普遍性,所以資訊來源的類型,載體的形態都具有複雜性。它數量龐大,內容豐富,形式多樣,隨著人類社會的發展,科學與技術的進步而快速成長。
⑶資訊來源的再生性
資訊來源與其他物質財富不同,它使用後不會消耗,反而會產生「增值現象」。同時資訊源本身也可以再生,從原始資訊源產生出二、三次資訊源。
⑷資訊來源的共享性
訊息源接收者並非是獨佔使用者,訊息源可以傳播至不同接收者同時使用,具有可共享性。
二、資訊源的分類及其特徵
(一)記錄型資訊來源(文獻資訊來源)
記錄型資訊來源:包括由傳統媒體和各種現代媒體記錄和儲存的知識信息,如各種書籍,期刊,資料庫,網站等。特點是:傳播資訊系統,方便保存,方便積累,方便利用。它是資訊存在的基本形式,也是資訊管理的主要對象。
1.依不同的物質載體
⑴印刷型:含鉛印,油印,膠印,木板印刷等。這是一種有著悠久歷史的傳統形式,由於閱讀利用方便,至今仍廣為流傳,成為傳播訊息的主要形式。其缺點是體積大,分量重,收藏要佔很大空間,管理較為困難。
⑵縮微型:一般指以感光材料為載體,利用光學記錄技術使印刷型文獻按比例縮小的文獻資料,包括縮微膠卷,縮微膠片和縮微卡片等縮微品。
⑶電腦閱讀型:它是將文字和影像轉換成二進位數位代碼,記錄在磁帶,磁碟或光碟等載體上。閱讀時再由電腦將它輸出,轉換成文字或圖像。它能儲存大量信息,並以極快的速度從中取出所需信息。
⑷網路型:網路資訊來源:是一種新型的數位化資訊資源,是透過網路可以利用的各種資訊資源的總和,指所有以電子資料形式把文字,圖像,聲音,動畫等多種形式的信息儲存在光,磁等非紙介質的載體中,並透過網路通信,電腦或終端等方式再現的資源。它直接在網路上產生,發布,儲存和傳播,如各類網路書刊,網路新聞,網站資訊等,可以下載儲存在其他載體上。
2.依不同內容、性質及加工情況
⑴一次資訊:凡是在科研,生產、經營,文化及其他各類活動中生產的原始信息,稱為一次信息,如期刊論文,研究報告,市場調查報告,專利說明書及各種網絡信息。
⑵二次資訊:是對一次資訊進行加工整理後產生的一類訊息,如書目,題錄,簡介,文摘等形式的檢索工具。二次資訊的重要角色不僅在於報道,更重要的是為尋找一次資訊提供線索。
⑶三次資訊:是在一次,二次資訊的基礎上,經過分析綜合而產生的資訊。人們常把這類資訊稱為資訊分析研究的成果,如綜述,述評,學科年度總結,文獻指南,書目之書等。
3.依編輯出版形式的不同特點
圖書、期刊、會議資料、專門報告、專利資料、政府出版品、學位論文、產品樣本、檔案、標準、新聞報紙等。
(二)實物資訊來源
實體資訊來源存在於自然和人工製品中,是由實物攜帶和儲存的知識訊息,人們可透過實踐,實驗,採集,參觀等方式交流傳播,如某種生物的樣品,產品樣機,工藝品等。實體資訊來源直觀生動,含有豐富的訊息,易於理解和吸收。這類資訊來源無法直接進入資訊系統,要對其進行管理,必須先將它轉換成記錄性資訊。
(三)智力型資訊來源
這類資訊來源主要指由人腦儲存的知識訊息,包括人們掌握的各類知識,訣竅,技能和經驗,有的可以用語言和文字明確表達和記錄,有的則難以明確表達和記錄,故又稱為隱性知識。這類資訊由人的活動攜帶,並根據社會需求提供各類諮詢服務,幫助使用者解決問題。對這類資訊來源主要透過政策,法規來進行組織,協調和管理。
(四)零次資訊來源
零次訊息:是人們透過直接溝通所獲得的訊息,是訊息客體的內容直接作用於人的感覺(包括聽,視,嗅味,觸覺)的結果,而不像記錄型訊息和實物訊息那樣透過某種物質載體的基礎形式作用。因此零次資訊具有直接性,及時性,新穎性,隨機性,非存儲性等典型特徵。
這類訊息源是指各種管道中由人的口頭傳播的訊息。零次資訊的存在形式,傳播管道具有較大的隨機性,難以儲存和系統積累,給這類資訊管理帶來了很大困難,需要採用特殊的方法蒐集,記錄,整理和存儲。
三、資訊品質的評價
資訊品質評價的意義
資訊品質評估是以使用者的需求和滿意度為導向,從多角度,多層次對資訊的品質進行評估,其目的是為人們提供高品質的資訊資源,以更好地滿足資訊使用者需求,具有十分重要的理論意義與實務意義。
第一,資訊品質評估有利於提高資訊來源的使用率;第二,能夠促進提高資訊來源的品質;第三,能夠客觀地反映資訊來源的社會影響力或學術影響力;第四,能夠提高資訊來源的品質;第三,能夠客觀地反映資訊來源的社會影響力或學術影響力;第四,能夠提高資訊資源管理的效率;第五,能淨化資訊環境。
(一)資訊品質評價的一般維度與指標
資訊品質是一個全面的概念,包括四個維度:準確性、完整性、一致性和及時性。
1.基於資訊內容的評價維度與指標
資訊內容的評估是對資訊資源的內在品質進行判斷和估算,是最根本、適用性最廣的評估維度,主要涉及正確性,完整性,相關性,新穎性這四個指標。
2.基於資訊表達形式的評估維度與指標
訊息主要透過符號來表達和傳遞,訊息使用者只能透過訊息表達形式來理解和利用訊息。因此資訊的表達形式是評估資訊資源品質的重要維度,包括資訊表達的準確性,可理解性,精簡性以及標準化程度這四個基本評估指標。
3.基於資訊資源系統的評估維度與指標
資訊資源系統由各類資訊資源活動要素組成,此系統效能的優劣是資訊品質高低的直接體現。基於資訊資源系統的評估維度主要涉及資訊的可獲取性,快速響應性以及可靠性三個指標。
4.基於資訊資源效用的評估維度與指標
這是從資訊使用者的角度來評估資訊品質。這種評估方式可以辨識出目標用戶,發現資訊資源內容與用戶期望之間的直接差距,主要包括資訊的可用性,適量性以及價值增值性三個重要指標。
(二)資訊品質評估的方法與實施
1.資訊來源的評價與選擇
⑴資訊來源的評估要達到兩個目標:①確定資訊是透過哪一種資訊載體、從什麼樣的資訊來源所獲得的;②確定資訊發生的意圖和可靠性。
⑵蒐集到各種資訊之後,先將它們依資訊來源的類型分開整理。然後檢查各類資訊來源所攜帶的資訊是否正確可靠,是不是附加了某種限定條件等。以資訊來源整理資訊不僅能很好地掌握其分類範疇,還可以系統性地檢驗、評價資訊的意義和價值。
⑶此外,還可以根據利用資訊來源的目的來劃分各類資訊來源。對於綜合性利用的資訊來源,也應依其不同的目的將綜合利用的形式依類分開,這樣就能使資訊來源有序化,對其中使用率較高者進行經常性的資訊追蹤與監視。
2.資訊品質評價的基本方法
⑴定性評價法
定性評估方法:是根據資訊評估目的和服務對象的需求,依據一定的準則,首先確立評估標準,建立相關指標體系,進而對評價對象實施評估。
常見的資訊品質定性評估法包括:問卷法,訪談法,觀察法,對比法,模擬法,同儕審查法。
⑵定量評價法
量化評估法:是將反映資訊品質的指標以具體的數字、公式客觀地表示出來,主要採用統計、數學或經濟模型的方法。
常用的量化評估方法包括:資訊熵評估法,資訊計量學評估法(文獻計量學、網路計量學),統計類評估法
⑶綜合評價法
綜合評估方法:是將定性與定量方法結合起來使用的一種評估方法。
常用的綜合評估方法包括:層次分析法,模糊綜合評估法,關聯矩陣法,評估性元資料方法,資訊建構方法等。它們是進行資訊評價,尤其是網路資訊資源評估的重要方法。
3.資訊品質評估的實施
⑴明確評價目標
資訊品質的評估涉及訊息,資訊服務以及資訊使用者等諸多方面,在評估之初應該明確評價的具體對象,確定評價的主要目標。
⑵分析論證評估對象
根據評估目標從多種途徑收集有關數據,資料,對評價對象的各個要素及性能特徵進行全面分析,論證評價對象的必要性,可行性,建立評價指標體系,制定評價的準則。
⑶列舉並評估方案
方案評估是資訊資源品質評估活動的中心環節,每個待評估的方案都應該有清楚的評估要素,評估方法等。
⑷選擇最佳方案
通常根據經濟性,便捷性,有用性原則來選擇最佳方案。
⑸進行評價
四、資訊取得途徑
(一)資訊獲取的效率指標
這些指標一般透過資訊內容與資訊需求的相關程度,即切題性或相關性的概念來決定。
⑴採全率
採全率用來衡量切題資訊蒐集的完整程度,指某一資訊系統所含的全部切題性資訊在當時系統內外所有切題資訊中所佔的比例。資訊採全率可表示為:P=r/R
⑵採準率
採準率用來衡量資訊蒐集的針對性,指某一資訊系統所含的全部切題訊息,在當時該系統所有資訊中所佔的比例。 E=r/Q
⑶及時率
及時率用來衡量資訊蒐集的速度,也就是在最短的時間內完成資訊蒐集過程的能力。它是由蒐集過程的每一環節(從資訊的產生到其被輸入到資訊庫)所花費的總時間來計算。 T=∑(i=1,n)t
⑷費用率
費用率用來衡量資訊蒐集的資金效率,指用於資訊庫中單位資訊的費用的最低能力。它取決於蒐集過程的組織、各環節的技術裝備及其他因素。 C=F/G
⑸勞動耗費率
資訊蒐集的勞動耗費率指資訊系統蒐集到的單位資訊所耗費的最低勞動量,可用蒐集過程中所有環節的勞動消耗總數來計算。 L=∑(i=1,n)li
在資訊蒐集的上述效率指標中,當採全率和採準率達到一定程度之後,二者之間將呈現出一種反向互逆關係,即在及時率,費用率和勞動耗費率既定的情況下,採全率越高,採準率越低,反之採準率越高,採全率就越低。
(二)資訊蒐集的原則
1.針對性
⑴任何資訊服務機構蒐集資訊的目的都是為了提供利用,因此必鬚根據本機構的性質,任務和服務對像有針對性地確定資訊蒐集的範圍和重點。
⑵為了準確的蒐集訊息,必須仔細調查資訊需求和資訊來源。 ①首先要弄清楚資訊機構服務對象的範圍以及他們經濟,科技,文化和其他方面的歷史,現狀,趨向及其對資訊的需求和利用狀況;②其次,要弄清他們所需要的資訊的分佈狀況;③最後弄清楚透過什麼管道,何種載體獲得這些資訊。這樣就能在蒐集資訊時做到胸中有數,加強針對性,避免盲目性。
2.系統性
⑴資訊服務系統要卓有成效地進行資訊服務,滿足使用者的資訊需求,需要追蹤科學技術和國民經濟發展進程,了解和掌握資訊來源的動態變化,有系統地、連續地蒐集和累積相關的資訊。資訊的連續性和系統性是資訊發揮其效用的前提條件,可分為縱的系統和橫的系統。縱的系統依產品,工藝,學科,專業或專題進行累積;橫的系統可依資訊的載體或類型進行累積。
⑵只有連續地,有系統地蒐集和累積訊息,才能充分發揮資訊服務的效用,尤其是重點資訊來源的蒐集,更應力求保持系統,連貫和完整。如果一個資訊服務系統蒐集和累積的資訊缺乏連續性,系統性和完整性,就無法在需要時滿足使用者的需求,從而使資訊服務喪失信譽。
3.預見性
⑴由於資訊的成長和老化不斷加速,在資訊蒐集中不僅要充分注意現存的資訊來源和資訊管道,還要著眼未來,預見可能產生的新的資訊來源和資訊管道。這樣才能既滿足當前的資訊需求,也能適應未來發展所帶來的資訊需求。
⑵為此,應密切注意科學技術與經濟的發展水準、動向與趨勢,隨時留意新資訊來源與資訊管道的產生及發展,預測資訊來源的集中與分散,成長與老化趨勢,充分估計使用者未來的資訊需求,有預見性地蒐集資訊,提高資訊服務的主動性。
4.科學性
當代資訊來源數量龐大,形式多樣,內容重複分散,品種繁雜,為資訊的選擇和蒐集帶來了極大的困難。因此需要經常採用科學方法研究資訊來源的分佈規律,選擇並確定資訊密度大,資訊含量多的資訊來源。
5.計劃性
⑴任何一個資訊機構,要用有限的人力,物力和經費獲取最有效的資訊來源,就必須事先制定比較周密,詳盡的資訊蒐集計劃,以便按計劃有目的,有步驟地蒐集資訊。
⑵資訊蒐集計劃從時間的角度可分為長期,中期和短期計劃或年度和季度計劃;從其內容角度可分為綜合計劃,專題計劃,補配計劃。蒐集計畫的項目一般包括:蒐集資訊的內容範圍,重點資訊和一般資訊的劃分及其比例,採購標準,經費預算,完成計畫的主要措施和保證等方面。
(三)資訊蒐集的方法與途徑
1.採購
採購是一種經常性的,穩定的,系統的蒐集和獲取資訊的有效方式,無論對團體還是個人都非常適用。採購包括訂購,現購,郵購,委託代購等具體方式,可根據採購規模和自己的需求進行選擇。
2.調查
用調查方式不僅可以取得記錄型資訊來源,還可以取得非記錄型資訊來源,尤其是零次資訊。調查既包括訪談,也包括對實物,現場的實地考察蒐集,如現場調查,訪問,發放問卷,樣品收集等。
3.交換
利用本系統所擁有的資訊來源與其他單位或系統進行交換,互相調劑,互相補充,擴大資訊來源,包括傳統的文獻資訊交換和網路資訊或資料交換。
4.索取
對於尚未發表的資訊或不透過正式管道流通的資訊來源,以及已經發表或公開流通,但還不夠詳細完備和全面的資訊來源,根據需要與可能,可以透過通訊聯繫或直接派人聯繫取得,這種方法成為索取。
5.檢索
即以手動方式或電腦方式從各類不同的資料庫和資訊系統中查詢所需的資訊。手動檢索主要透過各類檢索工具獲得資訊來源的線索,如果需要原始訊息,也要進行二次檢索。電腦檢索不僅可以獲得資訊來源的線索,還能直接獲得原始資訊。
6.網路爬取
利用網路機器人Robot或網路蜘蛛Spider定期到指定的網站去自動抓取部分或全部網路資訊。
五、網路資訊取得與利用
(一)網路資訊來源及其特點
網路資訊來源:是一種新型的數位化資訊資源,指透過網路可以利用的各種資訊資源的總和。具體地說,就是指所有以電子資料形式把文字,圖像,聲音,動畫等多種形式的信息存儲在光、磁等非紙介質的載體中,並通過網絡通信,計算機或終端等方式再現出來的資源。與傳統的資訊來源相比,網路資訊來源的特徵主要表現在:
1.資訊數量大,內容豐富
網路是一個開放的資料傳輸平台,上面的資訊資源數量龐大,類型多樣,如學術,商業,政府,個人,娛樂,新聞資訊等。它一方面為用戶提供了較大的資訊選擇空間,另一方面大量無價值的冗餘資訊也給用戶帶來了很大的麻煩。
2.資訊更新及時,變化加快
由於網路技術的發展,與傳統資訊來源相比,網路資訊來源變化更加快速新穎,且資料量不斷增加。
3.資訊表現形式多樣化
網路有著表現形式豐富的資訊資源,如聲音,圖像,文字,視頻,動畫等,在多媒體形式表現的同時,用戶跟資訊之間的互動性得到極大的增強。
4.資訊非線性排列,無序性增強
網路資訊來源利用超鏈接,構成了立體網狀資訊鏈,把不同國家,不同地區,不同內容,不同格式的資訊透過節點連結起來,使得資訊之間的關聯性增強。但同時無序性的狀態也日益突出。
(二)網路資訊的獲取
1.搜尋引擎
作為網路資訊組織的重要方式,同時也是網路資訊檢索的重要工具,搜尋引擎透過在網路上提取各個網站的資訊來建立自己的資料庫,並向使用者提供查詢服務,它一般有三部分組成:資訊搜尋器,索引器,檢索器。
(搜尋引擎:是指接受使用者的提問,檢索資料庫,並將與使用者提問相符的資訊物件回饋給使用者的檢索工具。廣義地講,搜尋引擎不僅指檢索程式本身,而且還指檢索介面,相關的入口,程序,以及支援它的索引資料庫和服務。
2.數位圖書館
數位圖書館:是一種館藏以數位化格式存儲,可以利用電腦存取的圖書館。數位化的內容可以儲存在本地端或透過電腦網路由遠端存取。數位圖書館可說是一種資訊檢索系統。
(數位圖書館:保存數位格式儲存的電子文獻,並透過電腦和網路傳遞所藏數位化訊息,同時對網路資訊進行虛擬鏈接,並提供服務的實體性或虛擬性的資訊機構或資訊機構群。)
數位圖書館的資源類型主要有:①全文資源,包括電子期刊,電子圖書,電子報紙,開放式著作檢索,發表及存檔數據庫,電子博碩士論文,電子檔案等;②二次文獻和書目信息,包括線上檢索目錄,摘要索引資料庫等;③多媒體資源,包括獨立靜態影像,動態影像,錄音資料,動畫等。
3.學科資訊門戶
學科資訊入口網站:是使用者存取某學科資源與服務的單一入口或通道。它是一種網路服務,用於完成本學科網路資源內容的高度組織整合和網路應用程式的聚集,並將這些資源與應用程式整合在一個可自訂個人化的介面中,來滿足每個最終用戶的需要。從使用者角度來看,它是某學科使用者存取該學科網路資源和服務的起始站點或入口。
學科資訊入口網站的核心特徵:①資訊和應用的整合整合;②跨系統一站式檢索;③簡單統一介面;④可自訂。
4.開放資料平台
在大數據背景下,政府機構、聯盟紛紛制定應對大數據策略的對策,並以開放資料為重要組成部分甚至核心。在科學研究領域,開放資料正在成為推動數位學術交流和科學研究的關鍵角色。順應開放資料的發展趨勢,在各方政策的共同推動下,越來越多的研究資料倉儲平台被建立,並提供資料的公共存取取得。
5.社會化問答平台
社會問答平台:又被稱為問答社區或問答平台等,是一種基於社區的,鼓勵用戶參與以實現網上互動的平台,其本質是通過信息共享與傳播以及問答過程和結果的公開來實現用戶間的共同協作。
第五章 資訊組織
一、資訊組織的基本原理
(一)資訊組織的概念與內容
1.資訊組織的概念
資訊組織:亦稱資訊整序,是利用一定的規則、方法和技術對資訊的外部特徵和內容特徵進行揭示和描述,並按給定的參數和序列公式排列,使資訊從無序集合轉換為有序集合的過程。
2.資訊組織的基本對象
⑴資訊的外部特徵
是指訊息的物理載體直接反映的訊息對象,構成訊息的外在的、形式的特徵,如訊息載體的物理形態,題名、作者,出版或發表日期,流通或傳播的標記等方面的特徵。
⑵資訊的內容特徵
就是資訊包含的內容,它可以由關鍵字,主題詞或其他知識單元表達。
3.資訊組織的基本內容
⑴資訊選擇
資訊選擇的目的就是從採集到的,處於無序狀態的資訊流中甄別出有用的信息,剔除無用的信息,它是整個資訊組織過程的第一步。
⑵資訊分析
資訊分析是依照一定的邏輯關係,從語意、語用和文法上對選擇過的資訊內、外表特徵進行細化,挖掘,加工整理並歸類的資訊活動。它是資訊描述與揭示的前提與基礎,直接影響資訊組織的品質。
⑶資訊描述與揭示
資訊描述,亦稱資訊資源描述,指根據資訊組織和檢索的需要,對資訊資源的主題內容,形式特徵,物質形態等進行選擇,分析與記錄的活動。資訊描述與揭露主要分為兩種:一是著錄,主要描述文獻資訊的形式特徵;二是標引,主要揭示文獻資訊的內容特徵。
⑷資訊存儲
資訊儲存是將經過加工整理序化後的資訊依照一定的格式與順序儲存在特定的載體中的一種資訊活動。資訊儲存的目的是為了方便資訊管理者和資訊使用者快速且準確地識別、定位和檢索資訊。資訊儲存於各種檢索工具中,意味著資訊組織過程的終結,也即意味著資訊檢索的開始。
(二)資訊組織的類型(基於資訊或資訊來源的分類)
1.按資訊的表現形式劃分
①文字訊息組織②影像資訊組織③聲音訊息組織④視訊訊息組織
2.依資訊加工的程度
①一次資訊組織②二次資訊組織③三次資訊組織
3.依訊息的傳播載體劃分
①文獻資訊源組織②網路資訊源組織
(三)資訊組織的原則(四項基本原則)
資訊組織的對象,方法和過程都不是簡單劃一的,這種複雜性和變易性要求我們:無論是對社會資訊流的宏觀資訊組織,或是對社會資訊流分支的微觀資訊組織,都必須在一定在科學原則的指導下,實際避免資訊組織工作的隨意性,無計劃性,盲目性等現象的出現,從而使資訊組織真正發揮整序資訊、科學分流、促進選擇、保證利用的功能和作用。
1.客觀性原則
⑴客觀性原則率先確定了資訊描述和揭示的資料來源必須是客觀存在的資訊本身。同時客觀性原則也為我們具體進行資訊組織工作提出了相應的要求:
⑵在資訊組織中我們無法損害資訊的本來效用,不扭曲資訊本身,也不肢解資訊本身。不能毫無根據地,人為地添加一些不準確的思想和觀點,要完整地,全面地,精確地反映資訊的客觀特徵。
⑶客觀性原則也要求我們不斷追蹤資訊源的發展變化和資訊組織技術的發展變化,使資訊組織與條件變化和環境變化保持客觀一致。
2.系統性原則
⑴沒有系統性的資訊組織工作是不可能實現其整體目標的,為實現資訊組織的系統性,我們必須掌握四個關係:
①宏觀資訊組織和微觀資訊組織的關係。資訊組織機構不僅要立足自身的實際情況,還要考慮更大範圍內資訊組織的市場份額和分工協作,從而形成一個完善的宏觀資訊組織工作體系。
②資訊組織部門與其他部門的關係。要注意資訊機構內部各部門之間的協作關係,特別要注意與從事資訊蒐集和資訊傳播的兩類部門以及進行機構日常管理的行政部門的關係,以便在資訊機構良好運作的環境下,保證訊息採集——資訊組織——資訊檢索——資訊傳播一條龍工作流程的暢通。
③資訊組織工作各環節之間的關係。資訊組織工作本身也具有多個環節,保持各個環節的正常聯繫有助於使資訊組織工作能一環緊扣一環,其中特別要注意資訊分析與描述的基礎性地位,它是資訊揭示和存儲的必要準備。
④不同資訊處理方法之間的關係。由於資訊本身的特殊性,在具體進行某一類資訊的組織時必須充分滿足於這種特殊性,但也必須全面掌握各種資訊處理方法的極大相似性,盡可能採用統一而規範的處理方法。
⑵用系統的觀點和方法來進行資訊組織工作的協調管理,有助於發揮資訊組織的整體優勢,也有助於實現資訊組織的整體功能。
3.目的性原則
⑴資訊組織具有鮮明的目的性,必須圍繞使用者資訊的需求開展工作,注意資訊機構的目標市場的需求狀態及其變化特徵,滿足成本效益對稱的原則。
⑵因此,資訊組織工作必須積極進行使用者研究,充分了解使用者需求,並改善資訊組織方式,讓資訊組織成果能大幅方便使用者選擇和利用。
⑶此外,為了實現資訊組織的目標,還必須注意資訊工作的規劃性和長期性,以及對資訊機構本身性質,特徵和能力的適應性。
4.現代化原則
⑴資訊組織現代化原則包括思想觀念現代化和技術手段現代化兩個面向。
⑵資訊組織的思想觀念現代化集中體現在資訊組織的標準化。資訊組織的標準化主要體現在資訊組織工作的統一性、資訊組織方法的規範性、資訊組織系統的相容性、資訊組織成果的通用性。資訊組織的標準化主要包括:①基本術語標準;②相關資訊科技標準;③資訊組織技術標準,④其他相關標準。
⑶資訊組織的技術手段現代化已經充分證明,現代資訊技術在資訊組織中的廣泛推廣和應用形成了不可逆轉的資訊組織自動化方向,自動標引,二次資訊自動生成和資料庫建設成為目前已經比較成熟的資訊組織自動化成果。資訊組織的技術手段現代化,改變了傳統的手工方式,大大提高了工作效率和工作質量,更好地滿足了用戶的多樣化資訊需求,與資訊管理發展大趨勢相契合。
(四)資訊組織的理論基礎
1.語言學
語言是人類最重要的溝通符號系統,也是訊息的載體。要把龐雜分散的資訊組織成有序優化的整體,就必須建立符號系統,有了這種符號系統,資訊系統的有序特徵才能體現。儘管各種資訊組織符號系統的形式不同,但都和自然語言一樣有著共同特徵:有語詞,有詞彙,有文法。這就資訊組織的語言學基礎。
2.邏輯學
邏輯學是關於思維規律的科學。思維有形象思考和抽象思考兩種形式。資訊組織屬於抽象思考的範圍,是在各種概念的基礎上進行的,因而,它必須遵循科學的思維方法,如演繹推理和歸納推理,比較,分析與綜合等。資訊組織的行為只有符合邏輯思考規律,才能確保資訊組織的最佳化、序化。
3.知識分類學
任何有深度的資訊資源組織系統都要求以主題內容之間的關係進行組織和揭示。這就要求以已有的知識分類的成果為基礎。知識分類體係是一門研究知識體系結構的學問,也是進行主題間關係處理的重要依據。資訊組織以知識分類為基礎,可以較好地揭示各領域知識之間的關係和規律性,及時反映知識領域的進展。
4.系統論
系統論認為,系統內部各要素不是一種簡單的結合,而是相互關聯地有機結合在一起。在資訊組織中,人們要將大量的,分散的,雜亂的資訊組織成一個系統,建立起內在的關聯性,使得資訊系統的整體功能大於各個資訊單元的功能總和。這將能充分發揮資訊資源的價值與作用。
5.耗散結構理論
耗散結構理論認為系統內部非平衡是有序之源,開放系統透過與外界交換物質、能量而增加、維持有序。由於資訊系統具有輸入、輸出,多次循環及回饋等開放性的,非平衡的基本特徵,所以我們認為資訊系統就是一種耗散結構系統,它與外界進行著資訊的交換,既採集訊息,也輸出訊息,可以利用耗散結構理論來指導資訊系統的發展、組織和利用。
6.協同論
資訊系統是由多個子系統構成開放系統,如何建立各子系統之間的協同作用機制,使資訊系統由無序向有序轉化,是資訊組織研究中的重要內容,因而協同論也是資訊組織的理論基礎之一。
7.自組織理論
自組織是指系統無需外界指令,而能夠自行組織,自行創生,自行演化,即自主地從無序走向有序。凡是能夠不再藉助於外部控製而實現從無序到有序的轉變,並維持穩定有序狀態的系統,就稱為自組織系統。資訊科技的快速發展使得資訊系統顯著地具備了自組織的條件,特別是網路資訊已經具有自組織系統的開放性,遠離平衡和非線性相關等特徵,因此研究資訊自組織理論對於網路資訊組織具有非常重要的理論與實務意義。
二、資訊組織的思想方法
(一)分類法
1.分類法的概念
分類法:是建構有序化資訊系統的常用方法,是根據資訊資源的內容屬性和其他特徵,將資源分門別類地,有系統地組織和揭示的方法。它用分類號來表達各種概念,將各種概念依學科性質分類和系統排列。
2.資訊資源分類的特徵
⑴是依照資訊內容特徵的相互關係進行組織的。
⑵是從某個角度出發組織並揭示資訊資源。
⑶採用一定的標記符號作為排序工具。
3.國內外主要的分類法
《杜威十進分類法》(DDC)、《國際十進分類法》(UDC)、(中國圖書館分類法)(《中圖法》)、美國《國會圖書館分類法》(LCC)、《冒號分類法》(CC)
(二)主題法
1.主題法的概念
主題法:指直接以表示資訊資源主題的語詞作標識,提供字順檢索途徑,並主要採用參照系統揭示詞間關係的標引和檢索的資訊的方法。它是分類法之外,另一種從內容角度標引和檢索資訊資源的方法。
2.主題法的特徵
⑴以特定事物、問題、對象,即以主題為中心集中資訊資源。
⑵直接以語詞作為資訊的組織和檢索標識。
⑶以字順作為主要檢索途徑。
3.主題法的類型
1)標題法
⑴基本概念
①標題法:是一種以標題詞作為主題標識,以詞表預先決定的組配方式標引和檢索的主題法。
②標題詞:亦稱標題,指經過詞彙控制用來表達文獻主題的標識,大多是文獻內容所論及事物名稱及特徵的規範表達。
③(標題語言:眾多標題集合而成的主題標識系統就是標題語言。)
④標題表:標題詞的彙編稱為標題表,它由編制說明,主表和附表三部分組成。 《美國國會圖書館標題表》使用較廣。
⑵標題法的類型
單級標題、帶有說明語的單級標題、多級標題、倒置標題等。 (標題法用標題參考系統來顯示它們所表達的概念的相互關係。)
⑶標題法的優點
①因為標題之間的順序關係是預先組配好的,先組式的標題在標引和檢索時直接使用,不易混亂。
②標題法以事物為中心來集中與該事物有關的文獻,適合從主題出發進行檢索,易於查全一項事件的文獻。
③直觀,易掌握,檢索速度快,對新事物,範圍細小的問題容易反映出來,補充修改也比較容易。
⑷標題法的缺陷
①很難查全一門學科或具有某一屬性事物的文獻。
②使用不靈活,無法滿足多途徑檢索。
2)單元詞法
⑴基本概念
①單元詞:是指用來標引資訊資源主題的、最基本的、字面上不能再分的語詞。若干單元詞的相互組合或組配才能構成一個專指標識,來精確表達文獻主題或檢索課題。
②單元詞法:是以單元詞作為主題標識,透過字面組配的方式表達資訊資源主題,後組式標識是此方法的重要特徵。
⑵單元詞法的優點
組配原理。具有極大的彈性,能提供多途徑檢索。目前已經進一步演變為敘詞法。
3)敘詞法
⑴基本概念
①敘詞:國內也稱為主題詞,是指經過規範化處理的,以基本概念為基礎的表達文獻主題的詞和詞組。
②敘詞法:是指從自然語言中精選出來的,經過嚴格處理的語詞作為文獻主題標識,透過概念組配方式表達文獻主題的主題法類型。
③敘詞表:敘詞法採用的工具是敘詞表,我國目前使用最廣的敘詞表是《漢語主題詞表》。 (結構:各種排列表、索引、字的關係圖)
⑵敘詞法的特點
①直覺性:直接以規範化了的自然語言敘詞作為標識符號,直覺性強。
②專指性:直接從文獻論述和研究的具體對象和問題出發進行選擇,並採用敘詞組配來描述主題。可依需求直接選作敘詞或透過組配加以表達。
③適應性強:對不斷出現的新事物,新學科,新概念和新的研究主題,敘詞法能隨時加以增刪和修改。
④迅速準確:採用字順排列方式,找出方便,快速準確。
⑤後組式:主要採用後組式概念組配的方法,具有較大的彈性。
⑥多維檢索:又叫多途徑檢索,即同一主題的文獻可以從多種途徑檢索得到。
⑦網絡結構:主要體現在敘詞表中的敘詞字順索引的參照系統、範疇索引,詞族索引,敘詞的詞族圖等幾個面向。這種網絡結構的編制和建立,揭示了事物及其概念在各個學科領域,各個方面的內在聯繫,加強了敘詞法的學科系統性和族性檢索作用。
4)關鍵字法
⑴基本概念
①關鍵字:是指那些出現在文獻的標題以及摘要、正文中,對描述文獻主題內容具有實質意義的字詞。
②關鍵字法:此方法將原來文獻所用的,能描述文獻主題的概念的具有實質意義的關鍵字抽出作為主題標識,不加規範或只作極少量的規範化處理,透過輪排等方式揭示文獻的主題。
⑵關鍵字法的類型
題外關鍵字索引、題內關鍵字索引、單純關鍵字索引(雙重~,詞對式~,簡單~)
(三)分類-主題一體化
1.分類主題一體化
分類法系統性強,從族性特徵角度來對資訊進行標引與組織,符合人們的思維與檢索習慣;主題法比較直觀,從特性特徵角度對資訊進行標引,提供了一種直接面向對象、事實、和概念的資訊組織方法。二者形成有機結合,互相取長補短,能夠更好地滿足資訊組織和檢索的不同需求。
2.分類主題一體化詞表
在分類表和敘詞表基礎上建立起來的分類主題一體化詞表,即包括將主題概念按學科體系和邏輯體系排列和組織的分類法系統,也包括將主題概念按字順排列並用參照系統加以組織的主題法系統,它們是一個統一的系統中的相互配合又相互獨立的兩個子系統。 (用來同時滿足分類標引和主題標引的需要)《中國分類主題詞表》是在藉鏡吸收國外先進的分類主題一體化理論和技術基礎上,由我國自行編制的一部大型的、綜合化的詞表。
三、資訊描述與揭示
(一)資訊標引
1.標引的基本概念
資訊標引:指分析資訊物件的內容屬性及相關外表屬性,並以特定語言表達分析出的屬性或特徵,作為資訊儲存與檢索依據的處理過程。它是在對文獻資訊對象分析基礎上發展起來的,故又稱為文獻標引。資訊標引過程一般包括兩個環節:一是主題分析,二是轉換標識。
2.標引語言
1)標引語言的概念
標引語言:是表達文獻主題概念和檢索需求主題概念的簡明性、單一性和關聯性的概念標識系統,是根據標引和檢索需求而編制的人工語言。從用途來講,標語語言又稱檢索語言,索引語言,相對於自然語言來說,標引語言又稱受控語言,規範語言。
2)標引語言的分類
⑴依照資訊組織的思想方法
①分類語言:使用分類號表達主題概念,依據知識分類將主題概念組織、排列成類目體系,主要以類目體系的自身結構顯示概念之間關係的標引語言。以學科、專業為中心的系統性是其主要特徵。可細分為體系分類語言、組配分類語言、體系-組配分類語言。
②主題語言:是一種由受控的自然語言語詞直接表達主題概念,按語詞字順排列主題概念,主要用參考顯示概念之間關係的標引語言。以事物為中心的直接性是其主要特徵。可進一步劃分為標題語言、單元詞語言、敘詞語言、關鍵字語言。
⑵依標識組合時間的先後
①先組式語言:是指標識在編表時(標引前)就已組合好,標引和檢索時不必或較少進行組配的標引語言,如主題法中的標題法就屬於這種類型。
②後組式語言:是指標識主要供配置使用,而且標引時不將標識組配在一起,到檢索時才將標識組配起來的標引語言,如單元詞法,敘詞法。
③散組式語言:是指標識主要供組配使用,而且標引時就要將表達主題概念的若干標識組配在一起的標引語言。
⑶依標識的規範和受控程度
①受控語言:指資訊組織的標識詞彙以及資訊檢索的索引詞彙在使用前經過優選和規範化處理,並且整個語言經常處於某權威機構或檢索系統的管理之下。這種語言又稱為規範化語言,與自然語言相對。如主題法中的標題語言,單元詞語言,敘詞語言,體系分類語言等均屬於受控語言。
②自然語言:指標引詞彙和檢索詞彙直接來自所處理的文獻本身,使用前未經過優選和規範化處理,與受控語言相對。如主題法中的關鍵字語言。
3.資訊標引的類型
⑴資訊標引的類型取決於表達文獻內容的標引語言的種類,因此資訊標引主要分為分類標引和主題標引兩種類型。
①分類標引:是指對文獻進行主題分析,以特定的分類語言表達分析出的主題,賦予文獻分類檢索標識(分類號)的過程。習慣上分類標引稱為分類,因為分類標引實質上就是對文獻進行分類。 (文獻分類:指根據文獻內容及其他相關屬性,以分類語言/分類法為工具,分門別類地系統揭示和組織文獻的過程和方法。)
②主題標引:是指對文獻進行主題分析,以主題語言(主題法)表達分析出的主題,賦予文獻主題檢索標識(標題詞,敘詞等)的過程。
⑵如依標引標識組合時間的先後,資訊標引還可分為先組式標引、後組式標引、散組式標引;按標引標識的受控程度,還可分受控標引和自然語言標引。
(二)資訊著錄規則
資訊著錄:是依照一定的規則對資訊實體的特徵進行描述並著錄下來的過程。
1.機器可讀目錄(MARC)
⑴概念
MARC:是機器可讀目錄的簡稱,它是電腦能夠辨識和閱讀的一種目錄。 (是根據文獻特徵和文獻機構之間資訊交換的需要建立的標準化的電腦可讀格式。)
⑵特點
伸縮性強,適應面廣,具有以下主要特點:①共包括001~999個字段,其中999字段為用戶自訂的字段;②字段內容著錄詳盡,字段下又設子字段以及重複字段;③字段作用強化,可檢索的欄位多;④每筆MARC記錄可分為頭標區、目次區、資料區。
⑶幾種典型的MARC標準
①USMARC(美國國會圖書館機讀目錄格式)
USMARC的前身為MARCⅡ格式,它完全與ISO2709規定一致,只在其欄位識別和內容項目上不同。每條USMARC記錄由頭標區、目錄區、資料區三部分組成。主要欄位有:目錄控制區,主要款目,書名出版項、主題附加款目、其他附加款目等。廣泛應用於書目記錄資料。
②UNIMARC(國際機讀目錄通訊格式)
該標準是國際圖聯IFLA於1976年為統一各國機讀目錄格式,在USMARC的基礎上主持制定的。它實現了不同文種,不同載體的文獻機讀目錄格式的一體化,為不同國家書目機構之間機讀目錄的交換創造條件,推動了各國機讀目錄格式研製的修訂。
③CNMARC(中國機讀目錄格式)
CNMARC:是中國機讀目錄的縮寫,是我國通用的機器目錄通訊格式。是用於中國國家書目機構同其他國家書目機構以及國內圖書館與情報部門之間以標準的電腦可讀形式交換書目資訊。它是依據UNIMARC以及我國出版物的一些特殊情況和規則的新變化而編制的。
2.書目記錄的功能需求(FRBR)
FRBR研究了書目記錄的功能需求與多樣化使用者需求、多樣化資料類型之間的關係,並利用實體-關係模型(E-R)建構了一個揭示書目結構和關係的概念模型。
3.資源描述與檢索(RDA)
RDA是一種描述編目的標準。 RDA基於國際圖聯(IFLA)發布的書目記錄的功能需求(FRBR)和規範數據的功能需求(FRAD),作為英美編目規則(第二版)(AACRⅡ)的繼承者,RDA提供了一組關於如何制定數據以支援資源發現的指導方針和說明,涵蓋了所有類型的內容和媒體。
4.書目框架(BIBFRAME)
BIBFRAME是書目架構的簡稱,是美國國會圖書館(LC)為取代MARC格式,基於關聯資料規則所發展的書目描述資料模型。 2.0包含創作作品、實例、單件三個核心類別以及代理人、主題、事件等關鍵概念。
(三)元數據
1.元數據
⑴元資料的概念
元數據:是關於數據的數據,關於資訊的信息,或描述數據的數據。它是專門用來描述資料的特徵和屬性,也是描述和組織資訊資源,發現資訊資源的語言和工具。元數據是組織數據,各種數據域以及它們之間的相互關係的資訊。
元資料的類型包括:元素名稱,元素描述,元素表示,元素代碼,元素語義和元素分類。
⑵元資料的作用
⑴描述。元資料最基本的功能就在於對資訊物件的內容、特徵和位置進行描述,從而為資訊物件的存取和利用奠定必要的基礎。
⑵定位。元資料包含有關網路資訊資源位置方面的信息,由此可以確定資源的位置所在,促進網路環境中資訊物件的發現和檢索,可提高資訊資源的查準率和查全率。
⑶搜尋。在著錄過程中,將資訊物件中重要內容抽取並加以組織,賦予語義,建立資料之間的聯繫,指出相關資料的地址和存取方法,從而有利於使用者甄別資源的價值,發現其真正需要的資訊資源。
⑷評價。元資料提供有關資訊物件的名稱,年代,格式,製作者等基本屬性,使用戶在無需瀏覽資訊對象本身的情況下,就能夠對資訊對象基本了解和認識,對資訊資源的使用價值進行判斷,作為訪問和利用的參考。
⑸選擇。根據元資料所提供的描述訊息,參考對應的評估標準,結合使用環境,使用者做出資訊物件取捨的決定,選擇適合使用者使用的資源。
2.都柏林核心集(DC)
⑴概念
柏林核心集(簡稱Dublin Core)。是一種通用簡單的元資料。 1995年3月,由線上電腦圖書館中心(OCLC)和美國國家超級計算應用中心(NCSA)主持在美國俄亥俄州的都柏林召開了第一屆元資料研討會。大會最後確定了一個包含13個資料單元的元素集,即都柏林核心元素集。後來增加到15個單元。
⑵類別
①資源內容描述類別元素:題名、主題、描述、來源、語種、關聯、涵蓋範圍。
②資源知識產權描述類元素:創作者、出版者、其他責任者、權限管理。
③資源外部屬性描述類別元素:日期、類型、格式、資源識別碼。
⑶Dublin Core 的優點
①簡單易懂:15個標記元素簡單易懂。
②運用靈活:它既可以用於規範的資源描述領域,也可以用於非專業領域。
③國際通用:已有德語,日語,葡語,西班牙語等20多種不同語種的版本。
④可修飾性:其所有元素都可重複使用,解決了多著者與多出版等重複元素的著錄問題,對於需要詳細著錄的資料,引進了DC修飾詞。
⑤可擴展性:不僅15個標記元素和子元素可以擴展,DC還可以與其他元資料元素連接使用。
3.其他元資料規範
VRA核心類目、PICS、Web Collections、CDF頻道定義格式、MCF元資料框架、RDF資源描述框架
(四)標記語言及相關標準
1.標記語言
⑴通用標記語言標準(SGML)
SGML:是一種元語言,是用來描述標記語言的語言,適用於電子文檔交換、文件管理和文件發布。 SGML從結構和內容兩個層次來描述文獻,其核心是文件類型定義DTD。
⑵超文本標記語言(HTML)
HTML:是經過簡化的SGML的DTD的具體應用實作。 HTML提供了一種文字結構和格式,使其能夠在瀏覽器上呈現給存取他的使用者。是Web上的通用語言,可以方便的製作網頁,建立鏈接,使數據資訊由線性組織轉化為網狀組織。
⑶可擴充標記語言(XML)
XML:它同樣是SGML的簡化子集,它將SGML的豐富功能與HTML的易用性結合到Web的應用中,以一種開放的自我描述方式定義了資料結構,在描述資料內容的同時能突顯結構的描述,從而體現出數據之間的關係。
2.資源描述框架(RDF)
RDF:採用通用標記語言標準(SGML)的子集-可擴展標記語言(XML),是一種人與機器都能理解的描述框架。它提供了一種強而有力的表達、交換與利用元資料的機制,使得各種不同元資料體系之間具有互通性。
3.簡單知識組織系統(SKOS)
是萬維網聯盟(W3C)公佈的知識組織系統概念架構表示的建議標準。提供了一個簡單可行的標準描述方案用於描述知識組織系統。具有簡單,通用,易擴展等特性。 SKOS主要用於表示各種較為簡單的網路知識組織系統,如敘詞表,分類法,主題詞表,術語表等其他類型的概念架構。
四、網路資訊組織
(一)網路資訊組織的特點
在資訊網路環境下,隨著資訊量,資訊種類,資訊形態及傳播速度的發展,為資訊的有序組織帶來了新的挑戰,網路資訊組織也展現出新的特徵:
1.海量網路資訊及資訊生產,傳播速度的加快,對傳統資訊加工方式提出了挑戰。資訊組織的技術從手工單一發展到半動化,自動化,智慧化。
2.資訊種類增多,資料庫成分複雜化,過去主要適用於文字資訊的資訊組織方法適用性降低。網路訊息中除文字訊息外,還包含大量的如圖片,聲音,影片等非文字訊息,全文訊息的比重也逐漸增大。
3.不同於以往資訊用戶,網路資訊用戶的資訊行為對資訊組織有專門需求,他們要求資訊組織方式透明化,易用化,希望資訊傳播快速便捷,組織方式簡單實用。
4.網路資訊形式上的非線性,互動性和動態性需要資訊組織方法及時且靈活。多媒體與超連結的方式使得網路資訊從線性的靜態資源發展到非線性的動態資源,需要新的資訊組織方式來適應這種變化。
(5.網路資訊資源共享要求資訊組織標準化、相容化)
(二)網路資訊的分類組織
分類組織是一種比較成熟的資訊組織方法。目前網路上的資訊分類組織主要採用兩種方式來進行:一是沿用傳統的文獻分類方法,主要以學術資源為主;二是採用自編的分類系統,在入口網站上較為常用。
1.傳統文獻分類法的應用
⑴DDC
DDC嚴格的等級體系具有很好的實用性,即可用於網路資訊組織,也可以利用它的等級結構,概念體係以及類目關係進行網路資訊的自動標引。 DDC、LCC、UDC等都不同程度地用於網路資訊的分類組織。
⑵UDC
由6萬多個類目構成,並提供多種複分錶,在滿足文獻資料細分方面有獨到優勢,它具有分面組配分類法的一些特點,透過符號組配可以獲得概念的組合,因此這種分類法較適合於機檢。
2.自編分類系統的應用
⑴由於網路資訊的複雜性,使得網路資訊分類組織模式更具多樣性。有些網站採用了多維的分類模式,以此滿足網路資訊組織與檢索的需要,具體表現為網站分類目錄(索引)和網頁分類索引。
⑵網路自編分類體系的特點 (與傳統文獻分類法相比)
①重視以事物為中心設定類別目。
與傳統的文獻分類體係不同,網絡分類系統雖不完全放棄從學科的角度組織網絡資源,但大多從便利用戶使用出發,直接以檢索的事物為中心設置類目,從學科角度設置的類目很少。
②類目收錄範圍寬泛。
類目體系展開時,其下位類不僅收入該類的從屬類目,而且收入各種相關類目,從而使得一些類目的下位類數量大大增加,遠高於傳統文獻分類法同級類目的數量。
③多重列類、重複反映。
為了方便使用者資訊查找,這類網路分類體系一般都十分重視結合網路顯示特點,採用多重列類的方法對網路資訊重複反映,以便從不同角度著手加以使用。
④排列方式簡便。
同位類的排列主要有兩種方式。一是字順方式,這種排列方式不能揭示同位類之間的內容聯繫,但可以方便用戶對特定類目的查找,同時也有利於簡化新類的增補。二是檢索頻率決定同位類的排列次序,在同位類中先列舉高頻類,突顯熱門主題,面向多數使用者使用。
⑤直接以語詞組織訊息。
這些系統放棄傳統分類法以標記符號表達文獻主題的方式,直接以語詞表達類目體系,採用連結技術連結網路文獻,比使用分類標記更方便、直觀、易於理解。
⑥更新迅速。
由於網路分類體係是透過連結與網路文獻建立連結的,類目的調整受原有體系的束縛較少,可以根據網路資源的發展變化及時增設新類或重複反映相關類目等,往往具有較大的動態性。
(三)網路資訊的主題組織
主題法是網路資訊組織的另一種主要方式,主要可分為兩種形式:一是採用現有的詞表(如敘詞表,即主題詞表),主要應用於學科專業型資料庫中;二是採用關鍵字法,在搜尋引擎等網站使用較普遍。
1.敘詞表的應用
⑴敘詞表,又稱主題詞表,是敘詞法的詞彙管理工具,是為採用敘詞法標引和檢索資訊的使用者提供規範化的敘詞及其語義關係資訊的一種索引詞彙表。網路化的敘詞機組顯示是敘詞表在網路環境下應用的主要形式之一,既包括原始印刷型詞表的數位化,也包括數位化環境下編制和生產的數位化詞表。
⑵依照功能和有用性,網路環境下的敘詞表可以分為兩種:①獨立敘詞表;②整合在資料庫或資訊檢索系統中的敘詞表。
2.關鍵字法的應用
1.由於網路資源數量龐大,使用規範語言將會大大提高資訊組織成本,降低文字處理效率,而網路資訊的自動字詞處理技術,是直接從文字標題或正文中抽取關鍵字作為資訊組織標識。與敘詞相比,關鍵字是一種不受控或受控程度較低的標準語言。因而,關鍵字技術在網路搜尋引擎和其他資訊系統的資訊組織中被廣泛採用。
2.網路搜尋引擎中的自動索引軟體如Robot,Spider等都採用了關鍵字技術。我們所熟悉的Google,Baidu,Bing等搜尋引擎採用了關鍵字法來組織網絡信息,此外,網絡上的一些文獻數據庫也廣泛使用了詞語標識系統,使得用戶在進行文獻分類瀏覽的同時,還能夠從題名、作者,篇名等檢索入口利用關鍵字作為檢索識別進行查找。
(四)網路資訊組織方式
資訊組織方式是利用各種資訊科技和資訊組織方法將資訊組織起來的具體形式。目前應用較多的網路資訊組織方式主要有文件方式、資料庫方式、主題樹方式、超媒體方式等。
1.文件方式
⑴概念
文件是有序組織的資料的集合,是電腦保存處理結果的基本單位。電腦有一整套文件處理的技術和方法,可以實現“按文件名進行訪問”,文件管理程式可根據用戶給出的文件名自動完成數據傳輸操作。我們所熟悉的檔案傳輸協定FTP的作用就在於把各種類型的文字式和非文字式檔案透過網路傳送給使用者。
⑵優點:
①簡單方便。電腦有一整套文件處理的技術和方法,在組織網路資訊資源時可以非常容易地利用這些技術和方法。
②它是儲存非結構化資訊的天然單位。對於圖形,圖像,音頻,視頻等非結構化信息,可以方便地利用文件系統來進行管理。
⑶缺點:
①難以平衡網路負載與文件數量的關係。
②對結構化資訊組織顯得軟弱無力。
③隨著以文件形式保存和管理的資訊資源的迅速增多,文件本身可看做資訊單元,也需要作為物件來管理。所以文件方式常作為網路資訊資源管理的輔助形式,作為其他資訊組織方式的補充。
2.資料庫方式
⑴概念
資料庫組織方式,是將所有已獲得的網路資訊資源以固定的記錄格式存儲,使用者透過關鍵字及其群組配對查詢,就可以找到所需的資訊線索(即相關網站連結),並透過資訊線索直接連接到對應的網路資訊資源。
⑵優點
①這種組織方式利用資料模型對資訊進行規範化處理,大大提高了資料操作的彈性,並降低了網路傳輸的負載。
②多媒體資料庫和半結構化資料庫的發展,為非結構化資訊的組織提供了良方,以便於internet資訊資源的充分共享和有效傳播。
⑶缺點
①對非結構化資訊的處理困難較大。對網路環境中日益增多的多媒體資訊等非結構化資訊的組織,該方式顯得困難。
②不能提供資料資訊之間的知識關聯。資料庫組織方法是基於語用的組織,難以顯示資訊單元的知識內容之間的語意關聯。
③對使用者和資料庫服務端都提出了較高的要求。要求使用者掌握一定的檢索技巧,包括關鍵字及其組配方法的選擇等,同時,在資料庫服務端,對於如何進行資料庫的自動擴充,如何提供良好的人際交互,也提出了較高的要求。
3.主題樹方式
⑴概念
主題樹組織方式,就是將資訊資源依照某種事先確定的概念體系結構,分門別類地逐層加以組織,使用者透過瀏覽的方式逐層加以選擇,層層遍歷,直到找到所需的資訊線索(即相關網站連結),並透過資訊線索直接找到對應的網路資訊資源。一些比較著名的網路檢索工具,如Yahoo! InfoSeek等都是用這種方式組織資訊資源的。
⑵優點
①簡單易用,屏蔽了網路資訊資源系統對於使用者的複雜性,提供了一種基於樹形瀏覽方式、簡單易用的網路資訊檢索和利用頁面。
②資訊檢索依照一定的範疇分類體系,逐次查看,依圖索驥,對使用者而言,目的性強,查準率高。
③採用樹狀目錄結構組織資訊資源,具有良好的可擴充性和嚴密的系統性。
⑶缺點
①必須事先建立一套完整的範疇體系。但這套體系結構很難包含所有的網路資訊資源,也人為地增加了使用者的智力負擔。
②要確保主題樹的結構清晰性和資源可用性,主題範疇體系的結構不能過於複雜,這就降低了其所能容納的網絡資訊資源的數量,因而這種組織方式不宜於建立綜合性的大型網絡資源系統。
③主題目錄樹是一種人工主導的資源組織方式,因而在管理、維護方面跟不上網路資訊的成長速度,收錄範圍不夠全面,新穎性和及時性相對較差。
4.超媒體方式
⑴概念
超媒體技術是超文本技術與多媒體技術的結合,它將文本,圖表,聲音,圖像,視頻等多媒體信息以超文本方式組織起來,使人們可以通過高度鏈接的網絡結構在各種信息庫中自由航行,找到所需要的任何媒體的資訊。
⑵優點
①它以符合人們跳躍性思考習慣的非線性的方式組織訊息,具有良好的包容性和可擴充性。
②超越了媒體類型對資訊組織與檢索的限制,實現了連結瀏覽的搜尋方式,避免了檢索語言的複雜性。
⑶缺點
採用瀏覽的方式進行資訊搜尋,當超媒體網絡過於龐大時,很難迅速準確地定位,且很難保存瀏覽過程中的所有歷史記錄,難以避免所謂的「迷航」現象。
(五)基於眾包的網路資訊組織
⑴眾包的定義
一個公司或機構把過去由員工執行的工作任務,以自由自願的形式外包給非特定的(而且通常是大型的)大眾網絡的做法。眾包透過整合電腦和網路上未知的大眾來完成機器單獨難以處理的任務。
⑵基於眾包思想的技術
①Wiki:是一種在網路上開放、可供多人協同創作的超文本系統。
②Tag:Tag也稱為標籤技術,是用來描述資訊內容分類標識,一般一個標籤就是一個自然語言詞彙。每個標籤可由使用者自發性地建立和修改,而且標籤具有共享性,使用者可以存取標籤所標註的資訊。 (在標籤等資訊自組織技術的應用下,分眾分類Folksnomy開始出現,並逐漸成為一種不容忽視的新型網路資訊分類組織方法。)
五、知識組織
知識組織是資訊組織的高階形式,是資訊組織的發展方向。
(一)知識組織的意義及特徵
知識組織:是揭示知識單元(包括顯性知識因子和隱性知識因子),挖掘知識關聯的過程或行為,最快速地提供使用者有效的知識或資訊。
(二)知識表示
知識表示:是指把知識客體中的知識因子和知識關聯表示出來,以便人們能辨識和理解知識。知識表示是知識組織的基礎與前提,任何知識組織方法都要建立在知識表示的基礎上。知識表示有主觀知識的表示客觀知識的表示兩種。
⑴主觀知識的表示
專家系統的知識表示方法:邏輯表示法、產生式規則表示法、語意網路表示法、框架表示法、物件導向的知識表示。
⑵客觀知識的表示
對文獻知識的表示:分類標引法與主題標引法。
(三)語意視野下的知識組織 (知識組織的技術與方法)
1.語意網
⑴意義
語意網:就是對萬維網第二階段的設想,它並非是另一個獨立的萬維網,而是萬維網的一個延伸,是一個由大量機器可理解的資料所構成的一個分散式的萬維網。在這個語意網路中,資料之間的關係透過一些術語來表達,這些術語之間又形成一種複雜的網路聯繫,電腦能夠透過這些術語得到資料的含義,並且可以在這種聯繫上應用邏輯來進行推理從而完成一些原來不能直接完成的工作。
⑵語意網的資訊組織機制核心的構成
①以XML與RDF為手段的資訊描述模組,管理訊息,具備部分語意;
②以本體為手段的語意註釋模組,提供「意義,實現機器間的語意互通。
2.本體
⑴意義
本體:是共享概念模型的明確的形式化規範說明。具體地說,在網路資訊組織領域,本體就是一整套對某一領域的知識進行表述的詞和術語,編制者根據該知識領域的結構將這些詞和術語組織成等級類目,同時規定類目的特性及其之間的關係。
⑵基於本體的網路資訊組織的特點
①直接體現語意。 ②分散式共享。 ③多維、網狀的資訊組織方式。 ④對推理的支持。
3.關聯數據
關聯資料:是萬維網的發明人提姆.伯納斯李提出的萬維網上發布資料的方式,是語意Web的一種實現方式。它一般要求採用RDF資料模型,利用統一資源標識符(URI)命名資料實體,發布和部署範例資料和類別數據,從而可以透過HTTP協定揭示並取得這些資料。
4.知識圖譜
⑴意義
知識圖譜:是一種基於圖的資料結構,由節點和節點間的邊組成。知識圖譜本質上是一種語意網絡,其節點代表實體或概念,邊代表實體或概念之間的各種語意關係。
⑵作用
知識圖譜作為一種新型的知識儲存結構,可以把複雜的知識領域透過資料挖掘,資訊處理,知識計量和圖形繪製的方式顯示出來,視覺化的結構和網狀關係可以揭示知識領域的動態發展規律,為所要研究的學科提供切實的,有價值的參考。
⑶分類
語言知識圖譜、事實性知識圖譜、領域知識圖譜、機器自動建構的知識圖譜。
第六章 資訊檢索
一、資訊檢索的基本概念與原理
(一)資訊檢索的意義
資訊檢索:是指從眾多的資訊集合中迅速且準確地找出使用者所需資訊的整個過程。廣義的資訊檢索又稱資訊的儲存與檢索,包含兩個面向的意義:一是資訊的存儲,即將資訊以一定的方式組織與儲存;二是資訊的檢索,即依使用者的需要找出有關資訊資料的過程。狹義的資訊檢索僅指該過程的後半部分,即從資訊集合中找出所需資訊的整個過程。
(二)資訊檢索的類型與特性
1.資訊檢索的類型
⑴依檢索物件的內容劃分
①文獻檢索:是指以尋找某一課題的相關文獻為目標的檢索。文獻檢索是相關性檢索而非確定性檢索,其檢索對象為包含特定資訊的各類文獻。文獻檢索包含:全文資訊檢索與目錄,題錄,索引,文摘等二次文獻資訊檢索。
②資料檢索:是指以特定的數值型資料為物件的檢索。資料檢索是一種確定性檢索,即檢索系統直接提供使用者所需的確切的數據,檢索結果一般是確定性的。事實檢索是指以特定的事實為目標的檢索。
③事實檢索:也是一種確定性檢索,這種檢索既包含數值資料的檢索,運算,推導,也包括事實、概念等的檢索、比較和邏輯判斷。
⑵依檢索方式劃分
①手工資訊檢索:是指利用印刷型檢索工具書,以手工操作的方式進行資訊檢索。其優點是:直觀,靈活,便於控制檢索的準確性;缺點是:查找過程較複雜,檢索速度慢,查找工作量較大。
②電腦檢索:是把資訊及其檢索標識轉換成電腦可以閱讀和處理的二進位編碼形式,儲存在資料庫系統中,由電腦依照設計好的程式對已經數位化的資訊進行查找和輸出的過程:電腦檢索大幅提高了檢索效率和檢索的全面性,拓寬了資訊檢索領域,豐富了資訊檢索的研究內容。可進一步劃分為離線檢索,線上檢索,光碟檢索及網路檢索等多種形式。
⑶依檢索要求劃分
①特性檢索:也稱為強相關檢索,強調提供使用者高度對口的資訊。這種檢索強調檢索的準確性,只要檢索所得的文獻資訊能夠滿足使用者的需求即可,通常對於檢索結果的數量多少不做要求。
②族性檢索:也稱為弱相關檢索,強調提供使用者係統性完整的資訊。這種檢索著重檢索的全面性,要求檢索出一段時間期限內有關特定主題的所有資訊。為了盡可能避免漏檢相關訊息,對於檢索的準確性相對要求較低。
⑷按檢索的時間跨度劃分
①定題檢索(SDI):是根據使用者的檢索課題的內容和檢索需要,制訂檢索提問式並將製訂好的檢索提問式預先存入檢索系統中,並定期地對檢索系統中的信息進行查詢。定題檢索的特點是:只檢索最新的信息,檢索的時間跨度小。這種檢索模式非常適合資訊跟踪,便於及時了解有關主題領域的最新發展動態。
②回溯檢索(RS):也稱為追溯檢索,是查找過去一段時間內有關特定主題資訊的檢索,並將檢索結果一次性提供給用戶,使用戶一次檢索就可以全面了解某一課題在某一段時間的發展情形。回溯檢索的特點是:既可以查找過去某一段時間的特定主題訊息,也可以找到最近的特定主題資訊。與定題檢索有所不同,每個回溯檢索一般只運行一次。
⑸依檢索對象的資訊表現形式劃分
①文本檢索:是尋找含有特定資訊的文本文獻的檢索,檢索結果以文字形式反映特定資訊的文獻。這是一種傳統的資訊檢索類型,在資訊檢索中至今仍佔據主要地位。
(全文檢索:對於檢索系統中儲存的整篇文章乃至整本書,按照自己的需要獲取有關的章、段、句、節等信息,還可以進行各種頻率統計和內容分析。)
②多媒體檢索:是根據使用者的需求,對文字,聲音,圖形,圖像等多種媒體資訊進行組織,存儲,從而識別,查找並獲取有關資訊的過程。
③超文本檢索:超文本是將許多文本訊息透過超級連結連結起來而形成的一種非線性的文本結構。超文本檢索強調中心節點之間的語意聯繫結構,靠系統提供的複雜工具做圖示穿行和節點展示,提供瀏覽式查詢。
④超媒體檢索:是超文本檢索的補充,其儲存物件超出了文字範疇,融入了圖形像以及聲音等多種媒體訊息,資訊儲存結構從單維發展到多維,儲存空間的範圍也不斷擴大。
2.資訊檢索的特性
⑴資訊檢索的相關性
所謂相關性,是指資訊檢索時規定的一篇正文與表示資訊提問的另一篇正文的符合程度。國內資訊界認為:相關性顯示使用者是否認為一文獻與一提問相吻合。在資訊檢索中廣泛地存在著相關性的問題。
⑵資訊檢索的不確定性
在標引和檢索詞的選用中都存在著不確定性。 ①標引的不確定性是指不同標引員在給同一資訊物件進行標引時會選用不同的標引詞,即標引詞選用的不一致性。 ②檢索詞選用的不確定性是指候選檢索詞集不只一個,而是多個,檢索過程具有試探性。上述兩種不確定性作用於檢索系統,使得資訊檢索具有不確定性。
⑶資訊檢索的邏輯性
資訊檢索作為資訊管理的核心,具有非常強的邏輯性。 ①在檢索語言方面,檢索詞表作為檢索語言的典據性文本,其自身編排具有很強的邏輯性。 ②在檢索策略的研究方面邏輯性表現得更為明顯。所謂檢索策略是指處理資訊檢索提問的邏輯與查找步驟的科學安排。正確的檢索策略優化了檢索過程,有助於達到最佳的檢索效果,並獲得具有高相關度的文獻。
(三)資訊檢索的基本原理
資訊檢索的基本原理可以概括為:資訊資源集合與資訊需求集合的配對與選擇。
⑴資訊資源集合
資訊資源集合是指有關某一領域的、經過選擇性採集和組織加工的資訊集合體。為了保障資訊檢索的快速與高效,需要對資訊資源集合進行某種形式化的加工,形成它們的特徵化表示,即對它們們進行分析與標引,讓原來隱含的、不易識別的特徵顯性化,並獲得相應的標識(如分類號,主題詞等)。將這些被分析、提取出來的特徵及其標識進行存儲,便構成了索引庫,成為組織和查找資訊資源的依據和標準。
⑵資訊需求集合
眾多使用者不同形態的資訊需求的匯集,形成了資訊需求集合。對使用者提出的資訊需求也需要進行特徵化處理,即分析需求的內容,提取出主題概念或其他屬性,並利用與資訊資源集合相同的標識系統(即檢索語言)來表示需求中所包含的概念和屬性,從而得到使用者需求的特徵化表示結果-提問式。
⑶匹配與選擇
為了方便從資訊資源集合中快速取得使用者所需的資訊與知識,就要求資訊檢索提供一種「匹配」機制。此機制的主要功能在於:能夠把資訊需求集合與資訊資源集合依據某種相似性標準進行比較與判斷,進而選擇出符合使用者需求的資訊。在資訊資源集合與資訊需求結合都進行了特徵化表示的基礎上,它們二者之間的匹配就簡化為提問式與已建立的有序的索引庫之間的匹配。
(四)資訊檢索的模型
⑴布林邏輯檢索模型
布林檢索模型採用布林代數與集合論的方法,以布林表達式表示使用者提問,透過對文獻標識與提問式的邏輯運算來檢索文獻。邏輯運算中最常用的是布林邏輯運算符,主要的邏輯運算符有邏輯“與”、邏輯“或”、邏輯“非”,分別用AND(或*)、OR(或)、 NOT(-)表示。
優點:邏輯運算子較少,提問式構造簡單且易修改;缺點:檢索中的關鍵字沒有權重區別,檢索結果沒有重要性排序,查全率較難控制,對使用者語意提取能力要求較高。
⑵向量空間模型
向量空間檢索模型是採用線性代數理論與方法建構的一種新型的檢索模型。它的基本前提是將檢索文件和檢索提問式都看成是一組數值向量,這些數值形成一個空間向量圖,這樣就將資訊檢索中文獻與提問匹配處理過程轉換為向量空間中文獻向量與提問向量的相似度計算問題。某一文獻與某一提問的相關程度,透過檢索該向量對之間的相似度來決定。
⑶機率檢索模型
機率模型是一種實現簡單,效果較好的資訊檢索模型,其基本思想是:給定一個使用者提問,則檢索系統中存在著一個只包含與提問相關的文檔的理想結果集合,記為R。如果能知道集合R的特徵及其描述,就能找出全部相關文檔,排除所有無關文檔。
⑷模糊檢索模型
模糊檢索是將文獻看成是提問在某種程度上相關,對於每一個標引詞,都存在一個模糊的文獻集合與之相關,對於某一給定的標引詞,用隸屬函數表示每一文獻與該詞的相關的程度,即隸屬度,取值在[0,1]上,0表示不相關,1表示完全相關,數值越大,則相關性越高。
二、資訊檢索的發展歷程
(一)手工資訊檢索階段(1876-1945)
1.手工資訊檢索的起源與發展
⑴資訊檢索起源於文獻的文摘索引工作和圖書館參考諮詢工作。參考諮詢工作產生的標誌是1876年召開的美國圖書館協會第一屆大會。到1940年代,「資訊檢索」發展成為一項獨立的使用者服務工作,並逐漸從單純的經驗工作朝專業化方向發展。
⑵在這階段的發展過程中,手工化資訊檢索活動取得了豐碩成果,並為下一時期的電腦化資訊檢索發展奠定了堅實的基礎。這些成果主要表現在:①大批高品質的文摘性檢索工具陸續被編製並投入使用。如,《工程索引》《科學文摘》《化學文摘》等;②檢索語言的創建和試驗活動十分活躍,在分類語言方面出現瞭如DDC、UDC;在主題方面,先組式標題語言、後組式單元語言、敘詞語言,引文語言等檢索語言相繼出現。
2.手工資訊檢索的技術與方法
⑴檢索工具:目錄、索引、摘要、年鑑、手冊、百科全書
⑵排檢技術:字順排檢技術、分類排檢技術、主題排檢技術、地序排檢技術、時序排檢技術
⑶檢索方法:順查法、倒查法、抽查法、追溯法、循環法
手工資訊檢索的特點是:操作簡單,費用低廉,查準率高,但效率較低,查全率不能保證。
(二)機械資訊檢索階段(1945-1954)
1.機械資訊檢索的起源與發展
⑴機械資訊檢索系統是20世紀50年代開始的,用各種機械裝置進行資訊檢索的機械系統,是手工檢索向現代資訊檢索的過渡階段。機械性檢索主要包括兩種基本類型:①機電資訊檢索系統:用諸如打孔機,驗孔機,分類機等機電設備記錄二次文獻,用電刷作為檢索元件的資訊檢索系統。 ②光電資訊檢索系統:用縮微照相記錄二次文獻,利用光電檢索元件尋找文獻的系統。
⑵特點:機械資訊檢索系統利用當時先進的機械裝置改進了資訊的儲存和檢索方式,促進了資訊檢索的自動化;但它並沒有發展資訊檢索語言,而且過度依賴設備,檢索複雜,成本較高,檢索效率和品質都不理想。很快就被迅速發展的電腦檢索系統取代。
2.機械資訊檢索的技術與方法
⑴機電資訊檢索系統:機械資訊檢索最初是從簡單的穿孔卡逐步發展出來的。繼手檢穿孔卡之後,出現了機檢穿孔卡片和選卡機,這就形成了機電資訊檢索系統。
⑵光電資訊檢索系統:光電資訊檢索系統主要是以縮微膠卷檢索方式出現的,大致可分為兩種:定址檢索方式、編碼檢索方式。
(三)電腦資訊檢索階段(1954-1991)
1.電腦資訊檢索的起源與發展
隨著1946年電腦的問世,資訊檢索進入到電腦檢索階段。電腦資訊系統的發展歷程經歷了早期的離線批次檢索、後來的線上即時檢索、功能更強大的線上網路化資訊檢索等不同的發展階段。
⑴脫機批次檢索(1954-1965):在發展初期計算機技術還比較落後,數據存儲與數據通信能力都比較差,信息檢索的基本特徵是“脫機批處理”,表現為:輸入計算機的資訊幾乎全部儲存在磁帶上,檢索提問儲存在穿孔紙帶或穿孔卡上,檢索結果不能立即取得,必須等待成批或定期的檢索處理。
⑵聯機即時檢索(1965-1975):進入20世紀60年代中後期,隨著第三代電腦-積體電路電腦開始出現,高密度海量隨機記憶體-磁碟及磁碟機的問世與投入使用,訊息檢索進入了人機對話式的線上即時檢索時期。表現為:資訊檢索中心的主機借助於電話線與遠距離檢索終端相連,形成聯機即時檢索系統,使用者透過檢索終端與檢索系統對話,並可在終端螢幕上即時獲得檢索結果。
⑶聯機網路化檢索(1975-1991):1970年代中後期,大規模積體電路和超大規模積體電路技術,資料庫技術,尤其是基於分組交換網的現代通訊技術等,將線上檢索帶入了聯機網路化發展階段。
電腦資訊檢索時期的主要特色為:①以各類機讀資料庫為檢索物件;②各類情報所、線上服務中心作為新興的資訊服務部門而存在;③資訊檢索使用者逐漸由專業檢索人員向個人終端使用者轉移與擴散,資訊檢索的社會普及化程度日益提高。
2.電腦資訊檢索的技術與方法
⑴聯機資訊檢索
線上資訊檢索是指資訊使用者利用檢索終端設備,使用一些特定的指令和檢索語詞,透過通訊網路與儲存大量資訊的資訊檢索系統聯機進行人機對話,從檢索系統的資料庫中找出使用者所需資訊的全過程。
優點:①檢索速度快;②檢索範圍廣而全面;③檢索途徑多、品質高;④檢索內容新、即時性強;⑤檢索輔助功能完善、使用方便,檢索結果輸出方式靈活、實用。
缺點:①主機負擔重,一旦發生故障,則整個網路都將癱瘓;②資訊組織方式以線性為主,不夠靈活;③聯機檢索不像internet是面向最終用戶的,操作也沒有後者方便。
⑵光碟資訊檢索:光碟是繼紙張、縮微膠片,磁性記憶體之後的一種以雷射光束記錄和再現資訊的儲存載體。用於檢索和閱讀的光碟,通常為唯讀光碟,它是一種資訊載體,而要對其中的資訊進行檢索和利用,則需要電腦的配合。
特點:①使用光碟檢索系統可免除使用電訊設備,亦可免除通訊線路傳輸過程中所造成的錯誤;②光碟系統提供使用者隨盤相當於線上資訊檢索系統功能的軟體,並提供選單驅動與命令驅動兩種方式;③光碟儲存容量大,耐用,複製費用低;④可以把文本,圖形,圖像,聲音及動態形象結合在一起;⑤如果光碟資料庫量不夠多,則資訊資源就顯得有限,購買大量購買資料庫又要受到經費限制;⑥在資訊需求的適時性上,光碟檢索不如線上檢索系統,因為光碟只能定期提供;⑦資料庫費用大。
(四)網路資訊檢索階段(1991-):
1.網路資訊檢索的起源與發展
1990年代以後,以網路的出現為標誌,系統多採用分散式的網路化管理,資訊處理從傳統模式轉變為新型模式。這些變化使得資訊檢索的主流平台迅速轉移到以Web為核心的網路應用環境。一方面,新興的機會Web的搜尋引擎系統得到日益廣泛的應用;另一方面,傳統的線上檢索系統、各類資料庫檢索系統及其資訊服務業務,也逐漸擴展、轉移到具有分散式網路結構特性的Web平台上面,開放給網路使用者WWW站點,並提供內容豐富的功能服務。
2.網路資訊檢索的技術與方法
網路資訊檢索的特徵:①資訊量較大,需要處理各種不同的語言;②資訊檢索的範圍較寬(多學科,多領域);③資訊查詢的時效性要求較高;④檢索結果是檢全率較高,而檢準率較低。
三、資訊檢索的步驟與策略
(一)資訊檢索的步驟
1.分析研究資訊檢索課題
分析研究資訊檢索主題是確定資訊檢索策略的根本出發點,也是進行檢索效率高低和成敗的關鍵。
其主要內容包括:①明確資訊檢索主題所涉及的領域和範圍;②明確所需資訊的內容及其內容特徵;③明確所需要資訊的類型,包括文獻媒體,出版類型,所需文獻量,年代範圍,涉及的語種,有關作者及機構等。
2.選擇資訊檢索工具
資訊檢索工具是人們為了充分,準確,有效地利用已有的資訊資源而加工編制的用來報道,揭示,存儲和查找信息的卡片,表冊,計算機信息系統和特定出版物。資訊檢索工具種類繁多,各式各樣,只需要選擇那些與主題相關的,符合時間要求的高品質的資訊檢索工具。
具體資訊檢索工具的類型,可依用途分為兩大類:①指示線索型資訊檢索工具(二次文獻),包括書目,館藏目錄,索引文摘,工具書指南,字典。 ②提供具體資訊的工具書(三次文獻),包括百科全書,傳記資料,手冊,機構名錄,地理資料,統計資料,年鑑,政府文獻。目前檢索工具大都存在於電腦資訊系統或分佈於網路上。
3.確定資訊檢索方法
完成任何一種特定任務的方法都是十分重要的,資訊檢索也不例外。常用的資訊檢索方法有順查法,倒查法,抽查法,追溯法,循環法等,每一種資訊檢索方法都有自己的特點,在實務上可以根據資訊檢索要求選擇使用或配合使用,以快速、準確地完成資訊檢索任務,以實現預期的目標。
4.掌握取得原始資訊的線索
在分析研究資訊檢索提問,確定檢索範圍,選定檢索工具和方法以後,就可以實施資訊檢索。在取得資訊線索時要仔細閱讀,判斷所檢出的資訊是否符合檢索的要求。如檢出的資訊符合要求,則需要記錄資訊資料的相關特徵,如篇名,作者及工作單位,資訊出處等,以便查找原始資訊。
5.取得原始訊息
取得原始資訊是資訊檢索的最後一步,對資訊檢索最終目標的完成非常重要。
其主要工作包括:①判斷文獻的出版類型;②整理文獻來源;③根據出版類型在圖書館或資訊機構尋找館藏目錄或聯合目錄確定館藏。 ④盡可能多管道、多方式地獲取原始資訊。
(二)資訊檢索策略
資訊檢索策略:是針對檢索提問,運用檢索方法和技術而設計的資訊檢索方案,其目的是要達到一定的查全率和查準率。
廣義:是指在分析檢索課題的實質內容,明確檢索目標的基礎上,選擇檢索系統和檢索工具,明確檢索途徑和檢索方法,確定檢索詞之間的邏輯關係以及查找步驟最佳方案的一系列科學安排。
狹義上:是指檢索提問表達式的構造,即運用檢索系統特定的檢索技術,確定檢索詞之間的邏輯關係,形成表達使用者資訊需求的檢索提問表達式。
從具體操作來看,資訊檢索策略制定的過程與資訊檢索的步驟是對應的,資訊檢索的步驟顯示的是要乾些什麼,而資訊檢索策略制定則是要確定每一個步驟中的具體問題,並選擇最佳化的方案,取得優良的檢索效果。
(三)資訊檢索語言
資訊檢索語言:又稱標引語言、索引語言等,是應文獻資訊的加工、儲存和檢索的共同需要而發展起來的專門語言,是用於描述檢索系統中資訊的內容和外部特徵及其相互關係和表達資訊使用者需求提問的概念標識體系。
1.資訊檢索語言的作用
⑴在表面的操作層次上,檢索語言被用來描述文獻及文獻中資訊內容的特徵,把文獻資訊轉換為一定的文獻標識,構成資訊檢索系統的各種檢索途徑;同時它也被用來描述檢索提問以及需求內容的特徵,將提問轉化為一定的提問標識或檢索標識,以便在檢索系統中尋找特定的文獻資訊。從這一層次來看,資訊檢索語言是一種邏輯語意工具,旨在對各種事物的表達。
⑵在更深的原理層次上,資訊檢索語言能夠把文獻標引與檢索提問聯繫起來,把標引人員與檢索人員聯繫起來,把文獻信息的存儲與檢索聯繫起來,以取得兩者共同理解和相互對應。
2.資訊檢索語言的類型
⑴描述資訊內容特徵
題名語言、著者語言、號碼語言
⑵描述訊息內容特徵
分類語言:體系分類語言、組配分類語言、混合分類語言
主題語言:標題詞語言、單元詞語言、敘詞語言、關鍵字語言
(四)資訊檢索效率的評價
檢索效率是指全、準、快、便、省(查全率,查準率,檢索速度,檢索方便性,檢索成本與效益),最主要的是全和準。
1.評價指標
⑴查全率R:是指衡量資訊檢索系統在實施某一檢索作業時檢出相關文獻能力的一種測度指標,指檢出的相關文獻數佔系統中相關文獻總數的百分比。查全率反應檢索的全面性,其補數就是漏查率。計算方法為:R=檢出的相關文獻量/檢索系統中的相關文獻總量。
⑵查準率P:是衡量資訊系統在實施某一檢索作業時檢索精確度的一種測度指標,指檢出的相關文獻數佔檢出文獻總數的百分比。查準率反應檢索精確性,其補數就是誤差率。計算方法為:檢出的相關文獻量/檢出的文獻總量。
⑶漏查率O:作為查全率的補數。計算方法為:未檢出的相關文獻量/檢索系統中的相關文獻總量。
⑷誤差率E:作為查準率的補數。計算方法為:檢出的非相關文獻量/檢出的文獻總量。
2.影響查全率和查準率的因素
⑴影響查全率的因素
①從文獻儲存看,主要有:文獻庫收錄文獻不全;索引詞彙缺乏控制和專指性;詞表結構不完整;詞間關係模糊或不正確;標引不詳;標引前後不一致;標引人員遺漏了原文的重要概念或用詞不當等。
②從檢索過程來看,主要有:檢索策略過於簡單;選擇和進行邏輯組配不當;檢索途徑和方法太少;檢索人員業務不熟練和缺乏耐心;檢索系統不具備截詞功能和回饋功能,檢索時不能全面地描述檢索要求等。
⑵影響查準率的因素
索引詞無法準確描述文獻主題及檢索要求;組配規則不嚴密;選字及詞間關係不正確;標引過於詳盡;組配錯誤;檢索時所用檢索字或檢索式專指度不夠,檢索面寬於檢索需求;檢索系統不具備邏輯「非」功能及回饋功能;檢索式中允許容納的字詞數量有限;截詞部位不當,檢索式中使用邏輯「或」不當等。
3.查全率和查準率之間的關係
查全率和查準率之間有密切的關係,即互逆關係。在一個資訊檢索系統中,當查全率和查準率達到一定程度以後,兩者就會呈現出非線性的反變關係。換言之,在查準率不斷提高的同時,查全率持續下降;反之,在查全率不斷提高的同時,查準率也會持續下降。
四、網路資訊檢索
(一)網路資訊檢索的特點
1.檢索範圍大
網路資訊檢索可以檢索internet上所有領域,所有類型,各種媒體的資訊資源,遠遠超過了線上檢索,光碟檢索等資訊檢索方式可利用的資訊來源。
2.使用者介面友好
網路資訊資源檢索工具直接以使用者為服務對象,操作簡單方便。它一般採用圖形視窗介面,並提供多種導航功能和多種檢索途徑,檢索者無需掌握複雜的檢索指令,只要在檢索介面上依照提示和規則輸入檢索式,就可獲得檢索結果。
3.互動式作業方式
網路資訊資源檢索工具具有互動式作業的特點,能夠及時回應使用者的要求,從使用者的命令中取得對應的指令,並根據指令執行對應的操作,最後將執行結果回饋給使用者。
4.傳統檢索技術與網路檢索技術融合
網路資訊檢索既沿用了許多傳統的檢索方法和技術,又藉助於網路資訊科技的發展,採用了超文本/超媒體,全文檢索,智慧檢索等新的檢索技術。
5.檢索效率高
透過超級連結技術,網路資訊資源的檢索過程和資訊的瀏覽過程都在同一介面內進行,使用者只要簡單的點擊滑鼠即可以隨意瀏覽和取得可以直接閱讀和利用的網頁文獻全文。
6.資訊冗餘大
網路資訊資源缺乏統一規範的管理與控制,動態性強,且目前的網路資訊檢索工具在資訊蒐集、標引等方面存在一定的不足,資訊檢索過程會產生大量的無用甚至垃圾訊息,資訊檢索的準確性,完整性和權威性難以保證。
(二)網路資訊檢索工具
網路資訊資源檢索工具指在internet上提供資訊資源檢索服務的電腦系統,其檢索物件是存在於internet資訊空間中各種類型的網路資訊資源。
網路資訊資源檢索工具的類型:
1.依檢索內容分類
⑴綜合型:綜合型網絡資源檢索工具也稱為通用型網絡資源檢索工具,是指在採集資訊資源時不限定資源的學科、主題範圍和數據類型,可以利用它們檢索到幾乎各個方面的網絡信息資源。
⑵專科型:專科型網路資源檢索工具是指專門採集某一學科主題、範圍的資訊資源,並提供適合其專業資源和檢索需求特徵的更細緻的分類、深度標引和描述。
⑶特殊型:特殊型網路資訊資源擷取工具是專門為某種特殊類型的資訊資源提供擷取服務的工具。
2.依檢索的資訊資源類型分類
⑴非Web資源檢索工具:主要以非Web資源,如FTP資訊資源、Gopher資訊資源,Telnet資訊資源及Usenet資訊資源等特殊類型的資訊資源為檢索物件的一類檢索工具。
⑵Web資源檢索工具:是以超文本技術在internet上建立的一種提供網路資訊資源導航、檢索服務的專門的Web伺服器或Web網站。它是一個既以Web資源作為主要檢索對象,又以Web形式提供服務的線索工具。
①關鍵字檢索工具:即搜尋引擎,它使用自動索引軟體來發現、收集並標引網頁,建立資料庫;以Web形式提供給使用者一個檢索介面,供使用者輸入檢索關鍵字、詞組或片語等檢索項;代替使用者在資料庫中找出與提問相符的記錄,並傳回結果且相關度排序輸出。
②目錄型檢索工具:它是依照某種分類體系編製的一種可供檢索的等級結構式目錄。分類方法以學科分類為主,使用此類工具的檢索方法被稱為“分類搜尋”,這是一種“自頂向下,逐步細化”的搜尋方法,層層遍歷。
③混合型檢索工具:目前,搜尋引擎的關鍵字檢索和目錄型檢索工具的分類檢索逐步整合在一起,既可以直接輸入檢索詞,又可以瀏覽目錄了解特定領域範圍的資源,以增強檢索能力。
(三)搜尋引擎及應用
1.搜尋引擎的發展
搜尋引擎:是一種在網路上提供給使用者進行關鍵字,詞組或自然語言檢索資訊的工具,其工作的基本原理是:使用者提出檢索要求,搜尋引擎代替使用者在資料庫中進行檢索,並將檢索結果回饋給使用者。
2.搜尋引擎的基本原理
⑴獨立搜尋引擎的工作原理
①資料收集;②資料分析與標引;③資料檢索;④資料探勘
⑵元搜尋引擎的工作原理
①用戶介面;②查詢代理;③結果總結輸出
3.搜尋引擎的應用
⑴綜合型獨立搜尋引擎
⑵垂直獨立搜尋引擎
⑶元搜尋引擎
⑷行動搜尋引擎
(四)網路資訊檢索的重要領域
1.多媒體資訊檢索
多媒體資訊檢索是根據使用者的要求對圖形、圖像、文字、聲音、動畫等多媒體進行資訊檢索,得到使用者所需的資訊。分為以文字為主的檢索和內容為基礎的檢索。
2.跨語言資訊檢索(CLIR)
跨語言檢索是指使用者以某種語言(來源語言)來建構和提交檢索提問式,系統檢索出符合使用者需求的其他語言(目標語言)表示的文件集。跨語言資訊檢索是以單一語言描述的使用者查詢來檢索多語種的資訊資源,實質就是單語言的使用者查詢與多語言的資訊表示之間的匹配。
目前跨語言資訊檢索的主要研究熱點包括:跨語言的資訊檢索輔助技術方法,語言轉換方法,資訊組織與檢索模型等,同時還有一些問題有待進一步研究,如基於語意的資訊檢索,以應用為導向的跨語言檢索平台,相關性檢索結果合併,視覺化處理等將成為新的研究方向。
3.智慧資訊檢索
智慧資訊系統是由抽詞檢索與全文檢索發展而來,它是以檢索字詞的相關度為基礎,對檢索字具有較高的判斷能力,理解能力與處理能力的人工智慧型檢索系統。
近年來,基於語意、Agent、本體的智慧資訊檢索成為研究熱點。語義智慧資訊檢索系統試圖從語義上理解和索引文檔,並根據使用者的相關資訊智慧化地理解使用者的資訊需求。 Agent是一個具有適應性和智慧性的軟體實體,它與智慧資訊檢索相結合,提高了檢索技術的智慧化,促進人機互動。本體能夠較好的描述概念的內涵及概念與概念之間的關係,具有良好的概念層次結構與對邏輯推理的支持。可利用其對使用者檢索進行拓展、推理,進而提高檢索的效率與精確度。
4.資訊檢索可視化
資訊檢索視覺化是資訊視覺化技術在資訊檢索中的應用,是指把文獻訊息,使用者提問,各類情報檢索模型以及資訊檢索過程中不可見的內部語意關係轉換成圖形在,一個二維或三維的可視化空間中顯示出來。
作為一個前沿性探索方向,目前資訊檢索視覺化研究與應用已取得了一定進展與成果,並主要體現在檢索處理活動的不同環節:(檢索前)提問式構造;檢索過程的透明化;(檢索後)結果處理;可視化檢索詞表系統的發展等。
5.智慧問答系統
目前人工智慧發展迅速,機器學習,神經網路等技術的逐漸應用,大大促進了智慧問答系統的發展,產生了一些代表性產品,包括自動化問答平台,語音問答機器人等。這些智慧問答系統一問一答的服務方式,方便精準定位用戶需求,實現即時交互,大大提升個人化服務程度。
第七章 資訊服務
一、資訊服務的內容和方式
(一)資訊服務的涵義與內容
資訊服務:就是用不同的方式提供使用者所需資訊的活動,它是以資訊為內容的服務業務。
它包括兩個方面的內容:①一是對分散在不同載體上的信息進行收集,評價,選擇,組織,存儲,使之有序化,成為方便利用的形式;②二是對用戶及信息需求進行研究,以便向他們提供有價值的資訊。
(二)資訊服務的特性
資訊服務是發生在資訊使用者與資訊提供者、資訊資源、資訊服務系統之間的可以滿足使用者需求的一種或一系列行為。在資訊服務過程中,資訊來源、資訊活動和資訊使用者成為三個基本的構成要素。資訊服務的特性主要體現在以下幾個方面:
1.知識密集程度高
資訊服務要求服務人員具備綜合知識素質,能夠根據用戶的資訊需求做出判斷,確定優化的服務提供內容和方式;同時用戶也需要具備相應的知識儲備,只有在用戶本身的知識與服務方所提供的資訊相符時,資訊服務才能有效的利用。
2.資訊用戶參與度高
由於使用者資訊的需求不易明確表達,也不易被感知,因而只有在與使用者進行更多的互動的基礎上,才可能了解其需求並進行資訊服務提供。這使得資訊服務成為一種以使用者需求為驅動,並需要使用者高度參與的互動性服務。
3.資訊服務者與使用者有較深的接觸
資訊服務是一種面向使用者動態且個人化資訊需求的服務,由於接觸層面深,服務過程中會面臨許多的不確定因素,使用者可能隨時提出新的要求,因而服務人員經常會取代資訊資源而成為資訊服務主導因素。
(三)資訊服務的原則
1.針對性原則
滿足特定使用者在特定時間的特定需求是資訊服務的基本出發點。資訊服務機構要認真研究用戶的資訊需求和需求的變化,掌握用戶利用資訊的習慣和特徵,選擇符合用戶需求的資訊內容,資訊載體,資訊管道,提供用戶針對性很強的資訊服務。
2.及時性原則
資訊具有時效性,即在特定的時間範圍內才能發揮其效用,而這個時間一般是在使用者做出決策和選擇需求資訊之前。資訊提供過早,使用者沒有需求,資訊效用不可能實現;提供過晚,資訊毫無價值。
3.易用性原則
實踐表明,用戶利用資訊受到可獲得性和易用性的影響。在決定是否選擇和利用資訊時,可取得性和易用性往往超過資訊本身的價值。因此資訊服務機構應為使用者獲取利用資訊提供最大的便利條件。
4.成本/效益原則
資訊服務既要講求社會效益,也要講求經濟效益。雖然資訊服務的效益具有潛在性和延遲性,很難做出確定的評價,但不論是對資訊服務機構還是用戶都需要花費一定的成本,應確保以最小的花費來獲得資訊服務的最大效益。
(四)資訊服務的類型及方式
1.資訊服務的類型
資訊服務的發展需要依賴人力資源和技術資源。從資訊服務的不同資源依賴模式來看,資訊服務可以分為執行型,經驗型,專家型。
⑴執行型資訊服務:主要依賴特定服務系統,前台產品往往是依照使用者明確要求供應的資訊或資訊集合。後台工作集中在資訊序化,資訊系統設計與維護方面。在服務過程中使用者是主導因素,如資訊資料傳遞服務,資訊分析軟體應用服務,檢索服務等。
⑵經驗型資訊服務:主要依賴特定服務經驗,前台產品是在現狀分析、判斷使用者需求基礎上供應的客製化資訊。後台需要強化資訊蒐集,並在預測使用者需求基礎上預先進行一定資訊整合。使用者和服務人員在該服務過程中均扮演重要角色,如事務型諮詢,產業報告等。
⑶專家型資訊服務:前台產品主要為針對性報告及解決方案。後台需要集中於資訊收集,資訊解析工作,特別強調資訊解析。在這服務過程中,主導因素是服務人員。
2.資訊服務的方式
⑴資訊檢索與傳遞服務
資訊檢索和傳遞服務是資訊服務機構利用本機構內部以及外部資訊資源體系,根據資訊使用者俱體需求,在適當的時間透過適當的方式向使用者提供適當的訊息,具體形式包括資訊搜尋服務,查新服務,館際互借與文獻傳遞等。
①資訊搜尋服務:是資訊機構服務人員根據使用者的需求,利用各種檢索工具為其查詢取得相關文獻資訊資源。
②查新服務:是一類傳統資訊查找服務,其應用目的是為了避免科研選題的盲目性,重複性和成果評審的主觀失誤等現象。該服務廣泛應用於科學研究立項,成果鑑定,申報獎勵,申請專利等。
②館際互借與文獻傳遞:目前已成為公益資訊服務的主要形式之一,該項服務借助便捷的網絡環境為用戶建立暢通渠道,可為用戶提供圖書,期刊論文,數據庫文獻全文等資源的館際借閱和傳遞服務,從而滿足使用者的需求。
⑵資訊報道與發布服務
即資訊機構將蒐集到的大量資料和資訊進行整理,加工,評價,研究和選擇之後,及時報道出去,滿足用戶的資訊需求,常見的資訊報道方式有下列三種:
①文字報導:這是資訊報導的主要形式,資訊服務機構透過研究使用者在科研,生產,經營等活動中承擔的任務和提出的資訊需求,有選擇的將有重要價值的資料和資訊(原始資訊或一次資訊)加工成二次資訊和三次資訊進行報告。這種報道一般分為定向報道和定題報道。文字報道還可按其內容和作用的不同,分為一次資訊報道,二次資訊報道和三次資訊報道。
②口頭報道服務:主要是透過直接交談,專題講座,學術會議,資訊發布會提供資訊。口頭報道的訊息一般都是零次訊息,其特點是迅速及時,互動性強,效果好。
③直觀傳播報道服務:即透過實物如樣品,樣機,展覽,電影,音像等載體傳遞訊息。這種方式直觀生動,易於接受,易於理解,但訊息傳遞範圍受到限制。
⑶參考服務
在圖書館為代表的資訊機構中,參考服務的發展由來已久。在網路時代,該服務更表現為數位參考諮詢服務,即建立在網路基礎上的將使用者與專家的學科專業知識聯繫起來的問答式服務。目前圖書館界的數位參考諮詢服務採用分散式合作參考服務的模式,在一定程度上解決了諮詢員數量有限與使用者提問無限之間的矛盾。其主要分為異步,實時,合作化三種類型。
①非同步服務:主要利用E-mail,BBS,留言版,FAQ等方式實施。
②即時服務:主要透過網路聊天,視訊會議,網路呼叫中心等即時交流技術來實現。
③合作化數位參考諮詢:是由許多成員機構一起組成一個分散式的數位參考諮詢網絡,以解決單一圖書館或資訊機構因種種條件限製而無法解決的諮詢問題。
⑷資訊諮詢服務
資訊諮詢服務是幫助使用者解決資訊問題的一種專門諮詢活動。它源自於圖書館的參考諮詢,隨著現代資訊服務範圍的擴展而不斷發展。與其他資訊服務方式相比,資訊諮詢服務靈活多樣,更具主動性和滲透性,能直接滿足用戶的資訊需求,幫助用戶解決問題,對用戶也更有影響力。資訊諮詢主要提供使用者下述服務:
①從哪裡可以取得所需的資訊,最有價值的資訊來源是什麼;
②最方便的資訊管道是什麼,其可靠性如何;
③對資訊的可靠性,適用性和經濟性進行評估。
④提供使用者資訊分析研究報告與預測報告;
⑤為使用者提供及推薦資訊科技的選擇與評價方案。
⑥為使用者提供資訊系統和網路設計的解決方案等。
二、資訊服務的演化與現代發展
(一)資訊服務的演變及其發展趨勢
現代資訊服務的新的發展趨勢:
⑴資訊服務的行動化
①智慧型手機等行動終端的普及,行動通訊技術和行動互聯網技術的發展,改變了人們接觸網路和利用網路的方式,使得網路資訊服務延伸至行動資訊服務。行動資訊服務面向行動終端用戶,透過無線網路或行動通訊網路提供資訊服務。
②行動資訊服務的特徵主要表現在:泛在性、個人化、靈活性、可定位性。這些特點改變了資訊服務的方式,豐富了資訊服務的內容,增強了使用者體驗。
⑵資訊服務的智慧化
①隨著人機交互,大數據,人工智慧等新一代資訊科技的崛起,以及互聯網技術和資訊通信技術的融合發展,人們的資訊獲取方式和資訊需求日益多元化和多樣化。在新科技背景下,資訊服務開始朝著智慧化的方向發展。
②資訊服務的智慧化的內涵是:利用大數據分析,根據使用者的專業領域,行為習慣,需求偏好等因素,創造性地為使用者提供更為優化的資訊服務,主要表現為:個性服務、主動服務、自我學習。
③資訊服務的智慧化主要包括:資訊資源組織的智慧化、資訊服務方式的智慧化,資訊服務內容的智慧化三個面向的內容。
⑶服務場景線上線下融合
中國網路經濟發展經歷了最開始的線上online時代,以及隨後出現的線上向線下滲透的O2O(online to offline)模式。如今行動互聯網和行動支付的普及以及人工智慧,物聯網等技術的發展,使了線上服務和線下服務相互交融,資訊服務對實體經濟的滲透率越來越高,資訊服務與實體經濟呈現融合的趨勢。在此背景下,業界提出了線上與線下融合的OMO(Online-Merge-Offline)模式。
⑷此外,資訊服務的發展也呈現以下趨勢:
①從單一形式的服務向綜合性服務發展;②從以部門為主體的資訊服務轉變為社會化資訊服務模式;③各種專案資訊服務和系統化資訊保證服務將成為資訊服務業務發展的一大主流;④資訊服務朝向多元化和多樣化方向發展;⑤基於網路的資訊服務個人化,知識化與整合發展。
(二)網路資訊服務
網路資訊服務:是指資訊服務機構為滿足使用者的資訊需求,透過電腦網路提供經過加工整理的資訊產品和服務的總稱,它包括資訊內容的加工處理,資訊內容的提供,資訊內容的儲存與取得,網路加值服務,資訊諮詢服務。
1.網路資訊服務特點
⑴資訊提供知識化
網路資訊服務提供的是經過加工、處理的高濃縮的資訊產品,其內容與紛繁、無序、未經過整理的網路資訊資源相比更加規範,並且能針對用戶的需求為其建立起「知識庫”,“資料倉儲”等,從而達到既為用戶節約時間和精力,又能快速提供經過加工、整理的資訊內容的目的。
⑵資訊服務社會化
網路資訊服務機構的資訊資源社會化,網路化分享是網路資訊服務最鮮明的特色。在網路環境下,網路資訊服務機構能夠最大限度地滿足使用者的要求,發揮資訊資源的最大效用,充分體現網路中資源無限與服務無限的概念,從封閉的一館一舍走向開放的社會。同時,資訊服務所涉及的範圍不斷擴大。
⑶資訊服務虛擬化
網路打破了地域和時間的界限,網路資訊服務機構的工作人員可以透過網路即時同用戶聯繫,服務內容,過程都已電子化,服務的主、客體也被隱匿,使用者面對的是網路化的資訊服務系統,而不再是某個特定的人或物,從而突破了傳統資訊服務中時間、空間限制,使得用戶的資訊檢索、請求和獲取更加便捷和及時,為用戶節省了時間和精力。
⑷資訊服務個人化
網路資訊服務的個人化是網路出現後資訊服務的明顯特徵,也正是由於網路科技與資訊科技的提高,才使資訊服務的個人化得到充分的實現與發展。它表現在面對不同的用戶,資訊服務的內容和過程、手段更具針對性、目的性。
2.個人化資訊服務
⑴個人化網路資訊服務:就是面向使用者資訊的使用行為,興趣,嗜好,習慣,需求特點,為使用者搜索,組織,選擇,推薦,提供個人化客製化資訊服務的內容,系統與功能,以滿足用戶解決現實問題的資訊需求。
⑵個人化資訊服務包含兩個面向:一是使用者可以依照自身的需求自訂所需的資訊;二是網路資訊庫針對使用者服務的特點,主動為使用者選擇最需要的資源與服務,根據使用者的需求變化,動態地改變所提供的訊息,讓使用者得到個人化的服務。
⑶它包含的服務方式有:學科入口網站服務,個人化分類客製化服務,資訊主動推播服務,資訊智慧代理服務,數位參考服務,資訊幫助檢索服務,詞表導航服務,自動摘要服務等。
⑷比較重要的技術包括:使用者興趣與行為的獲取與使用者建模技術,資料探勘技術,個人化推薦技術,資訊過濾技術,人工智慧技術,智慧代理技術,個人化檢索技術等。
3.整合資訊服務
⑴資訊整合服務:是指在現代數位網路環境下,以現代資訊整合理論與技術為基礎,透過對服務要素進行整合與動態整合,並建構優勢互補的整合化服務體系,使用戶在最少的時間裡透過最小的成本利用到最需要的資源和服務的一種服務理念和模式。
⑵資訊整合服務的發展動因主要包括:①用戶需求的變化;②資訊資源的多樣化;③資訊科技的推動;④資訊服務本身的需要。
⑶資訊整合服務的類型:①以資源為中心的資訊整合服務;②以技術為中心的資訊整合服務;③機構合作為中心的資訊整合服務;④以使用者為中心的資訊整合服務。
4.行動資訊服務
⑴行動搜尋服務:①行動搜尋引擎的搜尋服務;②行動應用程式內的搜尋服務。
⑵行動定位服務:基於位置的服務是由行動通訊網路和衛星定位系統結合在一起提供的一種增值服務,透過定位技術獲得移動終端的經緯度座標等位置信息,實現各種與位置相關的服務。
三、資訊使用者及其需求與行為研究
資訊使用者:從資訊管理學意義上來說,資訊使用者主要是指那些利用各種資訊服務方式或資訊交流管道取得所需資訊的個人和團體。
(一)用戶資訊需求
1.資訊需要與資訊需求
⑴資訊需要:資訊需要是人們在實踐活動中為解決各種實際問題而對資訊的不滿足感和必要感。資訊需要在實踐活動和待解決的實際問題相對穩定的情況下,處於一種多層次的結構狀態。
⑵資訊所需的層次:
①(客觀狀態):在人們因要解決實踐活動中的各種實際問題而換取的信息需要狀態中,有的信息需要沒有被意識到而仍然處於內在狀態,有的信息需要被意識到而成為由外在反應的狀態。這是狀態結構的第一層。
②(認識狀態):我們把意識到的資訊需要定義為資訊需求,即資訊需要一旦被意識到就成為資訊需求。意識到的訊息需要狀態中,有的無法用語言文字表達出來而處於「意會」狀態,有的被人們用提問等方式表達出來而成為問題狀態。這是狀態結構的第二層。
③(表達狀態):意識到而未達出來的訊息需要就叫做潛在訊息需求,意識到並未表達出來的訊息需要叫做現實訊息需求,人們常說的「訊息需求」往往是現實訊息需求,即使用者以自己方便的形式及時取得問題解決所需的完整可靠的資訊需求。當人們表達出自己的資訊需求時,他可以針對許多資訊來源提出這個需求。他可能向資訊服務機構提出一個查找資訊的需求,也可能將其他資訊來源提出要求。我們常把使用者向資訊服務機構提出的具體要求稱為資訊提問。由此形成了訊息需要的第三層結構。
2.資訊需求理論
⑴意義建構理論;⑵知識非常態理論
3.資訊需求特徵
⑴資訊需求的多樣性特徵
使用者資訊需求具有多樣性,而這種多樣性是由其所承擔的社會角色的多樣性所決定的。人的社會角色以其獲得的方式可以分為先賦角色和自致角色兩大類。根據使用者不同角色扮演的資訊需求,可以把使用者的資訊需求結構分成個人資訊需求,組織資訊需求和社會資訊需求三個部分。同時用戶資訊需求的多樣性也來自於資訊需求產生環境。
⑵資訊需求的知識性特徵
資訊需求不同於其他需求,不僅需要需求強度的刺激,而且有賴於使用者自身條件,尤其是其認知能力。作為資訊需求從客觀狀態正確轉化到主觀狀態的條件,使用者至少具備三個方面的知識,即行業知識,專業知識和資訊資源知識。
⑶資訊需求的模糊特徵
使用者資訊需求是一種派生需要,產生於使用者對特定知識的特定欠缺狀態,而且資訊需要往往與一定的問題或決策相關,對於一個較廣範圍的知識領域,甚至無法確定其主體,範圍或所屬。因此使用者的資訊需求往往處於一種模糊狀態。這種使用者個人認識的模糊性成為使用者資訊需求的普遍特徵。
(二)使用者資訊行為及其特徵及規律
使用者的資訊行為:是指使用者尋求他所需求的資訊時所表現出來的需求表達、資訊取得、資訊利用等行為。使用者的資訊需求千差萬別,影響因素多種多樣,使用者的資訊行為也複雜多變,但是我們從使用者資訊需求,心理動機,資訊行為的特徵面向去考察,就可以發現某些共同的規律。
⑴使用者所需解決問題的重要性,或所需資訊的價值大小是決定使用者的資訊需求是否轉化為資訊行為的根本原因。
如果使用者所要解決的問題至關重要,某一資訊能幫助解決該問題,在資訊來源唯一的情況下,則使用者利用某資訊中心的資訊服務便唯一地被確定了。
⑵資訊和資訊服務的可近性以及資訊資源和資訊系統的易用性是決定情報使用者是否利用某種資訊服務的最重要因素。
①可取得性是由資訊來源的物質載體、資訊來源及資訊機構的地理位置,網路條件等因素所決定的,是資訊及資訊服務是否方便取得和使用的屬性。使用者對資訊來源的選擇或對資訊服務選擇幾乎都是建立在可獲得性的基礎上的,最便於獲得的資訊來源首先被選用,對品質可靠性的要求則是第二位的。
②資訊系統的易用性存在著著名的“穆爾斯定律”,該定律指出:“一個信息檢索系統,如果對用戶來說,他取得信息要比不取得信息更傷腦筋和麻煩的話,這個系統就不會被利用。資訊使用者總是希望檢索系統越方便使用越好,越是簡單易用的檢索系統,使用者使用的頻率也越高,反之則很少使用者去使用,這正是「省力法則」的體現。
⑶使用者尋求資訊的過程首先從個人的資料庫中查尋,然後轉向非正規管道,取得同行的幫助。
①只有在這些方法無法達到目的,才考慮到資訊系統或資訊中心。這種行為特徵有兩種原因:易用性所致;可獲得性所致。
②資訊使用者的這些行為與可近性選擇理論密切相關。該理論認為,使用者利用資訊的行為分為選擇性確認,選擇性吸收和選擇性記憶三個階段,且每一個階段的行為都受可近性選擇規律的限制。這裡的可近性概念是指使用者與資訊資源之間的相互關係,其內涵包括物理可近性,智力可近性和心理可近性三個面向。
⑷任何資訊使用者既透過正規管道,也透過非正規管道尋找所需的資訊。
對許多用戶來說,非正規管道被認為比正規管道更為重要。雖然非正規管道不如正規管道嚴謹可靠,但由於可取得性和易用性以及用戶的習慣等原因,它至今仍在資訊交流系統中佔有重要地位。
⑸用戶對提供資訊服務及資訊資料的時間要求的總趨勢是更快更新。
①這一方面是因為,現代社會的生活節奏加快,各種社會系統都在超速運轉,人們的各種決策都是刻不容緩,因此要求資訊服務更快,更及時。
②另一方面是因為,社會經濟和科學技術迅速發展,資訊越來越多,老化不斷加速,這就要求資訊機構所提供的資訊應當最新。這兩個方面的因素使得資訊使用者需要最快的服務,最新的資訊。
⑹使用者向資訊中心的資訊服務工作者提出諮詢的兩種現象。
①第一,使用者在向資訊服務人員提出諮詢時,有一種強烈的傾向,即他的提問所表達的往往是他認為該資訊中心能夠提供給他的東西,而不是他真正想要的東西。造成這種情況的原因有二:一是資訊系統的功能不能令使用者滿意,二是新使用者初次利用資訊系統的資訊服務。
②第二,使用者用書信方式提問比直接向資訊人員提出諮詢更能準確地表達其資訊需求。對電腦資訊檢索系統的提問往往會發生這種情況。
③針對以上兩種現象,資訊服務人員在提供服務時,首先應該使用戶了解資訊系統的特性和功能,其次應該仔細揣摩用戶未表達出的真實資訊需求,必要時應盡量讓用戶在提問單上填寫資訊需求。
(三)資訊用戶研究的內容
1.資訊使用者構成及分類研究
研究資訊使用者劃分的依據或標準以及使用者劃分的類型,在此基礎上研究各類使用者的數量構成和知識組成。
2.使用者資訊需求調查分析
調查分析資訊使用者需要什麼內容、形式、範圍和期限之內的信息,什麼時候要,習慣於以什麼方式,從什麼途徑去獲取自己需求的資訊。
3.使用者資訊心理規律研究
利用心理學的理論和成果研究使用者資訊心理特點,探索使用者資訊需求變成資訊查找行為的心理狀態和過程,分析使用者在尋找資訊和進行資訊諮商過程中的心理規律,幫助資訊使用者消除心理障礙,減少資訊系統對使用者的約束,為改善資訊服務方式,提高服務品質提供依據。
4.使用者資訊效用及使用者吸收資訊的機制研究
使用者選擇、評價和吸收資訊的過程是資訊價值得以實現的重要環節。這方面需要研究:使用者如何選擇和評價訊息,使用者吸收資訊做出決策或進行創造的過程,使用者資訊效用的原理和評估方法等。
5.影響使用者資訊需求與資訊活動的因素研究
資訊使用者的資訊需求是一種特定的社會需要,它受到許多因素的影響,要綜合研究社會政治、經濟、文化和科學技術對使用者資訊需求的影響。還要分別研究使用者本身的知識素養,個人興趣,資訊能力和職業特徵對資訊需求的影響。使用者的資訊活動包括複雜的心理活動和資訊的蒐集,查詢,吸收及使用的行為活動,這些活動受到大量因素的影響和作用,包括使用者的個性因素,環境因素以及資訊活動因素等。
6.使用者的資訊保證研究
使用者的資訊保證是指透過一切可能的途徑和方式給予使用者適當的各種形式的訊息,供其選擇、使用,它是「資訊服務」的系統化,是滿足使用者資訊需求的關鍵。 「資訊保證」的目的是及時地,適當地供給用戶所需的信息,為用戶所從事的工作服務。研究使用者資訊保證包括資訊保證的原則,使用者對資訊和資訊服務方式的選擇,資訊保證的方式與系統,使用者資訊保證的組織與管理,使用者訓練等方面的內容。
(四)資訊用戶的研究方法
問卷調查法、訪談法、觀察法、實驗法、出聲思維法、眼動追蹤法、影片捕捉法、網誌分析
四、網路使用者資訊的需求及行為
(一)網路使用者資訊的需求
網路資訊使用者的資訊需求是指使用者對具體資訊的需求,資訊檢索工具的檢索需求,資訊服務的需求。網路使用者資訊需求展現了一些新的特點:
⑴資訊需求量大幅增加
人類加工和傳遞訊息的能力越來越強,進一步刺激的對訊息需求的強度。隨著社會的發展,人類社會的文明進步,在人們的日常上都得以滿足之後,要提高生活質量,對休閒,購物,旅遊的資訊需求會越來越大。社會的可持續性需要大量資訊來支持。此外,現代資訊科技能夠改善使用者所處的社會環境,間接的導致使用者數量的增加,需求的資訊總量也不可避免地增加。
⑵對資訊內容的要求越來越高
使用者要求資訊準確,傳遞速度快,時間性強,就是由資訊本身所具有的時效性特徵決定的。面對日益資訊化的高速發展社會,快速,準確,有效率地獲取和利用資訊顯得尤為重要,人們對資訊的品質要求也必然會來越高。
⑶用戶資訊需求的社會化
在網路環境中,資訊服務部門資訊服務的傳統模式越來越難以滿足用戶開放化的資訊需求,用戶資訊需求則由原先的穩定性、集中性向開放化的社會性轉變。 Internet、城域網路、區域網路為使用者創造了開放性的資訊需求客觀環境,加速了使用者資訊需求社會化進程。
⑷用戶資訊需求的整合化
資訊網路的發展將電腦技術、遠端通訊技術和網路資訊處理技術有機結合,從根本上改變了資訊資源開發、組織和分佈的狀況,從而使用戶可以方便地按主體客觀需求在網路環境中集中獲取所需信息,即在網絡中將各類信息獲取方式融為一體,使信息交流、查詢、數據獲取、全文閱讀和信息發布集成為多功能、多渠道、多方式的信息需求與服務利用行為。
⑸資訊需求的馬太效應與羅賓漢效應
使用者資訊需求的馬太效應是指使用者資訊需求及其累積資訊量之間的相關性。一般而言,資訊需求量大的用戶,隨意時間的推移,其累積的資訊量越多,其資訊需求也越來越高於平均。而資訊需求量小的用戶,隨著時間的推移,其累積的資訊總量出現停滯的態勢,其資訊需求量也因而越來越低於平均。另一方面,使用者需求水準總是比較平衡的,大多數使用者的資訊需求總量趨於平均,這是使用者資訊需求的羅賓漢效應。
(二)網路使用者的資訊行為
網路使用者資訊行為:是網路使用者在認知思考支配下對外部條件做出的反應,是建立在資訊需求和思想動機基礎上,利用網路提供的資訊內容和資訊服務,所從事的資訊需求認知與表達,資訊查詢,資訊選擇,資訊存儲,資訊吸收與利用以及資訊加工,資訊互動等活動。
1.網路使用者資訊查詢行為
網路資訊查詢行為是指使用者為獲取所需資訊,在與網路互動過程中所採取的一系列身體活動和心理活動,它主要透過資訊檢索行為與資訊瀏覽行為兩類行為來完成。
2.網路用戶資訊選擇與儲存行為
網路使用者的資訊選擇行為是指使用者根據自己的需求,在個體既有知識累積的基礎上,利用一定的分析和判斷能力,對呈現的網路資訊進行相關性判斷,選擇,從而過濾出對其最為有用的信息或資訊鏈路。
資訊儲存指使用者將挑選出的對其有幫助的資訊進行保存的行為。
3.網路使用者資訊吸收與利用行為
面對蒐集的訊息,使用者需要在腦中反應,識別,整理,借助個人的消化學習能力,將其理解吸收並轉譯為自身知識序列的一分子,從而充實個人的知識儲備。
資訊利用行為是建立在資訊吸收基礎上的,即使用者使用所掌握的資訊並作用於其生產,評價,決策,求解,創新,生活,休閒,人際交往,思想庫的充組以及思維層次的提高等方面。它是使資訊真正發揮效能的關鍵環節。
4.網路使用者資訊互動行為
網路使用者資訊互動行為是使用者利用網路作為交流平台的線上資訊交流行為。在這種資訊互動中,使用者既可從網路資源和網路互動對等實體方獲取訊息,又可向網路上載或向對方傳遞訊息,即成為訊息發布者,是一種雙向的訊息交流行為。根據互動的參與對象,我們可以將網路資訊互動行為分為人-機互動型和人-人互動型兩種。
5.網路社群用戶協同資訊行為
與單一個體使用者相比,網路社群使用者資訊行為的表現出較強的互動性和協同性特徵。除了在網路上尋找瀏覽自己所需資訊之外,他們還會發布和分享自己感興趣的知識,同時更期望與其他具有相同興趣的使用者進行關聯互動和協作,體現出強烈的群體性,並影響周圍其他使用者的網路意識和行為。
第八章 資訊系統
一、資訊系統的基本概念
(一)資訊系統的概念與組成
資訊系統:是由電腦硬體、網路和通訊設備、電腦軟體、資訊資源、資訊使用者和規章制度組成的以處理資訊流為目的的人機一體化系統,目的是及時、正確地收集、加工、存儲、傳遞和提供訊息,實現對組織中各項活動的管理、調節和控制。
資訊系統的組成:①電腦硬體系統、②電腦軟體系統、③資料及其儲存媒體、④通訊系統、⑤非電腦系統的資訊收集處理設備、⑥規章制度、⑦工作人員
(二)資訊系統的功能
1.輸入功能
資訊系統的輸入功能決定於系統所要達到的目的及系統的能力和資訊環境的許可。一般情況下,資訊系統的輸入內容包括資訊資源的收集,控制指令的輸入,資訊檢索條件的輸入等。
2.儲存功能
儲存功能指的是系統儲存各種資訊資料和資料的能力。當原始資料和資料輸入資訊系統後,首先需要將其儲存起來,以便多次使用,並在多個處理環節和流程中實現資料資料共享。
3.處理功能
大量的資訊資料和資料得以儲存之後,必須及時進行加工處理。處理是資訊系統內部的生產過程。資訊系統處理功能的大小取決於系統內部的專業技術力量和資訊處理技術設備的現代化程度。
4.輸出功能
資訊系統的各種功能都是為了確保最終能達到最佳的輸出功能。資訊經過處理後,輸出內容包括經過資訊系統加工處理後的資料訊息,資訊系統運作過程中狀態的回饋訊息,以及需要人工幹預時的提示訊息。
5.控制功能
為了保持資訊系統的輸入,存儲,處理,輸出等環節均勻連續地進行,系統必須具有進行管理和控制的能力。資訊系統的控制功能體現在兩個面向:其一是對構成系統的各種資訊處理設備進行控制與管理;其二則是對整個資訊加工,處理,輸入,輸出等環節透過各種程序控制。透過控制功能的作用,使資訊系統的各項功能優化,從而使整個資訊系統運作優化。
(三)資訊系統的發展與類型
1.資訊系統的發展階段
⑴最初的資訊系統主要是資訊處理系統,如圖書情報中心等以文件為基礎的資訊檢索系統。它是手工的,即傳統意義上的系統。
⑵自1940年代電子電腦問世以來,資訊系統進入現代資訊系統階段-電腦資訊系統,並隨著資訊科技的飛躍以及現代社會資訊需求的增長,迅速發展。
⑶20世紀50年代,電腦在資料處理技術上的突破,為電腦的應用拓展了空間,陸續出現了資料統計系統,資料更新系統,資料查詢系統,資料分析系統,系統狀態報告系統等。同時出現了電子資料處理系統,有力地促進的資訊系統的發展。
⑷20世紀60年代後期到70年代又出現了多種形式的資訊系統,如管理資訊系統,決策支援系統。
⑸80年代又出現了支援企業最高決策層的高階主管支援系統和支援中高階主管的經理資訊系統。同時,不同領域的資訊系統也有了新的發展。在人工智慧領域出現了專家系統,在加工製造企業中,電腦整合製造系統的應用,使得企業生產經營環節自動化。
⑹步入90年代,資訊科技進一步發展,出現了群體決策支援系統,智慧決策支援系統,產品資料管理系統等。
⑺21世紀,各產業都出現了大量的不同風格與應用的資訊系統,資訊系統已成為評估組織資訊化程度的一個最重要的指標。同時,隨著資料探勘技術的出現和發展,電腦對資訊的處理上升到了對知識的處理,出現了知識管理系統和基於資料探勘的客戶關係管理等。
資訊系統發展過程的階段理論—諾蘭模型
⑴起步階段:這個階段從企業引進第一台電腦開始,一般都是先在財務,統計,物資等部門開始使用,隨著企業對電腦應用認識的深入,人們體會到電腦應用的價值,開始學習,使用,維護計算機。
⑵擴展階段:隨著電腦在一些部門見到成效,從最初的一些應用部門向其他部門擴散,大量的人工數據處理轉向電腦處理,人們對電腦的熱情增加,需求增長。但對於整個組織來,說無整體的資訊系統,這個階段需要大量的投資。
⑶控制階段:由於人們對電腦資訊處理需求的成長,造成財務支出大幅度上漲,企業領導者不得不對之進行控制,注重採用成本/效益去分析應用開發,並針對各項已開發的應用項目之間的不協調和資料冗餘等進行統一規劃。控制階段是實現從以電腦為主轉向以資料管理為主的關鍵,一般發展較慢。
⑷整合階段:即經過第三階段的全面分析後,引進資料庫技術,在開發資料網路的條件下,資料處理系統又進入一個高速發展階段,逐步改善原有系統,發一個能為中、上層管理提供支持,為企業提供各種資訊資源的管理系統。該階段的投資和費用將再次迅速成長。
⑸資料管理階段:即係統經過整合、綜合之後才有可能進入有效的資料管理,實現資料共享,這時的資料已成為企業的重要資源。
⑹成熟階段:資訊系統成熟表現它與組織的目標一致,從組織的事務處理到高層的管理與決策都能支持,並能適應任何管理和技術的新變化。
2.資訊系統的類型
從組織的管理過程和層級角度可將資訊系統分為:事務處理系統、管理資訊系統、策略決策支援系統,分別對應組織管理的作業層,管理階層和決策層。
⑴事務處理系統(TPS):是處理組織事務和業務數據的系統,它面向數據,對組織事務過程中的數據進行記錄,計算,分類,匯總,存儲和輸出。這類資訊系統從結構上相對簡單,功能單一,可以在單機上運行,也可以在網路環境中運行,主要面向單項應用。事務處理雖然簡單,但是數量大且非常重要,是組織所有管理和決策資訊系統的基礎。
⑵管理資訊系統(MIS):是處理組織管理資訊的系統,主要使用者是組織中的中階管理者。 MIS是面向資訊的,中階管理者需要使用管理控制資訊來衡量績效,確定控制行動,制定運作人員使用的規章以及分配各種資源等,輔助實現組織各部門的管理功能,為半結構化問題的決策提供支援。
⑶決策支援系統(DSS):是處理非結構化與半結構化問題的系統,支援管理者非程序性決策。它利用事務處理系統中的資料與管理資訊系統中的信息,其他組織資訊與知識,組織外部資訊與知識,為決策者提供決策支援。高階管理者根據自己的知識經驗和決策支援系統的支持,在選用方案中選擇最優方案。 DSS包含三個部分:資料、模型與使用者介面。與MIS相比,DSS面向的是知識,有更高的智慧水平,可以處理非結構化的問題。
①智慧決策支援系統(IDSS):是將人工智慧技術引入DSS而形成的一種資訊系統。
②群體決策支援系統(GDSS):是DSS的擴展,是把電腦處理,資料通信,電子郵件等多種技術結合起來,提供被稱為群件的GDSS軟體來支援決策過程,使不同地點的決策人員可以透過自己的電腦終端機參與共同決策的電腦輔助決策系統。
③專家系統(ES):是設計用來模擬專門領域的人類專家的提問-解答活動的電腦軟體系統。
(四)資訊系統的架構模式
1.主機——終端模式
這種模式是一種集中運算環境,使用大型主機作為伺服器集中化管理,透過終端機來存取資料。在集中模式下,資訊系統所提供的服務完全依賴主機伺服器,客戶端每個請求都需要在伺服器處理,然後將結果傳回客戶端,所以對伺服器的要求極高。優點是:系統穩定,易於維護;缺點是:對主機資源需求過高,對大規模應用支援不夠,難以實現跨硬體和跨平台的資訊共享,同時終端機應用任務簡單,造成了資源浪費。
2.客戶機/伺服器(C/S)模式
此模式在分散式運算環境下,結合大型主機機構及網路工作組兩者優點,以高效能的資料庫伺服器為中心,集中管理核心資源,提供客戶機應用所需的資料支援。優點: 既充分地共享伺服器的資源,同時也使客戶機的本地資源得到了充分利用,整個系統的負載在客戶和伺服器間得到合理分配,使得大規模,網路化的應用成為可能;缺點:開發成本較高,系統配置、維護管理和升級麻煩且費用大,可管理性差,工作效率低。
3.瀏覽器/伺服器(B/S)模式
B/S模式是在C/S模式的基礎上發展起來的,其利用瀏覽器作為客戶端的應用程序,採用瀏覽器-應用伺服器/Web伺服器-資料庫伺服器三層結構,資料資訊以網頁頁面的形式傳輸。具有更簡單,更低成本,能夠提供更多資訊等諸多優勢,使用非常方便,成為資訊系統架構的發展趨勢。
4.多層架構模式
自從三層結構的概念提出和應用之後,其不斷被引申和發展,進而逐漸產生了多層結構,即前台界面(如瀏覽器)、Web伺服器,中間件(應用伺服器)及資料庫服器。這種邏輯結構的出現不僅意味著電子商務系統框架的基本形成,更重要的是它使系統在結構和效能方面趨於合理。
二、資訊系統的開發
(一)技術基礎與運作環境
資訊系統的基礎是資訊科技。一般認為資訊科技是電腦硬體技術,電腦軟體技術和通訊與網路技術的總稱。
1.電腦硬體技術:電腦硬體主要由運算器,控制器,記憶體,輸入設備及輸出設備五大功能部件構成。
2.電腦軟體技術:軟體系統幫助使用者使用電腦硬體完成資料的輸入,處理,輸出,儲存等活動。軟體分為系統軟體和應用軟體。
3.電腦網路技術:電腦網路是用通訊介質把分佈在不同的地理位置的電腦、電腦系統和其他網路設備連接起來,以功能完善的網路協定實現資訊互通和網路資源共享的系統。電腦網路包括:網路介質;協定;節點;連結。
4.資料庫技術:資料庫是以一定的組織方式儲存在一起的相關資料的集合。資料庫系統包括:資料集合、硬體、軟體和使用者四個組成部分。
(二)資訊系統開發的階段
系統開發生命週期(SDLC):是指開發資訊系統的一種結構化的按部就班的方法,描述了資訊系統開發專案中,從最初的可行性研究一直到完整程序維護的各個階段。
1.系統計劃階段
①界定要開發的系統;②確定專案範圍;③制定專案計畫
2.系統分析階段
①收集業務需求;②將需求排序
3.系統設計階段
①設計技術架構;②設計系統模型
4.系統開發階段
①建立技術架構;②建立資料庫與程式設計
5.系統測試階段
①編寫測試條件;②實施系統測試
6.系統實施階段
①編寫詳細的使用者說明書;②為系統使用者提供培訓
7.系統維護階段
①設立為系統使用者服務的服務處;②提供支援系統變更的環境
(三)資訊系統開發方法
資訊系統開發方法是基於資訊系統開發規律來組織、建構和管理資訊系統的,包括人們的思維方法,指導策略,技術途徑,活動規則及步驟。抽象思考與形象思考方法是系統發展方法的基本想法;概括與劃分、歸納與演繹是系統發展使用的基本邏輯方法。從工程技術角度分析,較有影響的系統開發方法有:結構生命週期法,原型化方法,物件導向法,CASE方法等。
1.結構化生命週期法
結構化生命週期法是一種最常用的資訊系統開發方法,又稱為結構化開發方法或瀑布開發法。其基本概念是:在系統分析與設計階段是自頂向下,逐層分解。在系統實現階段則是自底向上,透過模組連結形成完整的資訊系統開發流程,嚴格依照系統分析,系統設計,系統實現等流程去開發。
2.原型法
原型法是指系統開發人員在初步了解用戶的基礎上,借助功能強大的輔助系統開發工具,快速開發一個原型,並將其演示給用戶,開發人員根據用戶的意見和評價對這個原型進行修改,如此反复,逐步完善,直到用戶完全滿意為止。步驟:①辨識基本需求;②建立初始原型;③系統使用者評估;④修正與提升原型
3.物件導向法
物件導向的技術把物件的屬性(資料)和處理(方法)封裝在一起,透過子類別對父類別的繼承,使得軟體便於維護和擴充,提高了軟體的可重複使用性。階段:①系統調查與需求分析;②物件導向分析;③物件導向設計;④物件導向程式設計
4.CASE方法
電腦輔助軟體工程(CASE)是一種支援整個軟體開發生命週期的軟體開發自動化技術,是一種從開發者的角度支援資訊系統開發的電腦技術。功能是:①支援不同的開發方法;②支援軟體開發生命週期的各個階段;③具有文件出版功能和文字圖形編輯功能;④支援開發資訊資源共享。
5.測試驅動開發方法
測試驅動開發(TDD)是一種全新的軟體開發想法和方法,可以有效地讓程式開發人員開發出更高品質的,經過完整測試的程式。 TDD方法要求在進行某個功能的程式碼實作之前,先編寫該功能的測試程式碼,然後只編寫使測試通過的功能程式碼,透過測試來推動整個軟體開發的進程。流程:①測試;②實作;③重構
三、資訊系統的管理
資訊系統的管理:就是資訊系統的開發期,運作期,更新期整個過程進行計畫控制,維護與評估。
資訊系統專案管理、資訊系統品質管理、資訊系統運作與維護管理、資訊系統評價
四、資訊系統的安全
(一)資訊系統安全的意義
資訊系統安全:指確保資訊系統結構安全、與資訊系統相關的元素安全,以及與此相關的各項安全技術,安全服務與安全管理的總和。包括4層意義:⑴資訊安全;⑵電腦安全;⑶網路安全;⑷通訊安全
(二)資訊系統安全體系結構
⑴基於協定的安全體系結構;⑵基於實體的安全體系結構;⑶基於物件的安全體系結構;⑷基於代理的資訊系統安全體系結構
(三)資訊科技安全保護策略
1.非技術性安全策略
非技術性安全策略是指利用法制保證,行政管理和其他措施等防止資訊系統安全事故的發生;
⑴法制保證:目前針對資訊系統的法律法規大致可以分為社會規範和技術規範兩類。這些法律和標準是確保資訊系統安全的依據和主要保障。 ①社會規範是調整資訊活動中人與人之間的行為準則。包括保密法、資料保護法、電腦安全法、電腦犯罪法等。 ②技術規範是指各種技術標準和規程,如電腦安全標準,網路安全標準,作業系統安全標準,資料和資訊安全標準等。
⑵行政管理:是安全管理的一般行政措施,是依據系統的實踐活動,為維護系統安全而建立和製定的規章制度和職能結構。主要有:①組織及人員制度;②運作維護與管理制度;③電腦處理的控制與管理制度;④機房保衛制度等。
⑶人員訓練:對於資訊系統的工作人員,如終端操作員,系統管理員,系統設計人員等,由於他們對系統的功能和結構比較熟悉,因此對系統安全的威脅很大,必須進行全面的安全保密教育,職業道德和法制教育。
2.技術性安全策略
技術性安全策略是指採取與系統直接相關的技術手段來防止資訊系統安全事故的發生。
(四)資訊系統安全技術
⑴資料加密技術
利用技術手段把重要的資料變成亂碼(加密)傳遞,防止資料在傳輸過程中被他人竊聽。目前加密技術有對稱加密和非對稱加密。
⑵身分認證技術
身分認證技術主要透過一次性口令技術和數位簽章來驗證使用者身分是否合法,以減少採用公共網路進行資料傳輸的風險。
⑶防火牆技術
防火牆是一種隔離技術,透過對特定的網段和服務建立有效的存取控制,在內外網之間形成一道安全屏障。
⑷交換式虛擬區域網路技術
是一種以交換器作為網路中心,同時採用虛擬區域網路邏輯拓樸結構來強化網路安全的技術。
⑸資料安全儲存技術
是指在網路環境下對資料進行集中備份管理,實現備份自動化和災難復原的技術。儲存備份方法有三種:完全備份,增量備份和差異備份。資料恢復有:硬體恢復和軟體恢復兩種方法。
⑹漏洞檢測技術
漏洞偵測技術就是透過網路資訊系統檢查,找出有系統安全漏洞的技術,常用的方法有被動式和主動式兩種。
⑺入侵偵測技術
入侵偵測技術是一種透過採集和分析被保護系統的資訊從而發現入侵行為的技術。入侵偵測工作通常由特定的入侵偵測系統(IDS)承擔。
第九章 資訊機構及其管理
一、資訊機構的類型與職能
(一)資訊機構的意義及類型
1.資訊機構的意義
資訊機構:是實施資訊蒐集,加工,分析,儲存,傳遞等有關資訊管理活動的組織形式,它普遍存在於各種產業形式中,並且在國民經濟和社會發展中具有與日俱增的地位與作用。
2.資訊機構的類型
⑴在國家資訊部門產業結構研究中,波拉特依據資訊產品或服務是否進入市場交易為標準,將國家經濟部門劃分為一級部門和二級部門。
①一級資訊部門:指那些向市場提供價格資訊商品或服務,參與市場交換的部門。
②二級資訊部門:指那些滿足政府或資訊企業內部消費而提供資訊生產與服務的部門。
⑵結合波拉特對資訊部門的劃分方法,我們將資訊機構劃分:
①獨立的資訊機構:對應於第一資訊部門,其資訊產品和服務是面向市場或公眾這類外部對象的,又細分為公益性資訊機構和營利性資訊機構兩類。
②組織內部的資訊機構:對應第二資訊部門,這類機構不是獨立機構,而是依附於特定的組織,作為組織內部下設的部門存在,其生產的資訊產品和服務只是提供給組織內部,而非面向市場或公眾。
(二)資訊機構的職能
1.促進科技創新
科技資訊資源的建置是科技資訊機構的立業之本,是資訊服務的核心。科技資訊機構可透過創新管理體制與運作機制,加速建構科技文獻資訊資源與服務平台,實現以「指示資訊來源」為主的資訊服務朝向使用者、解決問題的「一站式」網路化訊息服務模式的轉變。
2.為政府部門提供決策支持
面向政府部門服務的資訊機構,其職能在於促進改善政府機關的資訊環境;滿足政府機關人員的日常資訊需求;為管理者提供一個可供選擇的資訊收集與分析的管道以及為政府機關工作提供後援支持。
3.服務企業
為了因應日益加劇的市場競爭,企業紛紛開始重視和進行情報資訊工作,以支持企業策略決策,技術創新和市場經營等活動。
4.支持科學研究與發展
資訊機構所進行的資訊工作可為科學研究活動提供三個層面的支援:一是科技文獻保障,二是技術監測與分析,三是科學研究活動的評估評估。
5.其他社會功能
資訊機構的工作對人類社會的知識傳播有重要作用。以圖書館為代表的資訊機構,作為國家文化事業的重要組成部分和社會文獻資訊中心,在資訊素養教育工作,提高公眾資訊素養方面發揮重要作用。
二、資訊機構的運作與管理
(一)資訊機構的運作機制與運作效率
機制是事物自身運作調節的方式與規律,它直接決定事物自身的運作效率。
(二)資訊機構的管理策略
1.戰略規劃
策略規劃是確定一個資訊機構發展方向的關鍵。構想一個成功的策略規劃應遵循以下幾個相協調的步驟:⑴任務的確定;⑵評估競爭對手的行為;⑶外部環境的評價;⑷支出和收入的預測;⑸制定具體目標;⑹建立工作規範和回饋機制
2.履行管理的各項職能
資訊機構的管理是在特定的環境下,對資訊機構所擁有的各種資源進行有效的計劃,組織,領導和控制,以便達成既定的組織目標-為資訊使用者服務。具體包括:計畫、組織、領導、控制。
3.以流程再造為導向的資訊機構組織架構設計
目前資訊機構已發展到數位化方式,面對資訊使用者日益更新的需求,市場日益系列的競爭,環境日益頻繁的變化,資訊機構需徹底改變傳統的工作組織方式,以一體性工作流程取代以往的被各門割裂的、片段黏合式的破碎工作流程。
4.強化激勵
資訊機構可採取下列措施對員工進行激勵:實施功效掛鉤,運用晉升激勵。
5.從人本管理到知本管理
所謂人本管理就是以人為本,即信任人,尊重人,關心人,理解人,激勵人,培養人。以知為本,就是要考慮如何能夠激勵和活用人員的知識,使人員能夠做出可持續的貢獻,使人員願意將其知識用於他們的工作,提高整個資訊機構的運作效率。
三、公益性資訊機構及其管理
(一)公益性資訊機構的性質與定位
公益性資訊機構界定為非營利組織的一種。公益性資訊服務是指主要採用無償或低價服務,讓廣大用戶能夠較為公平便利地獲取所需的資訊資源,但不以營利為目的,其服務效益主要是社會效益和間接的經濟效益。
公益性資訊機構主要由以下三類組成:⑴隸屬於各政府部門的資訊中心,情報所等;⑵圖書館;⑶面向社會的資訊研究所,資訊服務中心。逐步定位成非營利-研究型的資訊服務機構。
(二)公益性資訊機構的經營思想
公益資訊機構在堅持其非營利-研究型定位的基礎上,可具有經營思想和營利行為,在提供免費資訊服務為主的同時,對高端和增值的資訊產品和服務可以實行收費。
確定了實行有償資訊服務的合理性,公益性資訊機構也需要採用「市場導向」的策略,隨時了解市場的需求,以滿足顧客不斷變化的需求。並將透過多種管道獲得的資金轉化為資源,從而產生更大的社會效益。
(三)公益性資訊機構的協作管理
公共資訊服務:是一種開放性的資訊服務,即以包括各行業用戶在內的公眾為對象,以提供公共資訊發布,交流和利用服務為內容,以服務於社會為目標的社會化服務。
公共資訊資源主要有以下特性:①普遍性②基礎性③公開性④共享性⑤廣泛性
四、營利資訊機構及其管理
(一)盈利性資訊機構的涵義與特點
獲利性資訊機構:又可稱為資訊服務企業,是資訊市場化和資訊商品化的產物,為了滿足資訊市場消費需要,從事資訊生產、流通等經濟活動,進行自主經營,實現獨立經濟核算,具有法人資格的專門經濟單位。
特色:⑴服務格局市場化;⑵經營管理彈性;⑶服務項目特色化;⑷技術手段先進性。
(二)營利資訊計畫的行銷管理
1.營利性資訊機構行銷策略
⑴資訊市場區隔;⑵目標市場選擇;⑶目標市場定位
2.營利性資訊機構行銷策略
⑴產品與服務策略
⑵價格策略:①高價撇脂策略;②低價滲透策略;③差異價格策略;④免費定價策略。
⑶通路策略
⑷促銷策略
(三)營利資訊機構的發展策略
1.產業群聚發展模式
資訊產業群聚是指大量資訊產業及相關支撐機構在一定範圍內的集中,具有機構地域化集聚、創新型強,各企業高度專業化,企業間協作分工等特性。
營利資訊機構的群聚發展模式的特徵:①知識技術密集;②產業鏈條化;③協同網絡化;群聚生態化
2.協同創新發展方式
協同創新的關鍵是形成以企業、大學、研究機構為核心要素的大跨度整合的創新組織模式,以金融機構,中介組織,創新平台,非營利組織等為輔助要素的多元主體協同互動的創新模式。它具有整體性和動態性的特徵。
3.生態系運作機制
資訊產業群聚生態系統是由自然子系統,社會子系統以及經濟子系統共同構成的產業群聚生態系統。在生態系中,營利性資訊機構及其他生態主體之間形成環環相扣的,具有依存關係的生態鏈。
第十章 資訊政策與資訊法律
一、資訊政策
(一)資訊政策的基本問題
1.資訊政策的涵義和內容
⑴資訊政策的涵義
國家資訊政策:指在一國範圍內,國家或政府為解決資訊管理和資訊經濟發展中出現的、關係和涉及公共利益、權益、安全問題,保障資訊活動協調發展而採取的有關資訊產品及資源生產、流通、利用、分配以及促進和推動相關資訊科技發展的一系列措施、規劃、原則或指南。
⑵資訊政策的範圍
①確定社會的資訊需求;②設計適當的方法以便使資訊需求得到滿足;③促進資訊資源的有效利用;④資訊專業人員的人力發展;⑤確定必須的基礎建設;⑥確保持續的經費支持。
⑶資訊政策的分類
①從資訊政策研究的歷史來看,資訊政策大致可分為四大類:規範性架構與指引;具體研究報告與諮詢報告;一般性理論方法研究;與資訊科技發展有關的資訊政策。
②從制定資訊政策的主體和適用範圍劃分:國際性資訊政策、區域性資訊政策、國家性資訊政策、地方性資訊政策。
③從資訊政策規範的領域劃分:經濟資訊政策、科技資訊政策、教育資訊政策、文化資訊政策等。
⑷資訊政策的作用
①確定社會資訊活動的發展方針,指明資訊事業的大方向,指導資訊事業的發展。
②調動或約束社會資訊力量,促進資訊資源的合理開發與有效利用。
③協調資訊環境系統各部門與外部環境的相互關係,確保社會資訊環境的健康發展。
④介入資訊資源的建構與資訊資源的利用過程。
⑤規範資訊工作的標準化。
(二)國家資訊政策體系的建構
1.政策主體
政府是國家資訊政策的主體,除了政府之外,資訊政策主體表現出多元化屬性。從資訊系統和網路的普遍性觀點來看,資訊政策主體可能涉及社會的各個方面,從國家到地方政府,從政府的各個行業主管部門到社會團體。
2.政策目標
資訊政策目標是指透過制定資訊政策所實現的利益協調和分配關係。目前我國國家資訊政策的目標是:深入實踐新發展概念,精確掌握國際國內資訊化發展大趨勢,全面落實國家重大戰略部署,統籌各地區各部門資訊化工作。
3.政策問題
資訊政策問題是指能夠列入政策制定議程的客觀社會問題,即資訊政策應該解決的社會矛盾和問題。現代社會的資訊政策問題具有複合性和關聯性,要求對資訊政策從整體上進行綜合性的研究,以便理清資訊政策所涉及的各種複雜關係。資訊政策問題分為經濟問題和法律問題。
4.政策內容
國家資訊政策內容簡化成經濟的和法律的兩個層面加以研究。 ⑴經濟層面:宏觀產業發展經濟問題;微觀市場經濟問題。 ⑵法律層面:智慧財產權保護;資訊自由流通與資訊安全。
5.政策形式
政策形式指政策內容的外在表現形式,是宣傳、執行政策的有效工具、合法依據。資訊政策的形式是指國家製定並發布執行的有關資訊政策內容的文件、指南,或規定。在建設社會主義法治國家的背景下,應將國家資訊政策轉變為具體的、可操作的法律法規,進行有效的貫徹和實施。
(三)國內外資訊政策概述
二、資訊法律
(一)資訊法律的基本問題
1.資訊法律的涵義
資訊法律:是指在調整資訊活動中產生的社會關係的法律規範的總稱。這裡的社會關係主要涉及利益、權益與安全問題,這些法律規範涉及資訊系統、處理資訊的組織和對資訊負有責任的個人等。資訊法律的主要內容包括智慧財產權法,資訊安全法,資訊公開法,新聞出版與傳播法,電信法,電子商務法,有關電腦犯罪的法律等。
2.資訊法律的作用
⑴資訊法律的規範作用 (依規範作用的對像不同)
①指引作用:是指對訊息主體的行為所扮演的導向、引路的角色。其物件是資訊主體自己的行為。
②評價作用:是指資訊法律作為資訊主體對他人的行為的評價標準所扮演的角色。其作用對像是他人的行為。
③預測作用:是指資訊主體根據資訊法律的規定,可以預先估計人們相互間怎樣行為以及行為的後果等,從而對自身的行為做出合理的安排。對像是人們之間的相互行為。
④強製作用:它主要體現在對資訊違法行為以及犯罪行為的嚇阻、懲罰和預防。
⑵資訊法律的社會作用
①保護和促進科學技術進步:建立和完善資訊法律的目的之一在於透過確認技術規範,維護技術發明者的利益,保護和促進資訊科技進步,使其更能更造福人類。
②保護國家利益和社會公共利益:這種保護作用在保護各資訊主體的資訊權力方面,同保障基本人權在根本上是一致的,它是充分保護資訊權利的必然要求。
③及時妥善解決資訊化所產生的各種矛盾:在資訊化社會,人們將要面臨資訊社會必然產生的效率與公平,資訊相對不足或過度過濫、資訊品質低劣或資訊虛假。資訊的營利性和社會公益性之間的矛盾。這些矛盾的解決,離不開資訊法律的社會規範作用。
④促進資訊產業的發展與社會資訊化過程:資訊法律適應了資訊社會的發展特徵與技術特徵,彌補了傳統法律規範的不足。它不僅可以為經濟效率,效益的提升提供保障,還能保護新的社會關係、新的生產力。客觀上促進了資訊產業的發展壯大。同時,有效規範和調整新的資訊社會矛盾,為資訊化發展排除障礙。
⑤推動經濟與社會的良性運作和協調發展:這是資訊法律在發揮上述作用的基礎上,間接產生的更深層次的影響,並且這種影響體現了資訊法律的終極目標。
⑶資訊法律的調整對象
資訊法律的調整對像是資訊關係,指在實現資訊過程時所產生的社會關係。它包含兩個面向:一方面是圍繞資訊的生產,傳播,收集,處理,存儲,應用,交換,消費等資訊活動所產生的社會關係。另一方面是圍繞著資訊科技發展所產生的一系列新型態的社會關係和社會問題。
資訊法律關係:是指資訊法律在調整人們的資訊活動過程中所形成的權利、義務關係。資訊法律關係的構成要素主要包括:主體、客體、內容三個面向。
⑷資訊化對社會帶來的矛盾衝突
①資訊自由與資訊安全的矛盾
資訊自由權是公民的重要權利,公民依法可以自由地收集,加工,處理,傳播,儲存和利用資訊。電腦網路的發展為人們享有更廣泛的言論自由提供了廣闊的空間和方便條件,然而資訊自由並非是絕對自由和濫用資訊。在現代資訊科技所構成的網路結構中,資訊系統的安全性正受到嚴重威脅,其脆弱性不單單是一個技術問題,同時也是一個法律規則問題。
②資訊不足與資訊過濫的矛盾
人類社會的資訊流動呈現出不均衡性。一方面,不能充分滿足人們對資訊獲取的需求;另一方面還存在資訊過剩問題。資訊過濫現像是指在當今資訊爆炸的時代,在浩瀚的訊息面前魚目混珠,真偽難辨。當真實的精確的資訊和失真的模糊的資訊混雜在一起時,相對資訊量反而減少了,於是資訊過剩反而帶來新的資訊匱乏。
③資訊的社會公益性與個體獲利性的矛盾
資訊的社會公益性要求它廣泛、無償和公開地提供給社會公眾利用,這就與資訊所有者的經濟利益產生了矛盾。效率與公平之間的矛盾表現為個人利益和社會利益之間的矛盾,資訊的社會共享與個體盈利之間的矛盾,只有通過法律手段來加以協調解決,兼顧效率與公平兩個方面。
④資訊保密與資訊公開的矛盾
在社會化過程中,一方面應對保密的資訊進行有效的保護,另一方面應該對需要公開的進行充分公開。資訊保密和公開之間如果缺乏應有的協調,就會使應公開的資訊無法公開,應當保密的資訊不能有效地加以保護。尤其是政府資訊和社會公益資訊更需要用法律規範來促使其在充分公開的同時又不損害國家利益。
⑤資訊商品流通過程中的矛盾
資訊商品在流通過程中存在著許多矛盾。不僅存在資訊商品的擁有者,生產者,傳播者的資訊權的問題,也存在著資訊商品在資訊活動主體之間交易轉讓時的所有權和許可使用權等財產權益糾紛,同時各個資訊商品主體的個人利益與社會利益的衝突也相當突出。目前資訊市場也缺乏完善有效的管理規範和運作機制,迫切要求制定相應的法律來解決這個問題。
(二)資訊法律與資訊政策的關係
1.資訊法律與資訊政策的區別
⑴兩者制定的機關和程序不同。
①資訊法律是由國家專門的立法機關及全國人民代表大會及常務委員會,或擁有造法權能的機關如國務院及其各部會等依法律程序創制的,其立法權限和創製程序具有嚴格而複雜的規定。
②資訊政策的製定則出於多門,程序也顯得不很嚴格,我國的資訊政策是依部門、劃領域制定的。
⑵兩者的表現形式不同。
①資訊法律通常採用制定法的形式,主要有民法通則,一些單行法律,如《著作法》《專利法》《商標法》《反不正當競爭法》和一些單行法規。
②資訊政策則常以國家機關制定和頒布的決議,決定,命令,規則,規定,意見以及通知,會議紀要等形式出現。
⑶兩者調整的範圍、方式不同。
①從範圍上看,資訊政策所調整的社會關係要比資訊法律廣泛的多;而資訊法律所調整則往往是那些在資訊活動中對國家社會有較大影響的社會關係領域。
②從方式來看,資訊法律一般調整較為穩定的社會關係,所以他偏重對既有的社會關係的確認,保護或控制;而資訊政策是應對的手段,它不僅要處理既有的問題,而且要對正在形成或將要出現的問題做反應,因此它偏重採用靈活多樣的措施,以適應社會局勢不斷發展的需要。
⑷兩者的穩定程度不同。
①資訊政策作為社會資訊活動的指導原則,往往是宏觀的方針性號召,在政策執行中允許有彈性,而且隨著資訊環境的變化,要不斷的修正,補充和完善,由於動態性較大,因此時效性較短。
②資訊法律一般是在資訊政策長期實施以後取得一定經驗的基礎上確定下來的比較具體的行為規範,時效較長,而且它的製定,修改或廢除都要經過嚴格複雜的法定程序,就相當的穩定性。
⑸兩者的本質屬性和功能不同。
①資訊政策則代表的是政治組織的利益和意義,不具備強制力的屬性;而資訊法律代表的是國家的利益和意志,具有強制力的屬性。
②從功能上講,資訊政策的基本功能是“導向”,即運用行政手段,鼓勵和支持社會資訊活動以達成資訊政策的目標;而資訊法律的基本功能是“制約”,即運用法律手段限制和約束社會資訊行為,以保護資訊環境的健康發展。
2.資訊政策與資訊法律的聯繫
⑴資訊政策對資訊立法有指導作用。
資訊政策對一切社會資訊活動進行指導,資訊立法作為社會資訊活動的重要組成部分,也離不開資訊政策的指導。同時資訊政策又是資訊法律制定的依據。
⑵資訊政策需要依靠資訊法律貫徹實施。
資訊法律是實現國家和執政黨資訊政策最為重要的手段,資訊法律具有強制性,而資訊政策則不具備此屬性,因此如果沒有資訊法律的體現和貫徹,僅依靠資訊政策本身的力量和自由,往往達不到它所要達到的經濟,政治目的。
(三)資訊法律體系
資訊法律體系:是指資訊法律的結構及分類,也就是資訊法律包括哪些法律制度,即國家製定的調整資訊的獲取,加工處理,傳播,使用,轉讓等資訊活動過程以及資訊科技活動領域中所產生的各種利益問題和安全問題的全部法律規範。
1.資訊基本法
該法主要是對資訊立法的宗旨,原則,調整對象和範圍,信息,法律關係的主體和客體等作出規定。
2.資訊法律制度與法律規範
資訊科技法律制度、資訊資源管理法律制度、資訊產權法律制度、資訊產業管理法律制度、資訊市場管理法律制度、資訊機構組織管理法律制度、資訊安全、保密與資訊犯罪法律制度、資訊人才法律制度、國際資訊合作與交流法律制度。
(四)資訊法律的立法模式
1.專門立法模式
有些國家根據實際情況,先從某些領域入手,透過專門的立法,構築用以調整該領域內資訊化發展的新的法律規範體系。
2.修改適用模式
許多資訊科技相對落後,資訊化程度相對欠發達的發展中國家都主要應用這種立法模式,他們基本上只對已經存在的相對完整且普遍適用的傳統法律部門中的主幹法律作出補充性修改,一般不另外專門單獨立法。
3.謹慎暫緩模式
由於國家的資訊化發展整體上正處於在快速發展的過程中,有許多具體問題還需要研究、探索和試驗。許多國家目前主要採取「謹慎」的態度,暫緩立法,而主要依靠政府的政策導向推動國家資訊化的自由發展。
三、資訊政策與資訊法律的製定原則
1.務實性原則
制定國家資訊政策與法律必須從國情出發,實事求是,與社會資訊化的現況與實際發展水準一致。
2.協調性原則
①國家原有的政策法律與新制定的政策法律相互協調與配合。
②在國家資訊政策法律內部,無論是縱向上或橫向上的資訊政策法律之間相互都能夠取得協調,達成一致。
③資訊政策法律既要與憲法相協調,即合憲,同時又要能夠相互與經濟,政治,科技,文化,軍事等其他領域部門的政策,法律相互協調。
④做到盡量與國際慣例接軌,即做好與國際資訊信策法律的協調工作。
3.均衡性原則
人類所處的資訊環境存在著四大基本矛盾:①資訊自由與資訊保密;②資訊不足與資訊過濫;③資訊公開與資訊安全;④資訊的社會共享性(資訊分享)與資訊的私人佔有性(資訊獨佔)之間的矛盾。
國家在製定資訊政策與法律時必須要正視並解決好這一問題,要充分體現均衡性原則,注意對矛盾雙方的利益的協調,找到雙方都能夠接受的一個利益平衡點,即使雙方最終達到均衡狀態。
4.經濟性原則
從經濟原則出發,在製定資訊政策、法律時,要使整個制定成本小於社會從它所獲得的利益。
另一方面,國家資訊政策法律本身也應該具有經濟功能,即能夠起到降低交易費用,提高經濟效益,提供激勵機制,減少不確定性,將外部性予以內部化以及促成合作等經濟作用。
5.彈性原則
該原則要求國家資訊政策法律不僅是作為當前已經存在的資訊活動的總結、概括和提煉,還要具有導向、預示的功能,能夠對資訊科技的前沿發展和資訊社會日新月異的變化趨向有所預見,以便當前已有的國家資訊政策法律能夠根據環境的變化和時代的發展而及時進行補充和修改。
6.全面性原則
①在數量上,所製定的資訊法律遠遠不能滿足資訊社會日益增長的法律需求;②在品質上,法律內容較為寬泛,條文不精細,可操作性較差,嚴重影響了法律的效力於司法效率。因此在國家資訊政策與法律制定過程中必須積極實施並認真貫徹全面性的原則,從而建構出系統性全面的資訊政策法律體系。
7.動態性原則
由於資訊政策一般是在一定的歷史時期內發揮作用,具有階段性,靈活性和可變的特徵;而資訊法律是由成熟的政策轉換而來的,具有較強的穩定性。因此相對於資訊法律而言,動態性的製定原則在國家資訊政策的製定上所表現的尤為明顯。
8.重點性原則
在製定國家資訊政策法律時,應該集中力量去解決所面臨的眾多問題中的要害問題與關鍵問題。從空間角度來看,既要實施全面性原則,各方面均要涉及,同時也要明確方向,重點突出,優先考慮當前當前需要迫切制定政策和進行立法的領域。從時間角度來講,則是在不同的發展時期要有不同的重點。
四、網路環境下的資訊政策與法律
(一)網路資訊政策
1.網路資訊政策的涵義及產生背景
網路資訊政策:是國家資訊政策的有機組成部分,是針對網路的特殊性而製定的有關規範、管理和發展網路資訊活動的行為準則和指南。
2.網路資訊政策的內容框架
資訊網路系統的建置與發展政策、資訊網路資源政策、網路資訊產業政策、網路資訊市場政策。
(二)網路環境下的資訊法律
網路智慧財產權、電子商務、網路隱私、網路資訊安全、人工智慧法律問題