建立華文教育及中華文化大門網站之研究
  
肆、華文網路教育大門網站功能規畫及
分類與檢索架構
  
 

一、大門網站五大服務功能規畫

  全球華網路教育大門網站在定位上應具有資訊中心、目錄服務、社群中心及僑社服務中心的角色,因此在網站功能及服務規畫上應包含:1.華文網路資源目錄服務功能;2.華文網路教育內容(Content)服務;3.全球華文網路教育虛擬社群;4.全球華人網路社區;5.個人化網站服務等五大項大門網站服務功能,而在資訊內容或服務內涵的選擇上,則以華文教育、中華文化、華人社區動態等為主軸,整合成一個凝聚全球華人、僑胞的網路生活及教育中心。以下分別從網站功能及內容規畫兩個方向來說明大門網站的服務功能:

(一)華文網路資源目錄服務:

  1. 服務功能概述:提供有關中華文化、華文網路教育及華人社群的搜尋引擎及分類檢索服務,是大門網站的核心服務。搜尋及分類索引的向標的,包括相關網站、相關網頁、相關新聞、大門網站的內容服務以及非數位化的資料索引。
  2. 網頁配置:目錄服務網頁包括階層式分類目錄網頁、關鍵字查詢介面、說明導覽網頁、推荐網站介紹、網路資源索引摘列表等。
  3. 內容格式:網路資源索引的資料內容欄位包括:URL、網站或網頁名稱、分類路徑、內容摘要、評析介紹及網站評鑑分級等資料。

(二)華文網站教育內容服務:

  1. 服務功能概述:由大門網站整合自有或策略合作夥伴且有關中華文化、華文教育等之Content,經由大門網站的單一介面提供深入的內容服務。內容服務各分類項目在與目錄服務整合,由目錄服務可指向本網站的相關內容分類。
  2. 網頁配置:包括內容服務整合性首頁及各分項內容網頁群,包括:華文教育、中華文化、親子教育、華文育樂內容、專業教育、生活資訊等大項,每項再有細分類。內容服務之分類及網頁連結採多維度分類架構,其度包括:資訊內容分類、地區、語言、呈現媒體及使用者等構成多維度的交叉檢索及資訊組合與導引機制。
  3. 內容格式:依原始資料內容採不同資料呈現格式,包括互動式線上教學、靜態網頁、影音多媒體等多樣化的表現方式。

(三)全球華文網路教育虛擬社群:

  1. 服務功能概述:華文網路教育虛擬社群以華文教育及全球中文學校為 主題,提供包括論壇、佈告欄、電子郵遞頻道、電子報及Internet等互動式的網路社區,兼具資訊交換、共享、即時溝通及人群凝眾的效果。
  2. 網頁配置:以華文教學為主軸,建置下列網頁頻道群,包括:中文教學論壇、華文教材上傳及下載服務、全球僑校佈告欄、華文教育及中華文化分類頻道、全球華文育電子報、華文教育資源登錄服務等。

(四)全球華人網路社區:

  1. 服務功能概述:以華人社區生活、流行及新聞訊息主題,建立流行生活論壇、社區頻道、新聞播送、生活頻道等互動式社區服務。頻道的經營採開放式,大門網站提供頻道介面、建置工具、信件轉遞、頻送分導引、管理及Hosting服務,內容的經營開放給僑社的interest group來推動。頻道及論壇資訊與目錄服務的索引整合,可作交互連結及指向。為帶動頻道的資訊品質及人潮,大門網站可開放一些頻道群與專業媒體或公益團體合作,由其提供豐富的生活,流行資訊或內容。
  2. 網站配置:規畫的網頁群包括:華人流行網、華人生活網及華人新聞網等生活道,其下依頻道內容性質及類量作階層式分類。僑社社區的建立則提供依地區分類的華僑社區頻道,提供地區性僑社的訊息交換及社團活動。以上所有頻道並整合成不同的電子報,配合個人化網路服務,作直接推播遞送服務。

(五)個人化網站服務

  1. 服務功能概述:大門網站的最終功能是提供使用者一對一的資訊整合服務,而實現這項目標的網站功能實作即為個人化的資訊整合服務。包括個人化首頁及電子報兩大類。個人化首頁,提供使用者設定目錄服務的分類選項、新聞類別、地區性選項;資訊內容服務的語言、地區、內容種類;各種頻道訂閱、首頁格式設定等。個人化電子報包括華文教育、生活頻道及新聞電子報訂閱;目錄服務的編輯推薦,內容服務的新知通報等。
  2. 網站配置:個人化網站服務主要整合、配置依使用者觀點的其化服務功能及資訊內容配置,其網頁配置包括:個人化首頁、會員登錄服務、身份稽核、會員資料管理、個人化網頁設定及FAQ等輔助、管理性網頁。

二、華文網路教育大門網站之內容與分類架構

(一)內容架構

華文網路教育中心在內容規畫上可分為四大類型,茲分別說明其資訊內容積(Content)之架構:

  1. 目錄索引:為大門網站的查詢內容,其組織架構從上到下可由不同層次來描述。最上層為使用者概念層,中間為資料連結層,最下層則為資料建置層。使用者概念層從應用的觀點、編輯、收集、分類並呈現華文網路教育資源索引,配合大門網站專注於華文教學、中華文化傳僠及聯結僑社的精神,收集相關內容。大門網站對前述相關內容的架構規畫,包括依使用者觀點,以應用為導向的首頁分類組合,很清楚的傳達不同使用者標的資訊的所在。在此部份的分類包括:
  2. (1)華文教學範疇的華文教材、教學工具及輔助資源、華語教學機構、線上教學、僑校連結以及華文教學論壇。

    (2)中華文化範疇的中華文化、中華美食及旅遊等。

    (3)僑社社群範疇的華僑團體、華文媒體及華商資訊等涵蓋社區、新聞及商務的溝通及凝眾。

    在內容呈現上,包括分類名稱的呈現外,也提供對各項分類主題作說明的快捷連結摘要。

      其次從資料連結層的觀點來看,其架構包括對於搜尋資料的交互連結及資料對映方式,依此觀點,目錄索引的Content架構包括多維度的資料分類目錄,其維度包括資訊屬性、應用領域、地區別、語言別等,方便使用者從不同資料類連結到相關分類領域,符合各種應用視角;此外再利用資料對映表的機制,將類似領域資料分類互相複製整合成單元,讓同一份資料可從不同路徑查到,以提高資料搜尋的彈性、方便性及主導性。

      最後,從資料建置層來討論Content架構,即在於定義其文件儲存欄位及網頁內容欄位,以目錄索引而言,其文件內容包括下列欄位:網站或網頁主題,DRL或連結位址、摘要說明、網站評介、關鍵字集、分類索引碼、分類路徑等。

  3. 華文教學及中華文化Content:與目錄服務不同的是這部份提供實際的Content服務,讓大門網站不只是入口,也是一站購足的目標站台。在Content的分類上,「包括華語教學資料庫、中華文化資料庫及較技藝教學二大類。」
  4. (1)華語教學資料庫:包括華語教材、華語會話、華語學習工具、輔助教材、線上教學、測驗及評量等內容,其內容表現方式包括影音、文字及多媒體等。

    (2)中華文化資料庫:由於涵養範圍廣,因此應以僑教需求為主軸,包括配合華文教學的文化素材,對傳統文化源流的認識及代華人社會的文化主題等三大類。在內容的深度上,應初期應是位在通俗的內容,未來再增加至學術資源的交換中心角色。關於華文教學的文化素材,其Content分類包括中國文學賞析、棧近漢學、中華文字、語文故事,乃至於中華歷史等。在傳統文化源流認識的Content分類包括:中華民俗如童玩、節慶、戲曲等,傳統藝術文化如樂器、藝術、服飾、金石、手工藝等、歷史掌故、風土人情、中華飲食等。最後,關於現代華人生活文化包括:地區方言、飲食、旅遊、社會結構、習俗及流行主題等,在現代華人生活文化的資料編輯應採動態式作法,隨時配合華人地區的趨勢,提供主題式地區編輯。

  5. 虛擬社群Content:虛擬社群是溝通(communication)及內容的複合物,它提供群組凝聚的機制,建立不同的專屬頻道或討論群組,而參與頻道的成員則互相交換Content,換言之,這是一種互動且雙向的Content建置。華文網路教育中心大門網站的資訊內容可以分為兩大架構,即華文教學社群及華僑社區社群。
  6. (1)華文教學社群,其內容架構是可延伸的,初期定義的分類包括華文教學論壇、華文教材交換、華語文評量、華文教學資源探索、僑校動態資訊等。

    (2)華僑社群內容:分為社區、生活及新聞三個主分類,在社區分類項下包括地區頻道的建立,依州、縣等小地區分類並往上組成大區域性成語言制分類,社團的建立也是社區分類項的另一頻道族群。在生活分類項下則範圍廣泛,包括流行話題、小眾團體等其分類方式採動態延伸方式,從初期的簡單分類架構下,延伸出各種不同的華人生活及流行頻道。在新聞分類項下,包括地區性、商業性、政治性、文化性等向度的分類,並成立各種新聞組合,配合個人化網站建置成不同的新聞頻道。

  7. 服務性內容、內容架構又可分為兩大系列,即網站服務及一般服務。
  8. (1)網站服務:其資訊內容依大類可分為網站導覽、FAQ、個人化網站等,其中個人化網站內容包括個人化的資訊平台設定,從目錄的選樣、資訊資料庫的分類選樣到地區、語言及各種社群頻道的設定或加入,而組成個人化的資訊組成。

    (2)一般服務:提供即時、切身的僑胞服務資訊,其資訊分類包括出入境申辦、僑校查詢、相關法規等政府服務資訊。

(二)分類及檢索機制

  1. 分類機制
  2. (1)多維度分類架構:依多種向度建立資料、屬性參考值,向度選擇依資料種類而異,可能的向度包括地區、語言、專業分類、應用領域、人物、事件、時間等,其中專業分類包括華文教學專業分類、文化藝術專業分類、人文社會專業分類等,而應用領域則有異前者的知識分類,改以使用者觀點的實用分類屬性,以華文教學為例,使用者觀點的屬性可能包括兒童華語、旅遊華語、商務華語等。多維度分類架構的概念,是確認同一份資料內容,必然包括多種維度屬性標籤,而對同一種屬性來說,同一份資料也應容許有一種以上的值,其原因主要是資料實體與屬性區分往往不是一對一的。從前對資料分類的本質所對應的實作如下:資料屬性組成階層式(Hierarchical)資料分類表的節點(Node),而資料屬性值則決定資料在分類表末端(Leaf)的位置和搜尋路徑。所謂多維度分類架構即意謂著資料在分類表中的位置並非唯一,但也非各自分立,而是有一定的關聯系數。

    利用多維度分類架構的優點很多,例如:它具有方便性,讓使用者容易從相關分類中跳躍式交叉查詢;它也有徹底性(Exhaustiveness),確保從各種不同路徑進入的使用者不會漏失最重要的資料。此外,資料分類表及資料歸類的管理機制,變得極富彈性。

    (2)分類表映射(Mapping)機制:多維度分類架構其實讓分類管理帶來挑戰性,因為一來它與資料庫管理概念中避免重覆儲存(Redundancy)的原則有矛盾的可能;另外,動態的資料變動反應用環境改變,也很難保持一個很能動態調適分類表。要解決這種矛盾,其關鍵在於資料儲存的分類索引與動態的多維分類目錄獨立開來,一方面可持資料庫管理的整合性(Integrity),但另一方面又可建置符合使用者觀點的多維分類目錄。但如何結合這兩個分別獨立的分類表呢?其核心就在於映射機制,從簡單的資料庫分類表將資料對映到複雜的分類目錄。由於分類目錄的各種向度並非無關連性,因此,不難建立一些對映規則,而整個資料映射及查詢或歸類則可以引進RuleBased的自動化或半自動化資料管理技術。

    (3)人工智慧歸類機制:隨著大門網站資料量的指數型快速成長,其對分類表的管理並不致造成太大的負荷,但對龐大的資料歸類(Categorization)則是很嚴苛的挑戰。大門網站可採人工智慧技術如資料叢集(Clustering)或類神經網路將資料作前置處理。前者可自動找到相關分類,精確度可依相關係數半徑的設定作參數化微調;而後者則具有學習機制,從少量資料漸次擴大到大量資料,提昇其歸類的正確性。利用前一節所述映射機制所支援的簡化分類架構,正可提高自動化人工智慧歸類的準確性。

    (4)自主性(autonomous)分類機制:分類目錄的編輯應是動態且多元的,所需要的都是domain specie knowledge - Based的工作,以大門網站自有的維護人力,絕不可能作得完美快速。因此,在目錄服務及社群頻道的目錄管理上,應引進登錄及編輯機制由有興趣的團體提供其編輯式頻道開闢建議。

  3. 檢索機制:
  4. (1)全文檢索機制:對於網頁索引資料的檢索,最基本的功能即為全文檢索,使用者輸入關鍵字後,搜尋引擎依斷字詞及語句分析進行比對,並依門檻值的訂定提供搜尋比對結果。全文檢索將應用於新聞查詢、網頁搜尋及Content資料庫查詢。

    (2)快取查詢機制:無論欄位搜尋式全文檢索,直接掃瞄資料庫將大輻降低系統效能,尤其大門網站資料成長快速,對於搜尋結果應建立快取,而系統也定期對資料庫作預取(gather)程序,將搜尋結果建立成索引庫,實際查詢時,由索引庫回應使用者動態查詢,再指向實際資料庫。至於快取,則儲存常被搜尋之查詢結果,系統經由中間層的快取資料即可快速回應使用者查詢需求。

    (3)多元資料同步檢索機制:大門網站應將各種資料內容作有效的整合,提供使用者多元化的資訊需求服務。而這種資訊整合應與查詢機制結合,讓使用者經一次查詢可同步檢索出網路資源索引、華文網路教育中心資訊內容(Content)服務、新聞資訊、網頁及網站資訊以及頻道資訊,而在這些資訊的交換僅需作按鍵點即刻可列出資訊內容來,不需後端系統作多次重覆檢索。其優點包括提昇使用者滿意度、方便性及資料豐富性,加速系統檢索效能,減低系統負荷等。

    (4)自然語言欄位搜尋機制:大門網站應採用日趨成熟的XML文件標示格式,依資料內容種類定義文件語意格式,則搜尋引擎對於非結構化的網頁資料可以作副資料庫欄位搜尋的精確度及效率。除此之外,由於文件語意結構清楚,每一欄位的字串或數值有準確的屬性,則使者用自然語言描述的查詢要求,可以被系統工作更準確的解讀,達到參數或條件比對的效果。

    (5)自動學習的智慧型搜尋機制:搜尋引擎的設計將可採用人工智慧方法作半自動的使用者關鍵字與學習功能,記憶使用者輸入過的關鍵字,逐步調整或解譯對於關鍵字的判讀,增加容錯、相關字、同義字等的辨認及解析能力。

(三)華語文教育資源之分類架構規畫範例

1.文教機構分類架構







教育事務
文化事務
僑教服務
新聞傳播事務
外交領事服務
研究機構
文化中心



華文教學系所
華文教學研究機構
語言學研究機構
中華文字研究機構
漢學研究機構
中華藝術文化研究
其他相關研究機構



北美地區
東南亞地區
東北亞地區
歐洲地區
中南美地區
台灣
其他地區



華文教學研究學會
語言學研究學會
漢學研究學會
教育研究學會
中華藝術文化學會
宗教哲學學會
其他相關學會
協基
會金
、會
文化交流基金會
華語教學推廣
僑教服務



華語教學中心(中文)
華語教學中心
(英文/其他語文)
華語評量測驗中心
華語線上教學中心
其他相關教學機構



文化中心
社教及終身教育
藝術展示及表演
函授及遠距教學



圖書館
博物館
中文資料庫
華文教材
字典及其他工具
中文軟體資源
相關圖書出版機構

 

2.課程與教材分類架構








聽力課程
線上聽力教學
聽力教材及輔助工具
方言教學
聽力測驗



初級會話課程
進階會話課程
幼兒會話課程
商業會話課程
旅遊會話課程
線上會話課程
華語會話測驗




初級會話課程
進階讀寫課程
華語讀本教材
華文寫作教學
中國文學導讀
華文媒體閱讀
漢學

漢字解析及研究
漢字書寫教學
中華書法

華語聽力教材
華語會話教材
華文讀寫教材
華語雙語教材
漢字書寫教材
華期
文刊

僑教雙週刊
華文教育新聞
華文教育電子報
其他華文教育報導
雙教
語材


華語聽力雙語教學
華語會話雙語教學
華文讀寫雙語教學
其他雙語課程與教材
中華文化雙語導覽





幼兒華語教學研究
幼兒聽力
幼兒會話
幼兒讀寫
幼兒漢字書寫
華語兒童網站
認識中華文化
其他幼兒華語教材





初級華語聽力
初級華語會話
初級華語讀寫
初級華語教材





進階華語聽力
進階華語會話
進階華語讀寫
進階華語教材
華與
語評
測量
華語測驗及機構
線上華語測驗與評量
華語測驗與評量教材



中國詩詞
小說散文
當代華文文學
作家
線上中國文學評賞
線上華文作品發表
華文文藝雜誌





中華歷史
中華地理及人文
中華藝術文物
中華民俗及社會
中華飲食
漢學研究




華文文法教學與研究
華語語音研究
華文字形研究
華語翻譯教學與研究
華文語言學研究機構
華文語言學出版品
華資
文源



圖書館
博物館
中文資料庫
中文軟體
字典及其他工具
華語教學相關活動

3.師大華語文教學研究所之分類架構

師大華語文教學研究所網站中的「台灣華語文網路資源」,以網站的內容性質作為分類的依據,將國內外網站大略分為第一層六大類,以及第二層十五類:

■教學資源Teaching Resources

  • 語言學
  • 文化藝術
  • 綜合中文訊息

■線上教學課程On-line Class

  • 華語文教學
  • 其他遠距教學

■網路服務Network Service

  • 搜尋引擎
  • 中文資料庫
  • 線上系統
  • 線上辭典
  • 圖書資訊
  • 大眾傳播

■機構Institution

  • 政府單位
  • 教學與研究單位

■中文資訊處理Chinese Information Processing

  • 中文處理軟體
  • 中文輸入法