| 建立華文教育及中華文化大門網站之研究 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 肆、華文網路教育大門網站功能規畫及 分類與檢索架構 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
一、大門網站五大服務功能規畫 全球華網路教育大門網站在定位上應具有資訊中心、目錄服務、社群中心及僑社服務中心的角色,因此在網站功能及服務規畫上應包含: 1.華文網路資源目錄服務功能;2.華文網路教育內容(Content)服務;3.全球華文網路教育虛擬社群;4.全球華人網路社區;5.個人化網站服務等五大項大門網站服務功能,而在資訊內容或服務內涵的選擇上,則以華文教育、中華文化、華人社區動態等為主軸,整合成一個凝聚全球華人、僑胞的網路生活及教育中心。以下分別從網站功能及內容規畫兩個方向來說明大門網站的服務功能:(一)華文網路資源目錄服務: (二)華文網站教育內容服務: (三)全球華文網路教育虛擬社群: (四)全球華人網路社區: (五)個人化網站服務 二、華文網路教育大門網站之內容與分類架構 (一)內容架構 華文網路教育中心在內容規畫上可分為四大類型,茲分別說明其資訊內容積 (Content)之架構:
(1)華文教學範疇的華文教材、教學工具及輔助資源、華語教學機構、線上教學、僑校連結以及華文教學論壇。 (2)中華文化範疇的中華文化、中華美食及旅遊等。 (3)僑社社群範疇的華僑團體、華文媒體及華商資訊等涵蓋社區、新聞及商務的溝通及凝眾。 在內容呈現上,包括分類名稱的呈現外,也提供對各項分類主題作說明的快捷連結摘要。 其次從資料連結層的觀點來看,其架構包括對於搜尋資料的交互連結及資料對映方式,依此觀點,目錄索引的Content架構包括多維度的資料分類目錄,其維度包括資訊屬性、應用領域、地區別、語言別等,方便使用者從不同資料類連結到相關分類領域,符合各種應用視角;此外再利用資料對映表的機制,將類似領域資料分類互相複製整合成單元,讓同一份資料可從不同路徑查到,以提高資料搜尋的彈性、方便性及主導性。 最後,從資料建置層來討論Content架構,即在於定義其文件儲存欄位及網頁內容欄位,以目錄索引而言,其文件內容包括下列欄位:網站或網頁主題,DRL或連結位址、摘要說明、網站評介、關鍵字集、分類索引碼、分類路徑等。 (1)華語教學資料庫:包括華語教材、華語會話、華語學習工具、輔助教材、線上教學、測驗及評量等內容,其內容表現方式包括影音、文字及多媒體等。 (2)中華文化資料庫:由於涵養範圍廣,因此應以僑教需求為主軸,包括配合華文教學的文化素材,對傳統文化源流的認識及代華人社會的文化主題等三大類。在內容的深度上,應初期應是位在通俗的內容,未來再增加至學術資源的交換中心角色。關於華文教學的文化素材,其 (1)華文教學社群,其內容架構是可延伸的,初期定義的分類包括華文教學論壇、華文教材交換、華語文評量、華文教學資源探索、僑校動態資訊等。 (2)華僑社群內容:分為社區、生活及新聞三個主分類,在社區分類項下包括地區頻道的建立,依州、縣等小地區分類並往上組成大區域性成語言制分類,社團的建立也是社區分類項的另一頻道族群。在生活分類項下則範圍廣泛,包括流行話題、小眾團體等其分類方式採動態延伸方式,從初期的簡單分類架構下,延伸出各種不同的華人生活及流行頻道。在新聞分類項下,包括地區性、商業性、政治性、文化性等向度的分類,並成立各種新聞組合,配合個人化網站建置成不同的新聞頻道。 (1)網站服務:其資訊內容依大類可分為網站導覽、 FAQ、個人化網站等,其中個人化網站內容包括個人化的資訊平台設定,從目錄的選樣、資訊資料庫的分類選樣到地區、語言及各種社群頻道的設定或加入,而組成個人化的資訊組成。(2)一般服務:提供即時、切身的僑胞服務資訊,其資訊分類包括出入境申辦、僑校查詢、相關法規等政府服務資訊。 (二)分類及檢索機制 (1)多維度分類架構:依多種向度建立資料、屬性參考值,向度選擇依資料種類而異,可能的向度包括地區、語言、專業分類、應用領域、人物、事件、時間等,其中專業分類包括華文教學專業分類、文化藝術專業分類、人文社會專業分類等,而應用領域則有異前者的知識分類,改以使用者觀點的實用分類屬性,以華文教學為例,使用者觀點的屬性可能包括兒童華語、旅遊華語、商務華語等。多維度分類架構的概念,是確認同一份資料內容,必然包括多種維度屬性標籤,而對同一種屬性來說,同一份資料也應容許有一種以上的值,其原因主要是資料實體與屬性區分往往不是一對一的。從前對資料分類的本質所對應的實作如下:資料屬性組成階層式( Hierarchical)資料分類表的節點(Node),而資料屬性值則決定資料在分類表末端(Leaf)的位置和搜尋路徑。所謂多維度分類架構即意謂著資料在分類表中的位置並非唯一,但也非各自分立,而是有一定的關聯系數。利用多維度分類架構的優點很多,例如:它具有方便性,讓使用者容易從相關分類中跳躍式交叉查詢;它也有徹底性( Exhaustiveness),確保從各種不同路徑進入的使用者不會漏失最重要的資料。此外,資料分類表及資料歸類的管理機制,變得極富彈性。(2)分類表映射( Mapping)機制:多維度分類架構其實讓分類管理帶來挑戰性,因為一來它與資料庫管理概念中避免重覆儲存(Redundancy)的原則有矛盾的可能;另外,動態的資料變動反應用環境改變,也很難保持一個很能動態調適分類表。要解決這種矛盾,其關鍵在於資料儲存的分類索引與動態的多維分類目錄獨立開來,一方面可持資料庫管理的整合性(Integrity),但另一方面又可建置符合使用者觀點的多維分類目錄。但如何結合這兩個分別獨立的分類表呢?其核心就在於映射機制,從簡單的資料庫分類表將資料對映到複雜的分類目錄。由於分類目錄的各種向度並非無關連性,因此,不難建立一些對映規則,而整個資料映射及查詢或歸類則可以引進Rule、Based的自動化或半自動化資料管理技術。(3)人工智慧歸類機制:隨著大門網站資料量的指數型快速成長,其對分類表的管理並不致造成太大的負荷,但對龐大的資料歸類( Categorization)則是很嚴苛的挑戰。大門網站可採人工智慧技術如資料叢集(Clustering)或類神經網路將資料作前置處理。前者可自動找到相關分類,精確度可依相關係數半徑的設定作參數化微調;而後者則具有學習機制,從少量資料漸次擴大到大量資料,提昇其歸類的正確性。利用前一節所述映射機制所支援的簡化分類架構,正可提高自動化人工智慧歸類的準確性。(4)自主性( autonomous)分類機制:分類目錄的編輯應是動態且多元的,所需要的都是domain specie 且knowledge - Based的工作,以大門網站自有的維護人力,絕不可能作得完美快速。因此,在目錄服務及社群頻道的目錄管理上,應引進登錄及編輯機制由有興趣的團體提供其編輯式頻道開闢建議。(1)全文檢索機制:對於網頁索引資料的檢索,最基本的功能即為全文檢索,使用者輸入關鍵字後,搜尋引擎依斷字詞及語句分析進行比對,並依門檻值的訂定提供搜尋比對結果。全文檢索將應用於新聞查詢、網頁搜尋及 Content資料庫查詢。(2)快取查詢機制:無論欄位搜尋式全文檢索,直接掃瞄資料庫將大輻降低系統效能,尤其大門網站資料成長快速,對於搜尋結果應建立快取,而系統也定期對資料庫作預取 (gather)程序,將搜尋結果建立成索引庫,實際查詢時,由索引庫回應使用者動態查詢,再指向實際資料庫。至於快取,則儲存常被搜尋之查詢結果,系統經由中間層的快取資料即可快速回應使用者查詢需求。(3)多元資料同步檢索機制:大門網站應將各種資料內容作有效的整合,提供使用者多元化的資訊需求服務。而這種資訊整合應與查詢機制結合,讓使用者經一次查詢可同步檢索出網路資源索引、華文網路教育中心資訊內容 (Content)服務、新聞資訊、網頁及網站資訊以及頻道資訊,而在這些資訊的交換僅需作按鍵點即刻可列出資訊內容來,不需後端系統作多次重覆檢索。其優點包括提昇使用者滿意度、方便性及資料豐富性,加速系統檢索效能,減低系統負荷等。(4)自然語言欄位搜尋機制:大門網站應採用日趨成熟的 XML文件標示格式,依資料內容種類定義文件語意格式,則搜尋引擎對於非結構化的網頁資料可以作副資料庫欄位搜尋的精確度及效率。除此之外,由於文件語意結構清楚,每一欄位的字串或數值有準確的屬性,則使者用自然語言描述的查詢要求,可以被系統工作更準確的解讀,達到參數或條件比對的效果。(5)自動學習的智慧型搜尋機制:搜尋引擎的設計將可採用人工智慧方法作半自動的使用者關鍵字與學習功能,記憶使用者輸入過的關鍵字,逐步調整或解譯對於關鍵字的判讀,增加容錯、相關字、同義字等的辨認及解析能力。 (三)華語文教育資源之分類架構規畫範例 1.文教機構分類架構
3.師大華語文教學研究所之分類架構 師大華語文教學研究所網站中的「台灣華語文網路資源」,以網站的內容性質作為分類的依據,將國內外網站大略分為第一層六大類,以及第二層十五類: ■教學資源Teaching Resources
■線上教學課程On-line Class
■網路服務Network Service
■機構Institution
■中文資訊處理Chinese Information Processing
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||