數位人文要義──尋找類型與軌跡

項潔 編
金觀濤,劉昭麟,項潔,翁稷安,劉昭麟,劉青峰,邱偉雲,姚育松,劉吉軒,柯雲娥,張惠真,譚修雯,黃瑞期,甯格致 著

本論文集是「第三屆數位典藏與數位人文國際研討會」的論文結集,共收錄九篇文章,可粗略分為兩大類,代表著現階段數位人文領域發展的兩種類型。一類是文字的分析,另一類是嘗試用新技術展現文字所不能負載的成果。

其中,項潔、翁稷安的〈多重脈絡—─數位檔案之問題與挑戰〉旨在說明數位系統對脈絡探勘提供的協助,兼而探討數位人文學可能開啟的嶄新研究視野。劉昭麟、金觀濤等的〈自然語言處理技術於中文史學文獻分析之初步應用〉從自然語言的資訊技術和傳統史學的文獻分析切入,探究二者結合的可能性。劉青峰、邱偉雲等的〈以文本分析呈現臺灣海外史料政治思想輪廓〉則透過關鍵詞詞頻及社會網路分析,檢視1970-1990年代海外左派刊物的思想脈絡,並比較各刊的同異及彼此關係。

謝承恩、洪振洲等的〈結合漢典古籍虛詞常見字與統計量化分析進行漢譯佛典譯者風格辨別〉藉由佛教經典的字句整理及量化分析,解析譯者風格。金觀濤、邱偉雲等的〈「共現」詞頻分析及其運用—─以「華人」觀念起源為例〉意圖賦與詞頻分析新的詮釋。林居正、王昱鈞等的〈漢語方言語音資料庫自動擴增補完方法〉則試圖應用數位科技,來處理語言學中極困難的方言問題。

赤石直美等的〈京都大比例尺地圖(京都市明細圖Kyoto-shi meisai-zu)數位化〉、滑田明暢等的〈數位典藏應用的社會效益與永續經營—─以阪神大地震資料3D視覺化為例〉,以及邱斯嘉、郭潔等的〈「太平洋史前Lapita陶器線上數位資料庫」的建立與運用〉,各朝底圖、3D視覺化或具體應用等面向開發,提出從地理資訊出發的新思考角度,希冀用新技術來活化非文字材料的應用。

誠如〈導論──數位人文的變與不變〉所言,數位和人文兩者之間的對話,應當是一個沒有止境、不斷持續的過程。在數位人文發展的研究方式和型態裡,不斷的對話與交流是最為重要的關鍵;藉由跨越不同國界、不同研究議題、不同技術領域,得以彰顯數位人文作為研究方法的價值和意義。

【編者簡介】

項潔

國立臺灣大學資訊工程學系特聘教授暨中央研究院資訊科學研究所合聘研究員,同時也是臺灣大學數位典藏研究發展中心主任。他曾出任臺灣大學圖書館館長,投入臺大的數位典藏工作及相關研究應用已十餘年,不僅領導《淡新檔案》、臺灣古契書、日治時期統計資料等重要歷史文獻的數位化與資料庫開發建置工作,完成「臺灣歷史數位圖書館」(THDL),並協助臺灣省諮議會擋案資料庫、國民黨黨史館、慈林教育基金會典藏臺灣社運史料資料庫、和文建會國家文化資料庫的建置。

作者 (姓名依論文順序排列)

項潔、翁稷安劉昭麟、金觀濤、劉青峰、邱偉雲、姚育松劉吉軒、柯雲娥、張惠真、譚修雯、黃瑞期、甯格致、謝承恩、洪振洲、馬德偉、林居正、王昱鈞、蔡宗翰、Naomi AkaishiToshikazu SetoYukihiro FukushimavKeiji YanoAkinobu NamedaKosuke WakabayashiTakuya NakatsumaTomomi HatanoShinya SaitoMitsuyuki InabaTatsuya Sato邱斯嘉、郭潔、蘇郁尹

 

 

 

 

 

 

【編者序】

從全球各國數位典藏發展的歷史來看,臺灣開始的不算太早,但也不算晚。暫且不論個別學校、單位或個人的研究和努力,從國科會在1998年以「數位博物館計畫」開始投入國家資源,有系統地發展數位典藏來算,到現在也已將近15年了。在這段不算短的時間裡,我國投入了大量經費,也將大量的文化資產數位化,其中最重要,從2002年開始執行的「數位典藏國家型計畫」,更產生了指標性的作用,讓「數位典藏」在臺灣成為一個大眾語言內的詞彙。

數位典藏國家型計畫的成功,至少有一部分歸功於許多資深且傑出的研究人員,尤其是人文學者,不計報酬地全心投入。但是從大約2005年開始,我們漸漸發覺這些優秀的學者在他們本身的研究中,似乎並沒有充分利用他們花了大量精力數位化的檔案;這令我感到困惑,因為這樣不是事倍功半嗎?為什麼不能將數位化工作和本身的研究結合在一起呢?觀察到這個現象後,我開始去探討它的環節。我發現其中的一個重要原因是數位典藏系統的設計往往沒有考慮到使用者── 尤其是研究者── 的需求,以致於一直到現在絕大多數的研究者還是認為檢索系統只能幫他們找資料罷了,而不能幫忙整理或分析資料。這是很可惜的,因為許多資訊技術已經十分成熟,如果能夠與數位檔案結合並有效地運用在這些系統中,應對人文研究產生非常大的助益。在更進一步的探討後,我發現這個問題並不是臺灣獨有的,在國外亦有學者思考這個問題,而且已有一個研究社群,那便是「數位人文」。

用最簡單的話來講,「數位人文」就是結合大量數位材料,運用資訊科技,來從事人文研究。顧名思義,這是一項跨領域整合的工作。要達到這個目標,除了要有大量高品質的數位資源可供使用外,更需要人文學者與資訊學者密切的互動與合作。有鑑於此,國立臺灣大學數位典藏研究發展中心從2009年開始舉辦每年一度的「數位典藏與數位人文國際研討會」,希望藉由這個會議,不但能夠介紹世界最新的研究成果,並能提供國內外人文與資訊學者交流的機會,讓臺灣的數位人文研究能夠遍地開花,並與國際接軌。

《數位人文研究叢書》即是這個年度會議產出的一項成品。叢書中的每一篇文章均在研討會中發表過,再經修改及至少兩位審查人的審查通過。在此特別感謝臺大數典中心的蔡炯民博士、陳怡君小姐與全體同仁對本叢書投注的心力。我們希望透過這個系列的叢書,提升國內學界對數位人文的認知,並激發進一步的研究。

項潔

2011年9月於臺大

【目錄】

Contents


Preface

導論

數位人文的變與不變 Introduction:

The Change and Unchange of Digital Humanities
◆項潔、翁稷安

Part Ⅰ檔案史料
Archives & Documents
多重脈絡--數位檔案之問題與挑戰
Mutiple-contextualization: Problems and Challenges on Digital Archives
◆項潔、翁稷安
自然語言處理技術於中文史學文獻分析之初步應用
An Exploration of Analyzing Historical Chinese Documents with Natural Language Processing
Techniques
◆劉昭麟、金觀濤、劉青峰、邱偉雲、姚育松
以文本分析呈現臺灣海外史料政治思想輪廓
Text Analysis on Overseas Taiwanese Journals for Political Thought Profiling
◆劉吉軒、柯雲娥、張惠真、譚修雯、黃瑞期、甯格致

Part Ⅱ語料庫語言學
Corpus Linguistics
結合漢典古籍虛詞常見字與統計量化分析進行漢譯佛典譯者風格辨別
Authorship Attribution of Early Chinese Buddish Translations: Using Principal Component Analysis
with Commonly Used Ancient Chinese Empty Words
◆謝承恩、洪振洲、馬德偉
「共現」詞頻分析及其運用--以「華人」觀念起源為例
Frequency Analysis and Application of “Co-occurrence” Phrases: The Origin of the Concept
“Ha-ren”as an Example
◆金觀濤、邱偉雲、劉昭麟
漢語方言與音資料庫自動擴增補完方法
An Automatic Augmentation Method for Chinese Dialect Pronunciation Databases
◆林居正、王昱鈞、蔡宗翰

Part Ⅲ 地理資訊
Geograghical Information
Digitalization and Utilization of the “Large-scale Maps of Kyoto City(Kyoto-shi meisai-zu)
京都大比例尺地圖(京都市明細圖Kyoto-shi meisai-zu)數位化
◆Naomi Akaishi、Toshikazu Seto、Yukihiro Fukushimav、Keiji Yano
Towards Social Application and Sustainability of Digital Archives: The Case Study of 3D Visualization
of Large-scale Documens of the Great Hanshin-Awaji Earthquake
數位典藏應用的社會效益與永續經營--以阪神大地震資料3D視覺化為例

Akinobu Nameda、Kosuke Wakabayashi、Takuya Nakatsuma、Tomomi Hatano、Shinya Saito、Mitsuyuki Inaba、Tatsuya Sato

「太平洋史前Lapita陶器線上數位資料庫」的建立與運用
Establishment and Research Applications of the Online Database for the Study of Lapita Pottery
◆邱斯嘉、郭潔、蘇郁尹