語料庫,通常是指為(wei) 語言研究收集的、用電子形式保存的語言材料,由自然出現的書(shu) 麵語或口語的樣本匯集而成,用來代表特定的語言或語言變體(ti) [1]。早期的語料庫一般隻包括帶有語言學信息標注的文字資源,在信息技術高速發展的今天,隨著攝像技術和數字攝像機的普及應用,數字視頻資源已成為(wei) 語料庫的重要組成部分。國家組織或批準建設的大型語料庫項目,如2008年10月教育部、國家語委啟動的“中國語言資源有聲數據庫”(簡稱“有聲數據庫”),2012年國家社會(hui) 科學基金重大項目“漢語方言自然口語有聲基礎語料庫”(簡稱“有聲基礎語料庫”),2015年5月教育部、國家語委正式啟動的“中國語言資源保護工程”(簡稱“語保工程”)等,均將視頻資源作為(wei) 重要的基礎組成部分,並提出了明確的采集要求。
數字視頻技術是利用數字化手段對視頻進行錄製、存儲(chu) 、編輯以及播放的一種計算機技術,以數字文件形式保存的視頻可以通過計算機進行檢索和編輯處理。將數字視頻技術應用於(yu) 語料庫建設中既有利於(yu) 語言資源的保存和傳(chuan) 承,又便於(yu) 檢索和加工處理,還有利於(yu) 語言資源研究成果的立體(ti) 化、多樣化和信息化、網絡化。
1 語料庫建設對視頻資源的要求
2 視頻的錄製與(yu) 後期處理
3 視頻錄製和後期處理的有關(guan) 事項
4 結語
視頻文件已成為(wei) 語料庫的重要組成部分,采用數字視頻技術進行語料錄製並對錄製後的視頻文件進行適當技術處理,不僅(jin) 可以確保視頻文件符合語料庫建設要求,同時對語料庫的建設和研究成果的推廣、對語言資源的發掘和保護都具有重要意義(yi) 。
參考文獻
[1] 中國社會(hui) 科學院語言研究所.中國語言學年鑒:1999-2003[M].北京:商務印書(shu) 館,2006:363-385.
[2] 中國語言資源有聲數據庫建設領導小組辦公室.中國語言資源有聲數據庫調查手冊(ce) •漢語方言[S].北京:商務印書(shu) 館,2010.
[3] 教育部語言文字信息管理司,中國語言資源保護研究中心.中國語言資源調查手冊(ce) •漢語方言[S].北京:商務印書(shu) 館,2015.
李憲武 山東(dong) 女子學院 |