「香港小學學習字詞研究」簡介

研究背景

漢字歷史悠久,累計數量龐大,例如《漢語大字典》就收錄了 56,000 餘字。不過,我們日常生活和工作中所需要用的漢字,只佔龐大漢字總量的一小部分。所以從學習的角度看,我們只需要兒童掌握日常生活中最常用的字和詞語,而不需要他們在生僻的字詞堆裏花費不必要的精力。

但是,要應付日常閱讀和書寫的需要,起碼要掌握多少漢字和詞語才足夠?在那麼龐大的字詞總量中,到底哪些字詞才是最常用的?由此出發,在不同學習階段中,應該要求學生學多少字、多少詞語?學哪些字、哪些詞語?這些問題,一直是語文教育工作者關心和希望解決的。

中國古代就已經有為兒童編寫識字課本的傳統。根據《漢書‧藝文志》記載,當時兒童所誦讀的書有十多種,包括《史籀》、《倉頡》等篇;後來的《千字文》、《三字經》也是古代漢語教學的重要啟蒙書,但古代兒童所要學習的字詞到底是如何選擇的,今日已無法得知。

到了現代,人們逐漸了解到:好的識字課本和教材,必須能反映語言使用的面貌。因此,調查語言使用狀況,減少主觀臆測的成份,顯然是研究識字教學的前提。

我國早在二十世紀二十年代,就出現了漢字和漢語詞匯的統計研究。1922 年,黎錦熙發表《國語基本語詞的統計研究》;其後,陳鶴琴根據 550,000 字的語料,選出 4,261 常用字,出版了《語體文應用字匯》。七十年代之後,電腦技術逐漸普及,在電腦輔助之下,大規模漢字和詞語調查相繼出現,使我們對漢語使用情況有了比較客觀而確切的認識。

不過,常用字詞的範圍和統計結果,在很大程度上取決於統計所選取的語言材料,同時也深受社會生活和政治文化背景的影響;中國大陸的字詞統計結果就跟臺灣的不完全吻合。正因如此,雖然海峽兩岸已經有不少字詞統計,但是這些統計結果不完全符合香港的語言使用情況,也不太能夠反映香港的語言面貌。我們必須進行反映本地情況的語言使用統計,才可以為香港語文教學提供比較有參考價值的字詞研究結果。

1990 年,香港課程發展議會公布《小學中國語文科課程綱要》,附錄《小學常用字表》,列出 2,600 字;1996 年,香港教育署公布《小學教學參考詞語表(試用)》, 收 6,765 詞語。這些材料對香港地區小學中國語文教學起了重要的促進作用:增加了字詞教學的規範性和針對性,為語文教師、課本編輯提供了參考依據。

隨着時間推移,香港地區近年在社會、經濟、文化和教育等領域都出現了一些新變化和新發展;特別是回歸以來,香港和內地的交往日趨頻繁,相互影響日益增強。為了更充分地反映香港近年語言運用的變化,滿足香港地區小學中國語文教育的需要,研究香港小學學習字詞並研製新的字詞表,就成為重要的課題。

材料依據與研究過程

香港理工大學中文及雙語學系年前建立了一個《中國大陸、臺灣、香港現代漢語語料庫》,包含 5,600,000 字語文材料,收 60,800 餘詞語,是至今為止第一個已經完成、涵蓋兩岸三地語言材料的現代漢語語料庫。

2003 年,香港理工大學中文及雙語學系受香港教育統籌局委託,研製一個供小學教學用的字表和參考詞語表;上述兩岸三地的詞語統計研究,正好作為研究香港小學學習字詞的基礎。為了配合中國語文科新課程建議的學習內容,研究小組在已有的研究基礎上,增加最新的語文材料,同時增收流行兒童讀物和小學教科書,包括增收文化、教育詞語,減收政治、財經詞語,語文材料進一步擴充到 6,520,000 字,據此得出一個新的詞語總表;再經過分類和統計,得到各個詞語在不同類型材料中的使用和分布情況,這些材料就成為編製小學學習字詞表的基礎。

一般成年人應付日常需要的常用詞,數量大概在 15,000 左右。因此,研究人員從詞語總表中截取頻率最高的 15,000 詞語,作為進一步分析的對象;這些詞語的累計覆蓋率為 96.3%。

香港學生除了學習本地詞語,還應該掌握海峽兩岸的通用詞匯。因此,研究人員將上述 15,000 詞語,與兩岸最新詞語表中頻率最高的 15,000 詞語進行對比分析。引用作對比的兩岸最新詞語表是:

為更確切地反映小學學習生活,研究人員再將上述 15,000 詞語,與香港和北京兩份小學詞語表,分兩個學習階段(小一至小三、小四至小六)進行對比分析:

經過對比分析以及對各種詞語表的原始數據進行電腦運算,再仔細審視、反復篩選,初步得出一個包括9,400詞的詞語表。在篩選過程中,研究人員從對比運算所得的客觀資料出發,着重考察詞語在各地詞語表中的分布情況,盡量選入兩岸三地共有的詞語;同時,適量收錄反映香港地區獨特事物的詞語,如「八達通、茶餐廳、便利店」。此外也酌量收錄了一些在日常生活中出現頻率不高、但對小學學習生活十分重要的詞語,如「試題、校服、塗改、課室、乘數、除數、兒歌」等。

研究人員也從語言學角度出發,考察詞語的構詞性質和收詞的系統性。例如一般不收姓氏用字和專有名詞,但「中國、香港」等小量已經成為香港學生常用詞匯的則例外。又例如「三哥、四哥、五哥」、「初三、初四、初五」等可以無限制類推的詞語一般也不收。還有一些組詞能力相當高的詞綴,如「者、室、商」,雖然不能獨立運用,但是容易類推成詞,構成像「示威者、流浪者、陳列室、閱覽室、經銷商、出版商」等的組合;為了避免大量收錄這些類推詞語,因此也酌量收錄這種詞綴。此外,考慮到香港語言保留較多單音節詞的現象,一些香港經常獨用的詞語,如「餐、入、幫、竹」,也酌量收錄。

另一方面,為了確保詞語表體現經濟和簡約的原則,有些詞語如果有兩種出現形式的,如「爸、爸爸」、「媽、媽媽」、「但、但是」,只收錄其一。有些詞語可帶詞尾「子」、也可不帶,只收帶詞尾者,如只收「椅子」而不收「椅」。遇同形異義的詞語,並不分立詞項,例如「花朵」的「花」、「花費」的「花」,不分兩詞立項,只補充說明使用情況。

在研究接近完成的時候,遇上香港理工大學《香港地區普通話教學及測試詞匯大綱》初稿進行內部通傳;為了使詞語表能照應本地普通話教學情況,詞語表又與該普通話詞語等級大綱進行對比分析,並作出一些調整。

初步確定詞語表範圍之後,研究人員將詞語表按照香港小學中國語文課程,劃分為兩個學習階段 (小一至小三、小四至小六)。劃分的主要依據,是各種通用詞語表中的頻率數據,另外參考香港和北京兩份小學詞語表所劃分的學習階段,並邀請經驗豐富的小學語文教師成立焦點小組提供專業意見,反復考慮,才作判斷,以充分照顧當前香港小學語文教育的實況。

還有一些特別的詞語,小學生在學習中可能會接觸到,但由於語文材料統計的限制,按頻率不能入選。這些詞語包括成語、組合比較固定的四字詞語、多字熟語、專有名詞、術語、文言詞語、音譯外來詞。這些詞語或者具有特定的意義,或者具有口語色彩,或者具有文化內涵和象徵意義,可以幫助兒童發展詞匯,在小學學習生活中十分重要,因此以附表的形式分別列出,作為補遺。

最後,香港常見的姓氏、人名和地名用字,例如現在純粹用於姓氏的「劉、吳、趙」,多用於人名的「娟、曼、琼」,香港地名的「埗、涌、磡、鱲、輋、砵、滘、笪」,雖然在統計中頻率不高,但是香港學生往往能在日常生活中接觸到,所以也用附表列出。

研究原則

綜合上述研究過程,研究人員在確定詞語表收詞範圍時,主要考慮三方面因素:一、語文材料中詞語使用和分布等狀況;二、香港地區詞語使用的特點;三、小學教育與兒童生活的實際情況。

研究主要遵循以下原則:

研究結果

按照以上原則,詞語表最終確定收錄 9,706 詞語,其中絕大多數是兩岸三地共有的詞語,少數是香港地區獨有的詞語。第一學習階段(小一至小三)收錄 4,914 詞語,第二學習階段(小四至小六)收錄 4,792 詞語。兩個學習階段的分布情況,與香港、北京兩份小學詞語表接近。不計附表在內,詞語表包含 3,171 字。這個結果反映了香港地區語文運用的客觀情況。由於參考的各種詞語表涵蓋面廣,而且根據一定原則進行篩選,入選的詞語來之有據,總數稍高於 1996 年的香港小學教學參考詞語表,數量應該是比較合適的。

詞語表中的詞語,有 5,860 詞語沿襲了 1996 年香港小學教學參考詞語表,佔該表詞語86.62%。詞語表中的漢字,有 2,461 字沿襲了 1996 年香港小學教學參考詞語表,佔該表漢字 97.97%;有 2,566 字沿襲了 1990 年香港小學常用字表,佔該表漢字 98.69%。研究人員相信,新舊字詞比例大體符合小學語文教育工作者的期望,既體現了新舊字詞表一脈相承,也充分反映了香港近數十年語言生活的發展和變化。

鳴謝

「香港小學學習字詞研究」能夠完成,實在依靠專家學者、經驗教師和有關機構人員的共同努力。在研究過程中,尤以香港浸會大學周國正教授和香港教育局李小達先生、鄭文亮先生、黎秀薇女士、孫省德女士、歐陽藹凌女士、施志咏女士、陳淑萍女士參加審閱,資深語文教師唐美蘭女士、繆雪芳女士、譚潔慧女士參加教師焦點小組,使我深受感動。

我們還獲得內地專家顧問傅永和教授、陳章太教授、李行健教授、佟樂泉教授、劉英林教授的指導和幫助,在此謹致誠摯謝意;而國家語言文字工作委員會和臺灣的教育部門慨允本研究使用其詞語統計資料,謹在此一併致謝。


香港理工大學中文及雙語學系 陳瑞端