Căn cứ vào bản danh sách tần số các chữ Hán đã đượcthiết lập cho bản báo cáo của Hồ Cẩm Đào tại đại hội toàn quốc Đảng Cộng Sản Trung Quốc lần thứ 17, ta thấy vốn từ có
kích thước là 1152 đơn vị trên một văn bản dài 23757 lượt từ. Tính trung bình mỗi
từ được sử dụng khoảng 21 lần.
Có từ được dùng đến 537 lần (的). Mười từ vị đứng
đầu danh sách (的和国会主民发展社人) phủ 14% văn bản
trong khi 282 hapax (chiếm tỷ lệ 24.47% vốn từ) chỉ phủ được 1.19% bề mặt văn bản).
Nói một cách khác, khoảng 1/4 vốn từ ông Hồ Cẩm Đào sử dụng trong bài báo cáo
đó chỉ để nghe xong rồi quên. Đố ai nhớ được ông có dùng từ.看 hay không mặc
dù đó là một từ vị rất thông dụng trong sinh hoạt.
Số phận của 123 từ vị có tần số là 2 chắc cũng không
khá hơn gì mấy. Nhưng dù sao thì khả năng để chúng lọt từ tai này ra tai kia
luôn cũng không đến nỗi tệ như những từ vị thuộc nhóm hapax.
Ông Hồ Cầm Đào liên tục dội các từ vị thuộc nhóm top
ten vào tai người nghe. Cứ 20 từ nói ra là có 3 từ nằm trong nhóm đó rồi. Bài
diễn văn dài 150 phút, tính ra mỗi phút đều đều nói được khoảng 158 từ thì có 22
từ thuộc về nhóm từ vị top ten với đủ kiểu kết hợp: toàn bài có đến 274社会, 247 发展, 129 人民, 65 民主... Từ 全xuất hiện 210 lần
thì có 19全国, 11 全民, 43 全面 . Nếu ta để ý rằng
面có tần số là 81,
có thể thấy là cứ 2 lần dùng đến面
thì có 1 lần xuất hiện tổ hợp全面.
No comments:
Post a Comment