Thursday, 8 November 2012

Thiết lập từ điển tần số cho bản báo cáo của Hồ Cẩm Đào tại đại hội toàn quốc Đảng Cộng Sản Trung Quốc lần thứ 17

Dưới đây là một từ điển tần số được lập cho bản báo cáo chính trị do ông Hồ Cẩm Đào trình bày tại đại hội toàn quốc lần thứ 17 của Đảng Cộng Sản Trung Quốc.

Tôi bỏ qua tựa bài và tên báo cáo viên, cũng không đếm khoảng trắng, chỉ đếm từ chỗ bắt đầu thưa gửi (同志们:) đến hết câu cuối cùng (让我们高举中国特色社会主义伟大旗帜,更加紧密地团结在党中央周围,万众一心,开拓奋进,为夺取全面建设小康社会新胜利、谱写人民美好生活新篇章而努力奋斗!). Kết quả như sau:
Độ dài văn bản: 26095 ký tự (23757 ký tự  là chữ Hán; số còn lại là dấu câu).
Tổng số đơn vị được thống kê:  1166 (1152 đơn vị từ vựng tiếng Hán; các đơn vị kia là dấu câu và chữ số).
 Tần số các dấu câu như sau:
— 10
“ 29
” 29
548
566
1
1
4
31
31
1033
15
4
34

Và đây là danh sách các chữ Hán sắp theo thứ tự giảm dần của tần số xuất hiện trên văn bản đang xét:
537 411 369 308 295 294 289 285 279 237 229 223 219 217 211 210 197 192 187 186 176 173 172 168 151 150 149 140 137 132 129 128 126 126 121 120 119 118 115 115 114 113 113 112 110 108 104 103 100 99 98 98 97 96 95 95 95 94 94 91 91 90 90 90 89 89 88 87 84 82 81 80 80 80 79 79 79 78 77 74 74 72 72 71 70 69 68 68 68 66 65 65 64 63 62 60 60 60 60 59 59 59 58 58 58 57 57 56 55 54 54 54 54 53 52 51 51 50 50 49 49 49 48 48 47 46 46 45 45 44 44 43 43 43 43 43 42 42 41 41 41 41 40 40 40

Có  5  đơn vị có tần số là  39
['使', '', '', '', '']
Có  9  đơn vị có tần số là  38
['', '', '', '', '', '', '', '', '']
Có  7  đơn vị có tần số là  37
['', '', '', '', '', '', '']
Có  7  đơn vị có tần số là  36
['', '', '', '', '', '', '']
Có  7  đơn vị có tần số là  35
['', '', '', '', '', '', '']
Có  3  đơn vị có tần số là  34
['', '', '']
Có  7  đơn vị có tần số là  33
['', '', '', '', '', '', '']
Có  5  đơn vị có tần số là  32
['', '', '', '', '']
Có  9  đơn vị có tần số là  31
['', '', '', '', '', '', '', '', '']
Có  2  đơn vị có tần số là  30
['', '']
Có  3  đơn vị có tần số là  29
['', '', '']
Có  9  đơn vị có tần số là  28
['', '', '', '', '', '', '', '', '']
Có  6  đơn vị có tần số là  27
['', '', '', '', '', '']
Có  15  đơn vị có tần số là  26
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  8  đơn vị có tần số là  25
['', '', '', '', '', '', '', '']
Có  7  đơn vị có tần số là  24
['', '', '', '', '', '', '']
Có  7  đơn vị có tần số là  23
['', '', '', '', '', '', '']
Có  5  đơn vị có tần số là  22
['', '', '', '', '']
Có  8  đơn vị có tần số là  21
['', '', '', '', '', '', '', '']
Có  9  đơn vị có tần số là  20
['', '广', '', '', '', '', '', '', '']
Có  7  đơn vị có tần số là  19
['', '', '', '', '', '', '']
Có  16  đơn vị có tần số là  18
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  17  đơn vị có tần số là  17
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  18  đơn vị có tần số là  16
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  11  đơn vị có tần số là  15
['', '', '', '', '', '', '', '', '', '', '']
Có  15  đơn vị có tần số là  14
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  19  đơn vị có tần số là  13
['', '', '', '线', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  27  đơn vị có tần số là  12
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  17  đơn vị có tần số là  11
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  18  đơn vị có tần số là  10
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  27  đơn vị có tần số là  9
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  28  đơn vị có tần số là  8
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  31  đơn vị có tần số là  7
['', '', '', '', '', '', '', '', '沿', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  34  đơn vị có tần số là  6
['亿', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '西']
Có  51  đơn vị có tần số là  5
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  53  đơn vị có tần số là  4
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  75  đơn vị có tần số là  3
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  123  đơn vị có tần số là  2
['怀', '退', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '便', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
Có  282  đơn vị có tần số là  1
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '穿', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '访', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']

No comments:

Post a Comment