Thursday, 12 June 2014

Chỉ số đa dạng của Carroll

Gọi V là kích thước của vốn từ trên văn bản có độ dài N lượt từ. Tỷ số V/N được gọi là chỉ số đa dạng của Carroll.

Bản thông cáo ngày 8 tháng 6 năm 2014 của bộ ngoại giao Trung Quốc về hoạt động của giàn khoan 981 (The Operation of the HYSY 981 Drilling Rig: Vietnam's Provocation and China's Position2014/06/08) sử dụng 645 từ và dấu câu (ở đây xem như tương đương với từ). Bản thông cáo dài  2085 lượt “từ” (như đã định nghĩa ở trên). Tỷ số Carroll là 645/2085 = 30.94%.
Tính trung bình mỗi từ vị xuất hiện khoảng 3 lần trên văn bản.

No comments:

Post a Comment