Tuesday, 20 January 2015

Ngôn ngữ học thống kê là gì?



Một ngành ngôn ngữ học nghiên cứu việc ứng dụng kỹ thuật thống kê trong miêu tả lý thuyết ngôn ngữ. Việc nghiên cứu bao gồm quá trình phân tích tần suất và sự phân bố của các đơn vị trong văn bản với mục đích là để xác định đặc tính khu biệt của người nói hoặc người viết, như trong thống kê phân tích học (stylostatistics); nhưng cũng có nỗ lực khác được tiến hành để thiết lập những quy tắc chung liên quan đến đặc tính thống kê trong ngôn ngữ, như mối quan hệ giữa điển thể/điển dạng từ (type) (vd. từ up) và cá thể/hiện dạng từ (word token) (vd. số lần xuất hiện của từ up trong mẫu khảo sát), v.v.
Đó là một bản dịch vụng về, cắt xén nham nhở định nghĩa thuật ngữ STATISTICAL LINGUISTICS của David Crystal: 
A branch of LINGUISTICS which studies the application of statistical techniques in linguistic theory and description. The study includes the analysis of frequency and DISTRIBUTION of linguistic UNITS in TEXTS with the aim of identifying the DISTINCTIVE characteristics of  the speaker or writer (as in STYLOstatistics); but attempts have also been made to establish general laws concerning the statistical characteristics of languages, such as the relationship between WORD types (e.g. word up) and word tokens (e.g. the number of instances of the word up in a sample), the relative frequency of ITEMS in different samples, the quantification of such notions as REDUNDANCY in statistical terms, an so on. See also  QUANTITATIVE LINGUISTICS.
(David Crystal, ‎2011, Dictionary of Linguistics and Phonetics, Blackwell, 560 p.)
Ý của David Crystal là:
NGÔN NGỮ HỌC THỐNG KÊ là ngành ngôn ngữ học nghiên cứu việc ứng dụng các kỹ thuật thống kê trong lý luận và miêu tả ngôn ngữ. Một ví dụ cho các nghiên cứu theo hướng này là việc phân tích tần số và sự phân bố các đơn vị ngôn ngữ trong văn bản nhằm xác định các đặc trưng khu biệt ở người nói/viết (THỐNG KÊ PHONG CÁCH). Ngoài ra còn có thể kể các công trình tìm cách xác lập những quy luật tổng quát cho các đặc điểm thống kê của ngôn ngữ, ví dụ như mối quan hệ giữa từ vị (đơn vị từ vựng được thống kê) và từ trên văn bản (số lượt xuất hiện của từ vị), tần suất (tần số tương đối) của đối tượng trên các mẫu khảo sát, lượng hóa các khái niệm (như ĐỘ DƯ chẳng hạn) bằng cách diễn đạt của người làm thống kê v.v. Xem thêm NGÔN NGỮ HỌC ĐỊNH LƯỢNG

No comments:

Post a Comment