Ở nước ta có một
vài nhà khoa học hình như rất giỏi trong lĩnh vực của mình, nhưng từ đó lại tưởng
rằng mình có thể phán truyền chân lý trong những lĩnh vực mà mình chưa từng được
học giờ nào, và từ đó cho ra hết nhận định này đến nhận định khác cho thấy những
lỗ hổng khổng lồ mà bất kỳ ai có chút học thức chuyên ngành cũng phải lấy làm xấu
hổ. Thái độ này có thể thấy rõ hơn cả đối với những ngành mà có người cho là
không cần học cũng biết, đặc biệt là ngôn ngữ học và văn học. Lẽ ra nhà khoa học
tự cho mình cái quyền truyền phán về mọi ngành khoa học khác chỉ cần nhớ lại
cái quá trình mấy mươi năm gian khổ mà mình đã trải qua để trở thành chuyên gia
trong lĩnh vực của mình cũng đủ hiểu là không làm gì có một ngành khoa học nào
không cần học cũng biết được.
Xưa nay không ít người chưa học bò đã lo học chạy. Chuyện
không có gì mới lạ. Nhưng chuyện lạ là ít ai để ý đến những người hoang tưởng rằng
cứ chạy giỏi ở chỗ này (trị bệnh loãng xương chẳng hạn) ắt có thể chạy nhanh ở
chỗ khác. Mấy bài viết về truyện Kiều của Nguyễn Văn Tuấn (Đọc Truyện Kiều băng thống kê học, Nhân ngày Tết đọc lục bát bằng thống kê) là những ví dụ tiêu biểu
cho cái chứng hoang tưởng đó.
Không thể nghiên cứu truyện Kiều bằng một quyển Kiều
vớ được trên kệ sách thư viện địa phương hay trong tủ sách gia đình. Người
nghiên cứu tác phẩm văn học nói chung và truyện Kiều nói riêng luôn luôn phải
ghi rõ văn bản mà mình sử dụng là bản nào. Nếu đó là sách in thì ai in, in năm
nào, ở đâu...; nếu là thủ bản thì sách đó được lưu ở đâu, kho nào, ký hiệu số mấy...
Lý do rất đơn giản và các thầy luôn dạy ngay cho sinh viên ngữ văn ngay từ ngày
đầu họ tập tễnh vào nghề: những khác biệt giữa bản này với bản khác có thể là
những chi tiết rất có ý nghĩa. Chỉ riêng việc khảo chứng những dị biệt giữa các
văn bản của cùng một tác phẩm cũng đáng được xem là một chuyên ngành sâu.
Người đọc Nguyễn Văn Tuấn hoàn toàn không biết tác
giả làm thống kê trên văn bản nào của Truyện Kiều. Cả các tác phẩm được đem ra
đối chiếu (Lục Vân Tiên, thơ Nguyễn Bính) cũng không có thông tin gì về văn bản
được sử dụng. Bài đăng ở trang Hồn Quê cho biết ông lấy truyện Kiều từ trang www.vhvn.com. Tôi đã vào xem thử (ảnh chụp màn
hình). Có vẻ như trang đó hiện nay không còn liên quan gì đến văn học Việt Nam
nữa. Nhưng ngay cả khi trong quá khứ nó từng là một trang WEB nghiêm túc thì
cũng chưa thấy ai ngoài Nguyên Văn Tuấn dùng văn bản ở đó để nghiên cứu, không
một chút hoài nghi về chất lượng văn bản.
Có vẻ như tác giả mặc nhiên xem Truyện Kiều, Lục Vân
Tiên, Nguyễn Bính của ông cũng chính là Truyện Kiều, Lục Vân Tiên, Nguyễn Bính
mà người đọc ông đang sử dụng. Đây là một trong những lỗi nghiêm trọng nhất của
bài viết, cho thấy người viết nhận thức rất đơn giản về các lĩnh vực hữu quan (văn
bản học, Kiều học và thống kê ngôn ngữ học).
Như một đứa trẻ chỉ biết đếm 1, 2, 3, 4...mà không
biết phải đếm cái gì, Nguyễn Văn Tuấn chọn vấn đề nghiên cứu bằng cách đếm những
hiện tượng hoàn toàn vô giá trị đối với tri thức Kiều học. Đo độ dài của từ
tính bằng số lượng ký tự là một vấn đề rất có ý nghĩa đối với người nghiên cứu
chữ Quốc Ngữ về phương diện ngôn ngữ học
cũng như tin học. Nhưng người nghiên cứu Truyện Kiều đếm số ký tự ở từng từ để
làm gì? Nguyễn Du viết bằng chữ Nôm, sau đó các nhà in, nhà nghiên cứu, mỗi người
phiên âm một phách. Cùng một bản chữ Nôm có mấy cách ghi bằng chữ Quốc Ngữ là YM
NHIỀM / YM NHÌM / IM LÌM / ÊM ĐỀM, thế thì độ dài của mấy từ ấy phải đếm
làm sao? Chuyện văn bản học đã đề cập ở trên rồi, không nhắc lại nữa, tôi chỉ hỏi
thêm một câu: những sai biệt đó có ý nghĩa gì không?
Các kết quả mà Nguyễn Văn Tuấn coi là khá thú vị đều
rất vô duyên:
Thứ nhất, một điều
khá thú vị là, tính trung bình, những chữ trong tiếng Việt chỉ có 3,4 mẫu tự.
Chữ dài nhất của ta cũng chỉ có 7 mẫu tự (chữ Nghiêng)! Trong khi đó, trong
tiếng Anh, tính trung bình, mỗi chữ dài đến 4,6 mẫu tự, và có chữ dài hơn 10 mẫu
tự. Điều thú vị thứ hai là độ lệch tiêu chuẩn (standard deviation) của từ
tiếng Việt chỉ 0,93, rất thấp so với độ lệch trong tiếng Anh là 2,6. Điều
này có ý nghĩa gì? Theo nhà thần kinh – tâm lý học (neuropsychologist) S.
Dehaene thuộc Viện nghiên cứu y khoa Pháp (Paris) thì người nào dùng chữ ngắn
thường có khả năng nhớ các con số lâu hơn. Chẳng hạn như người Tô Cách
Lan (Scotland) có tên của những con số dài hơn, và thường có khả năng tính toán
[tính trung bình] thấp hơn, người Anh.
Nếu thuyết tương quan giữa độ dài của từ ngữ
và năng khiếu tính toán là đúng, ta cũng có thể giải thích một phần tại sao trẻ
em người Việt tương đối có năng khiếu về số học khá hơn trẻ em người Tây phương
chẳng hạn.
Tôi không dám thắc mắc gì về Dehaene. Tôi chỉ hỏi lại Nguyễn Văn Tuấn một câu đã hỏi: Nguyễn Du viết bằng chữ Quốc Ngữ sao?
Khi nào gặp riêng Dehaene, tôi sẽ xin hỏi thêm một câu: Dân Nga có phải là giống dân dốt toán nhất thế giới? Hy vọng nhờ lời
giải đáp đó mà có thể biết được tại sao dân Tàu cần dùng chữ pinyin trong khi
dân Nhật dù có chuyển qua hệ chữ romaji cũng nhất định không thể giỏi
toán bằng người Việt chúng ta
Về kết quả thứ hai:
Thứ hai, những khác biệt về mức độ phân phối các biến thể câu 6 và 8 chữ trong thơ giữa ba nhà thơ có thể cho ta một nhận xét chung là so với Nguyễn Du và Nguyễn Đình Chiểu, Nguyễn Bính là nhà thơ thích thanh bằng. Thực vậy, nếu tính theo số từ-duy-nhất, thơ lục bát của Nguyễn Bính dùng đến 55% từ thanh bằng, 11% cao cao hơn Kiều (44%) và 6% cao hơn Lục Vân Tiên (49%). Xác suất mà mức độ khác biệt này do các yếu tố ngẫu nhiên chỉ 0.001 phần trăm. Nói cách khác, xu hướng dùng từ thanh bằng của Nguyễn Bính có thể là một thói quen có ý thức, có hệ thống, chứ không phải do yếu tố ngẫu nhiên gây ra.
Thứ hai, những khác biệt về mức độ phân phối các biến thể câu 6 và 8 chữ trong thơ giữa ba nhà thơ có thể cho ta một nhận xét chung là so với Nguyễn Du và Nguyễn Đình Chiểu, Nguyễn Bính là nhà thơ thích thanh bằng. Thực vậy, nếu tính theo số từ-duy-nhất, thơ lục bát của Nguyễn Bính dùng đến 55% từ thanh bằng, 11% cao cao hơn Kiều (44%) và 6% cao hơn Lục Vân Tiên (49%). Xác suất mà mức độ khác biệt này do các yếu tố ngẫu nhiên chỉ 0.001 phần trăm. Nói cách khác, xu hướng dùng từ thanh bằng của Nguyễn Bính có thể là một thói quen có ý thức, có hệ thống, chứ không phải do yếu tố ngẫu nhiên gây ra.
Việc so sánh số từ duy nhất (hapax) cũng như tất cả các
so sánh từ trắc học khác chỉ có thể thực hiện được nếu các khối văn bản có độ
dài bằng nhau. Không ai nghiên cứu từ trắc học mà không biết tỷ trọng của khối
hapax trong vốn từ vừa phụ thuộc vào độ dài văn bản, vừa là một yếu tố phong
cách. Do đó để nghiên cứu phong cách, người ta cần trung hòa ảnh hưởng của độ
dài văn bản. Sai lầm căn bản về phương pháp chỉ có thể dẫn đến những kết quả
sai lệch, ngoài mục đích tán nhảm, không dùng vào được việc gì khác.
Kết luận thứ ba cũng nhảm nhí nốt:
Thứ ba, phân
tích sự khác biệt về nguyên âm và phụ âm giữa ba nhà thơ trên cũng cho thấy một
vài khuynh hướng đáng chú ý. Chẳng hạn như về nguyên âm bổng (tức những i, e, và ê) không có sự khác biệt nào giữa ba
nhà thơ (khoảng 20% đến 21%). Nhưng những chữ có nguyên âm trầm (u, o, ô) chiếm đến 35% từ ngữ trong
thơ Nguyễn Bính, và đây cũng là một khác biệt có ý nghĩa thống kê (chứ không phải
ngẫu nhiên) so với hai tác phẩm Kiều và Lục
Vân Tiên (khoảng 30 đến 31%).
Để cho đỡ nhảm, có thể ghi rõ là Nguyễn Bính trong khối văn bản ngắn ngủn đang xét so với Nguyễn Du trong quyển truyện Kiều dài gấp nhiều lần mà Nguyễn Văn Tuấn có trong tay, thay vì chỉ viết rất gọn và rất khái quát là Nguyễn Bính và Nguyễn Du. Nhưng ngay cả khi đã chữa lại như thế, vẫn còn nhảm thảm hại do Nguyễn Văn Tuấn không biết chữ và âm khác nhau thế nào:
Để cho đỡ nhảm, có thể ghi rõ là Nguyễn Bính trong khối văn bản ngắn ngủn đang xét so với Nguyễn Du trong quyển truyện Kiều dài gấp nhiều lần mà Nguyễn Văn Tuấn có trong tay, thay vì chỉ viết rất gọn và rất khái quát là Nguyễn Bính và Nguyễn Du. Nhưng ngay cả khi đã chữa lại như thế, vẫn còn nhảm thảm hại do Nguyễn Văn Tuấn không biết chữ và âm khác nhau thế nào:
Theo các nhà
nghiên cứu ngôn ngữ học, nguyên âm được chia ra làm hai loại trầm và bổng tùy
theo độ khép hay mở của môi khi phát âm. Những nguyên âm này có thể tóm tắt như
sau (7):
Bổng Trung Trầm
Khép i ư u
Trung ê ơ/â
oâ
Mở e a/ă o
Phụ âm cuối
trong tiếng Việt cũng có thể chia thành hai nhóm: vang và tắc. Phụ âm vang gồm
có m, n, nh, ng; và phụ âm tắc gồm: p, t, ch và c. Những
chữ sau đây (gạch dưới) được xem là có dùng nhiều nguyên âm mở và phụ âm vang
(7):
...
Trong số 22.778
chữ trong Truyện Kiều, có 13.963 chữ (hay khoảng 61%) có thể phân loại
nguyên âm trầm-bổng. Tính trên tổng số 13.963 chữ, có khoảng 21% chữ có nguyên
âm bổng, 31% chữ có nguyên âm trầm, và 48% chữ có nguyên âm "trung
bình". Phân tích theo độ khép-mở của môi cho thấy khoảng 47% chữ có nguyên
âm mở, và chỉ 21% chữ có nguyên âm khép. Tất cả những phân phối này rất tương
đương với phân phối trong Chí Phèo (xem Bảng thống kê số 4).
Tôi không thắc mắc nhiều về chuyện thuật ngữ cũng
không hỏi tại sao ông Nguyễn Văn Tuấn theo Nguyễn Phan Cảnh mà không theo người
khác, vì biết rằng nếu có hỏi, chắc chắn sẽ chỉ nhận được một câu trả lời duy
nhất là ông không biết các tác giả ấy và các thuật ngữ ấy khác nhau thế nào. Tôi
chỉ hỏi ông Nguyễn Văn Tuấn một câu: ua trong từ mua là mấy âm?
Xem cách ông mô tả, tôi đoán là ông đếm thành hai âm.
Nguyễn Văn Tuấn thực ra chỉ có ý định viết một bài
phiếm đàm. Đôi chỗ ông phang bâng quơ kiểu “Có
người cho rằng...”. Trong câu chuyện phiếm, điều này hoàn toàn chấp nhận được.
Ở một công trình khoa học nghiêm túc, người đọc cần biết tên của “người cho rằng”
và các thông tin liên quan đến ý kiến của người đó (tựa sách, năm xuất bản, số
trang...). Về điểm này Nguyễn Văn Tuấn không có lỗi gì. Lỗi là ở nhà xuất bản GiáoDục đã tự đánh mất uy tín học thuật khi gom vào một bộ sách đồ sộ đủ mọi ý kiến
thượng vàng hạ cám, từ Nguyễn Văn Tuấn lên đến Đào Duy Anh, Cao Xuân Hạo...
Nguyễn Văn Tuấn đã
rào đón chân thành nhận là ông chỉ mạo muội
làm một vài phân tích thống kê. Khi ông đưa bài viết lên mạng, người ta thấy
đó đúng là một công việc hết sức mạo muội, không chê vào đâu được. Nhưng khi
bài viết đó lại được nhà xuất bản Giáo Dục đưa vào một tác phẩm tham khảo thì điều
mạo muội trở thành một sự tắc trách. Và đó là lý do tại sao tôi viết bài phản biện
muộn màng này. Mong từ nay không còn dịp đọc Nguyễn Văn Tuấn bàn về thống kê
văn chương.
Hay quá Minh ơi! Chị xin bài này đem về trang của chị nhé?
ReplyDeleteEm cảm ơn chị.
ReplyDeleteHay !
ReplyDeleteThanks đ/c Thái Minh :)
đ/c Nguyễn Văn Tuấn xứ Syd này có tật hay tán rộng dài nghe cũng vui tai ! Hồi xưa cùng trong nhóm VNSA cũng vậy, gặp nhau nhậu nhẹt chơi cũng vậy mà.
@6sg
Ông có lỡ mua sách đó thì mang đến nhà xuất bản Giáo Dục đòi tiền đi.
DeleteBài phản biện rất hay (nhất là trích phần đầu của CAO XUÂN HẠO). Chỉ tiếc KHÔNG DẪN NGUỒN bài gốc của NGUYỄN VĂN TUẤN (người mà tớ đã đọc đôi lần và thấy anh ta khá chủ quan về một số điều liên quan đến NGÔN NGỮ và TÔN GIÁO).
ReplyDeleteCông trình VietBible rất hữu ích đối với người nghiên cứu tôn giáo và Việt ngữ. Tôi xin phép đặt đường dẫn từ trang Tìm Hiểu Từ Nguyên đến. Tôi đã tìm cách liên lạc với ông trên trang VietBible nhưng không được, nay xin mạn phép gửi mấy dòng vắn tắt từ trang này. Mong ông thông cảm và xin cảm ơn rất nhiều.
DeleteRất thú vị, tôi đồng cảm với nữ sĩ Vũ Thị Phương Anh đấy nha.
ReplyDeleteĐạ ta Thái Minh tiên sinh