Sinh viên đang thực hiện nhiệm vụ sao chép trên bảng thông minh. Hình ảnh: Các nhà tâm lý Wikimedia Commons
Trung tâm Ngôn ngữ và Trí não HSE phát hiện ra rằng khi đọc, mọi người không chỉ có khả năng dự đoán các từ cụ thể mà còn cả các thuộc tính ngữ pháp của từ, giúp họ đọc nhanh hơn. Các nhà nghiên cứu cũng đã phát hiện ra rằng khả năng dự đoán của các từ và các đặc điểm ngữ pháp có thể được mô hình hóa thành công với việc sử dụng mạng nơ-ron. Nghiên cứu được công bố trên tạp chí PLOS ONE.
Khả năng dự đoán từ tiếp theo trong bài phát biểu của người khác hoặc khi đọc đã được mô tả bởi nhiều nghiên cứu tâm lý và thần kinh học trong 40 năm qua. Người ta cho rằng khả năng này cho phép chúng ta xử lý thông tin nhanh hơn. Một số ấn phẩm gần đây về ngôn ngữ Anh đã chứng minh bằng chứng rằng trong khi đọc, mọi người không chỉ có thể dự đoán các từ cụ thể, mà còn cả các thuộc tính của chúng (ví dụ, một phần của lời nói hoặc nhóm ngữ nghĩa). Dự đoán từng phần như vậy cũng giúp chúng ta đọc nhanh hơn.
Để truy cập khả năng dự đoán của một từ nhất định trong ngữ cảnh, các nhà nghiên cứu thường sử dụng các nhiệm vụ sao chép, chẳng hạn như “Nguyên nhân của vụ tai nạn là do điện thoại di động, điều này đã làm _____ mất tập trung.” Trong cụm từ này, có thể có các danh từ khác nhau, nhưng người lái xe là có thể xảy ra nhiều nhất, cũng là phần kết thúc thực sự của câu. Xác suất của từ “tài xế” trong ngữ cảnh được tính bằng số người đoán đúng từ này trên tổng số người đã hoàn thành nhiệm vụ.
Cách tiếp cận khác để dự đoán xác suất từ trong ngữ cảnh là sử dụng các mô hình ngôn ngữ cung cấp xác suất từ dựa trên một kho văn bản lớn. Tuy nhiên, hầu như không có nghiên cứu nào so sánh xác suất nhận được từ nhiệm vụ cloze với xác suất từ mô hình ngôn ngữ. Ngoài ra, không ai đã cố gắng mô hình hóa khả năng dự đoán ngữ pháp của các từ. Các tác giả của bài báo đã quyết định tìm hiểu xem liệu những người nói tiếng Nga bản ngữ có dự đoán các thuộc tính ngữ pháp của từ hay không và liệu các xác suất của mô hình ngôn ngữ có thể trở thành một sự thay thế đáng tin cậy cho các xác suất từ các nhiệm vụ nhân bản hay không.
Các nhà nghiên cứu đã phân tích câu trả lời của 605 người nói tiếng Nga bản ngữ trong nhiệm vụ cloze trong 144 câu và phát hiện ra rằng mọi người có thể dự đoán chính xác từ cụ thể trong khoảng 18% trường hợp. Độ chính xác của dự đoán các bộ phận của lời nói và các đặc điểm hình thái của từ (giới tính, số lượng và trường hợp của danh từ; thì, số lượng, người và giới tính của động từ) thay đổi từ 63% đến 78%. Họ phát hiện ra rằng mô hình mạng lưới thần kinh, được đào tạo trên National Corpus của Nga, dự đoán các từ và đặc tính ngữ pháp cụ thể với độ chính xác có thể so sánh với câu trả lời của mọi người trong thí nghiệm. Một quan sát quan trọng là mạng lưới thần kinh dự đoán những từ có xác suất thấp tốt hơn con người và dự đoán những từ có xác suất cao kém hơn con người.
Bước thứ hai trong nghiên cứu là xác định xem các xác suất dựa trên thực nghiệm và tài liệu ảnh hưởng đến tốc độ đọc như thế nào. Để xem xét vấn đề này, các nhà nghiên cứu đã phân tích dữ liệu về chuyển động của mắt ở 96 người đang đọc 144 câu giống nhau. Kết quả cho thấy rằng đầu tiên, xác suất đoán phần lời nói, giới tính và số lượng danh từ, cũng như thì của động từ càng cao, thì người đó đọc các từ có các đặc điểm này càng nhanh.
Các nhà nghiên cứu nói rằng điều này chứng tỏ rằng đối với các ngôn ngữ có hình thái phong phú, chẳng hạn như tiếng Nga, dự đoán phần lớn liên quan đến việc đoán các thuộc tính ngữ pháp của từ.
Thứ hai, xác suất của các đặc điểm ngữ pháp thu được từ mô hình mạng nơ-ron đã giải thích tốc độ đọc một cách chính xác như xác suất thực nghiệm, Anastasiya Lopukhina, tác giả của Nghiên cứu viên tại Trung tâm Ngôn ngữ và Trí não HSE.
Thứ ba, xác suất của các từ cụ thể nhận được từ mô hình ngôn ngữ giải thích tốc độ đọc theo một cách khác so với xác suất dựa trên thực nghiệm. Các tác giả giả định rằng kết quả như vậy có thể liên quan đến các nguồn khác nhau cho các xác suất thực nghiệm và dựa trên ngữ liệu: các phương pháp dựa trên ngữ liệu tốt hơn cho các từ có xác suất thấp và các phương pháp thực nghiệm tốt hơn cho các từ có xác suất cao.
‘Hai điều quan trọng đối với chúng tôi trong công việc này. Đầu tiên, chúng tôi phát hiện ra rằng việc đọc những ngôn ngữ có hình thái phong phú của người bản ngữ liên quan đến khả năng dự đoán ngữ pháp ‘, Anastasiya Lopukhina nói. ‘Thứ hai, các đồng nghiệp, nhà ngôn ngữ học và nhà tâm lý học nghiên cứu dự đoán của chúng tôi có cơ hội đánh giá xác suất từ bằng cách sử dụng ngôn ngữ. Điều này sẽ cho phép họ đơn giản hóa quá trình nghiên cứu một cách đáng kể ‘.
Nguồn: medicalxpress