Badania nad rozwojem mowy i języka przechodzą obecnie rewolucję dzięki postępom w technologii nagrań, analizie akustycznej oraz narzędziom sztucznej inteligencji. Dr Zuzanna Laudańska (Uniwersytet w Heidelbergu i Instytut Psychologii PAN) ze współpracownikami z 10 krajów dokonali systematycznej analizy wpływu tych technologii na ten obszar badań w ciągu minionych 20 lat. Nasza analiza pokazuje, że automatyczne i półautomatyczne narzędzia, takie jak system Language ENvironment Analysis (LENA), stają się coraz częściej wykorzystywane w badaniach nad małymi dziećmi (do 5. roku życia). Co ważne, równolegle rośnie liczba bezpłatnych i otwartych rozwiązań, które oferują nowe możliwości współpracy między ośrodkami naukowymi na całym świecie.

Rys. Przegląd procesu nagrywania i analizy oraz używanych narzędzi. LENA: Analiza Środowiska Językowego (Language Environment Analysis); ALICE: Automatyczny Estymator Liczby Jednostek Lingwistycznych (Automatic LInguistic unit Count Estimator); VTC: Klasyfikator Typów Głosu (Voice Type Classifier); Whisper: sieć neuronowa opracowana przez OpenAI; Praat: oprogramowanie open source.

Jednak mimo rosnącej dostępności technologii, badania pozostają mocno ograniczone przez brak różnorodności. Obecnie dominuje wiedza oparta na badaniach z udziałem dzieci uczących się języka angielskiego w Stanach Zjednoczonych, co tworzy poważne luki w zrozumieniu rozwoju języka w skali globalnej. Konieczne jest rozszerzenie badań o populacje zróżnicowane językowo, kulturowo, geograficznie i społeczno-ekonomicznie, zwłaszcza w krajach o niskim i średnim dochodzie. Przeszkody takie jak ograniczenia finansowe, brak infrastruktury czy niewystarczające szkolenia blokują rozwój w tych regionach.

Kluczowe wnioski:

  • Dominacja anglojęzycznych badań prowadzi do powstania błędnego koła — brak różnorodnych językowo danych utrudnia rozwój narzędzi automatycznych dla innych języków, a brak narzędzi zniechęca badaczy do zbierania nowych danych.
  • Konieczne są celowe działania na rzecz zbierania i udostępniania nagrań w różnych językach oraz inicjatywy szkoleniowe skierowane do badaczy z krajów o niskim i średnim dochodzie.
  • W kontekstach klinicznych większość badań koncentruje się na dzieciach z niedosłuchem lub w spektrum autyzmu. Tymczasem brakuje analiz obejmujących inne populacje, np. dzieci z zaburzeniami językowymi, zaburzeniami genetycznymi czy zespołem Downa.
  • Równolegle, istniejące technologie — zwłaszcza algorytmy oparte na języku angielskim — mają ograniczoną przydatność w innych kontekstach językowych i kulturowych. Nawet narzędzia z otwartym dostępem, choć obiecujące, wymagają zaawansowanych umiejętności programistycznych, co wyklucza część środowiska naukowego i klinicznego.
    Potrzebne są zatem lokalne rozwiązania do przetwarzania danych, zgodne z przepisami o ochronie danych osobowych oraz uproszczone platformy oparte na społecznościach użytkowników.

 

Dalsze kierunki rozwoju:

Coraz większe znaczenie mają badania multimodalne — łączące nagrania dźwiękowe z wideo, sensorami ruchu czy pomiarami fizjologicznymi — które lepiej oddają złożoność środowiska językowego dziecka.

Innowacje, takie jak Whisper (OpenAI), pokazują potencjał rozpoznawania mowy dzieci w trudnych warunkach akustycznych, choć wciąż wymagają dostosowania do charakterystyki dziecięcej mowy.

Wnioski końcowe:
Zebrane dowody jasno wskazują: aby nowe technologie realnie przyczyniły się do budowania globalnych, inkluzywnych teorii rozwoju językowego, konieczne są świadome działania w zakresie różnorodności, etyki i dostępności. Obejmują one nie tylko innowacje technologiczne, ale również otwartość naukową, szersze wsparcie finansowe i międzynarodową współpracę. Tylko wówczas możliwe będzie pełne zrozumienie, jak dzieci na całym świecie uczą się mówić — niezależnie od języka, kraju, kultury czy statusu zdrowotnego.

_____________________
Informacja o publikacji:
Laudańska, Z., Caunt, A., Cristia, A., Warlaumont, A., Patsis, K., Tomalski, P., Warreyn, P., Abney, D. H., Borjon, J. I., Airaksinen, M., Jones, E. J., Bölte, S., Dall, M., Holzinger, D., Poustka, L., Roeyers, H., Wass, S., Zhang, D., & Marschik, P. B. (2025). From data to discovery: Technology propels speech-language research and theory-building in developmental science. Neuroscience & Biobehavioral Reviews, 174, 106199. https://doi.org/10.1016/j.neubiorev.2025.106199

Artykuł został opublikowany w otwartym dostępie w czasopiśmie Neuroscience & Biobehavioral Reviews i można się z nim zapoznać tutaj: https://www.sciencedirect.com/science/article/pii/S014976342500199X?via%3Dihub#sec0095

Artykuł powstał m.in. dzięki wsparciu Europejskiego Programu Współpracy w Dziedzinie Badań Naukowo-Technicznych (Cost Action CA22111) oraz Narodowego Centrum Nauki w ramach grantów PRELUDIUM (kierowniczka: dr Zuzanna Laudańska) i SONATA BIS (kierownik: prof. Przemysław Tomalski).

Skip to content