ҚОЛДАНБАЛЫ ЛИНГВИСТИКА БӨЛІМІ

ҚОЛДАНБАЛЫ ЛИНГВИСТИКА БӨЛІМІНІҢ ТАРИХЫ

Қазақ КСР Ғылым академиясының Тіл білімі институтында статолингвистика саласының белгілі ғалымы Қалдыбай Бектаевтың жетекшілік етуімен 1970 жылы құрылған «Тіл статистикасы және автоматтандыру» атты ғылыми топ өз бастауын 1969 жылы өткен «Статистическое и информационное изучение тюркских языков» атты Бүкілодақтық ғылыми жиыннан алады. Осы кезеңнен бастап қазақ тілін статистикалық тұрғыдан зерттеу ісі жүйелі түрде қолға алынып, өз нәтижелерін бере бастады. Олардың алғашқысы ретінде 1973 жылы жарық көрген «Қазақ тексінің статистикасы» атты ғылыми жинақты атауға болады. Сонымен қатар 1973-1974 жж.  Р.Г. Пиотровский мен Қ.Б. Бектаевтың «Математические методы в языкознании» атты екі бөлімнен тұратын, жоғары оқу орындарына арналған оқу құралының жарық көруі де осы жаңа саланың жетістігі саналады.

Статистикалық лингвистика қазақ тіл білімінің жаңа саласы ретінде қалыптасқандықтан, оның проблемалық мәселелері күн санап анықтала бастады. Солардың бірі қазақ мәтінінің әр әріпке (дыбысқа) шаққандағы ақпараттық өлшемін, яғни энтропияны анықтау болды. Осы орайда белгілі ғалым Қ.Б. Бектаев пен оның шәкірті Д.А. Байтанаеваның қазақ мәтініне қатысты тәжірибелік мәліметтер негізінде жүргізілген ақпараттық-статистикалық ғылыми ізденісінің (1973) орны ерекше. Сондай-ақ көркем әдебиет, публицистика, ғылыми-техникалық мәтіндер мен 2 томдық «Қазақ тілінің түсіндірме сөздігі» (1959, 1961) материалдары бойынша Қ.Б. Бектаев ЭЕМ арқылы жасаған қазақ тілі буындарының жиілік сөздігі (1973) буынның ішкі құрылымына және сөздің буындық құрылымына ықтималды-статистикалық әдісті қолданған зерттеулердің көрнектісі деп айта аламыз.

Аталмыш топқа жетекшілік еткен Қ.Б. Бектаевтың 1978 жылы басылып шыққан «Статистико-информационная типология тюркского текста» атты монографиясы қазақ тіл білімінің статолингвистика саласына қосылған сүбелі еңбек қана емес, сондай-ақ басқа да тілдерді зерттеу тәжірибесінде әр тілді жалпы типологиялық тұрғыдан бағалауда қолданылатын статистикалық критерийлердің үлес салмағын «өлшеуге» арналған іргелі ғылыми зерттеу ретінде мойындалады.

«Тіл статистикасы және автоматтандыру» ғылыми тобының зерттеу нысанына негізінен статистикалық құрал ретінде электронды-есептеу машиналары (ЭЕМ) көмегімен жасалатын әліпби-жиілік сөздік, жиілік сөздік және кері әліпби жиілік сөздіктер материалдары алынды.

1978 жылы отандық түркітану ғылымы үшін ортағасырлық жазба ескерткіші «Кодекс Куманикус» мәтіні тұңғыш рет ЭЕМ жадына енгізіліп, ол бойынша автоматты түрде «Куманша-қазақша жиілік сөздігінің» алынуы қазақ тіл білімінің тарихы үшін елеулі оқиға деуге болады. Ал 1979 жылы «Ғылым» баспасынан жарық көрген М.О. Әуезовтің «Абай жолы» романының жиілік сөздігі» атты ұжымдық монография ғылыми топ қызметкерлерінің статистикалық лингвистика саласына қосқан айтулы еңбегінің нәтижесі екендігі даусыз. Бұл еңбекті жасауға филол.ғ.к., жетекші ғылыми қызметкер А.Қ. Жұбанов, кіші ғылыми қызметкерлер А.Р.Зекенова, А.Б.Белботаев, К.Алдабергенова қатысты.

1991 жылы «Тіл статистикасы және автоматтандыру» ғылыми тобы мен «Түсіндірме сөздік» бөлімі біріктіріліп, Қолданбалы лингвистика бөлімі болып аталып, ғылыми қызметі мен зерттеу нысандарын кеңейте түсті. Қолданбалы лингвистика бөлімінің меңгерушісі ретінде тағайындалған, кейін компьютерлік лингвистика ғылыми тобына жетекші болып қазірге дейін өнімді етіп келе жатқан филология ғылымдарының докторы, профессор А.Қ. Жұбановтың зерттеулерін қазіргі қазақ қолданбалы лингвистикасының бастауы десек артық айтқандық болмас. Ғалымның басшылығымен 90-шы жылдары М. Әуезовтің толық шығармалар жинағы ЭЕМ жадына енгізіліп, нәтижесінде 1995 жылы «М. Әуезовтің 20 томдық шығармалар текстерінің жиілік сөздіктері» атты жиілік сөздіктер жүйесі жарық көргендігі бұл сөзімізге дәлел бола алады.

Осы орайда қолданбалы лингвистика бөлімі қазақ тілін автоматтандыру ісінің жаңа сатысына көтеріліп, 1991-1993 жылдары «Қазақ тілінің «ҚАЗЫНА» атты автоматтандырылған картотекалық базасын жасау» атты тақырыпты қолға алғандығы қазақ тіл білімінде ғана емес, түркі тіл біліміндегі орасан зор жаңалық болды деп ауыз толтырып айта аламыз. Осы жылдары бөлім қызметкерлері Институтта жасалып жатқан «Қазақша-орысша сөздікті» дайындауға барынша атсалысты. Сонымен бірге қазақстандық статистика саласының ғалымдары тіл ерекшелігін мәтіндердің жанрлық (стильдік) түрлеріне қарай ажыратуды мақсат ете отырып, балалар әдебиеті мен бастауыш сыныптарының оқулықтарына, драмалық шығармаларға, газет тіліне, ғылыми-техникалық стиль, математикалық стиль тілдеріне және т.б. статистикалық жолмен зерттеу жүргізе бастады және мұндай зерттеулер күні бүгінге дейін жалғасын тауып отыр.

1991-1993 жылдар аралығында бөлімде «Қазақ тілінің қолданбалы саласындағы проблемалары» атты тақырыпты орындауда филол.ғ.д., профессор Ә.Болғанбаев, А.Жұбанов, Ш.Дәулетқұлов, С.Бизақов сияқты ғалымдар өнімді еңбек етті.

1998 жылы аталмыш бөлім Институттың құрылымдық өзгерістеріне байланысты «Компьютерлік лингвистика» ғылыми тобы деген атауға ие болды. Атауы мен мәртебесі өзгергенімен, зерттеу бағыт-бағдары айқын Ғылыми топтың өз қызметін әрі қарай тиімді жалғастыруына осы топқа жетекшілік етіп келе жатқан филология ғылымдарының докторы, профессор А.Қ. Жұбановтың  «Квантитативная структура казахского текста» (1987) және «Основные принципы формализации содержания казахского текста» (2002) атты монографиялары қазақ қолданбалы лингвистикасының  дамуына қосылған елеулі үлес болды. Бірінші аталған ғылыми еңбекте қазақ тіліндегі мәтіндерді автоматты түрде электронды-есептеу машиналары (ЭЕМ) арқылы статистикалық әдіспен зерттеу мүмкіндігі мен сөз таптарының ықтималды-үлестірімді заңдылықтары зерттелсе, екінші монографияда қазақ мәтінінің мәтін лингвистикасы тұрғысынан мазмұнын формальдау жолдары және мәтіннің туындау (порождение) проблемалық мәселелері қарастырылады.

Сонымен, 1970-2000 жылдар аралығындағы ғылыми ізденістер, негізінен, жеке автор шығармаларын, функционалдық стильдерді, сондай-ақ толық әдеби тіл қамтылған мәтіндерді статистикалық әдіс-тәсілдермен зерттеу тәжірибесінде әртүрлі жиілік сөздіктер жасаудың өзекті (актуалды) мәселе екендігін көрсетті. Себебі олардың негізінде аса маңызды және күрделі мәселелерді: тілді лексика-грамматикалық нормалауға, түркі тілдерін өзара салыстырмалы-типологиялық зерттеуге және олардың компьютерлік қорын жасауға зор мүмкіндік жасады.

Қазақ тілінің көптеген кезек күттірмейтін мәселелері, мәселен, лексикография саласы бойынша компьютерлік қор (база) жасау, қазақ мәтіндері корпустарының компьютерлік базасын құрастыру және қолданбалы лингвистика саласының басқа да мәселелері «Компьютерлік лингвистика» ғылыми тобының 2000 жылдардан бастап жүргізген ғылыми ізденістерінен көрініс тапты. Мәселен, 2000-2002 жылдары «Қазақ мәтіні мазмұнын формализациялаудың негізгі принциптері», 2003-2005 жылдары «Қазақ тілінің сөздіктер және иллюстративті-мәтіндік қорларының көпаспектілі компьютерлік базасы (Қазақ тілінің лексикалық қорларының компьютерлік базасы)», 2006-2008 жылдары «Қазақ тілінің компьютерлік базасы: лексикалық қордың  ашық жүйесі», 2007-2009 жылдары «Қазақ тілінің терминологиялық қорының компьютерлік базасын жасау және оны терминдік әлеуеті жоғары дереккөздермен толықтыру» атты іргелі зерттеу тақырыптары нәтижелі орындалды. Соңғы жылдары Компьютерлік лингвистика ғылыми тобы 2009-2012 жж. «Мәдени құндылықтар ретіндегі қазақ тіліндегі мәтіндер корпусы және сөздіктердің «Тіл – қазына»  атты ұлттық компьютерлік қоры», 2012-2015 жж. «Қазақ тілінің аннотацияланған ұлттық корпусы», 2015-2017 жж. «Қазақ тілінің ұлттық корпусындағы метамәтіндік белгіленімдер ұстанымдары мен әзірлемесі» атты тіл біліміндегі жаңа сала – корпустық лингвистика мәселелерімен айналысуда.

2018 ж. «Латынграфикалы жаңа ұлттық әліпби негізінде қазақ жазуын жаңғыртудың ғылыми-лингвистикалық базасын әзірлеу» тақырыбы бойынша жұмыс жүргізілді. Зерттеу нәтижесінде заманауи қазақ мәтіндеріндегі дыбыстардың, графемалардың және элементтердің статистикасы айқындалып, лингвостатистикалық жинақ дайындалды. Қазақ мәтіндерін кирилл графикасынан латын негізді жаңа әліпбиге қайта кодтауға арналған ІТ-қосымшасы әзірленді. Қазақ тілінің ұлттық корпусындағы көркем мәтіндердің шағын корпусы әзірленіп, жасалды.

Қазіргі таңда «Қолданбалы лингвистика» бөлімінде бас ғылыми қызметкер, ф.ғ.д. профессор Жұбанов Асқар Құдайбергенұлы, бөлім меңгерушісі ф.ғ.д. Жаңабекова Айман Әбділдақызы, кіші ғылыми қызметкерлер, магистр Қожахметова Ақтоты Қожахметқызы, докторант Тлегенова Гүлден Бакытказыевна, аға лаборанттар, магистранттар Пірманова Күнсұлу Қамбарбекқызы, Мурсал Әйгерім қызмет етеді.

Бөлім қызметкерлері: