бөлімдер

Қолданбалы лингвистика бөлімі

Тарихы
Қазақ тіл білімінде Кеңес Одағы кезінде-ақ компьютерлік лингвистика саласының қалыптасуы Қазақ ССР Ғылым академиясының Тіл білімі институтында 1969 ж. өткен «Түркі тілдерін статистикалық және ақпараттық зерттеу» атты Бүкілодақтық ғылыми жиыннан бастау алады. Қазақ тілінің жаңа ғылыми-инновациялық қолданбалы саласы ретінде қалыптастыру мақсатында 1970 ж. математикалық статистика саласының маманы, белгілі математик, ғалым – Қалдыбай Бектаевтың жетекшілік етуімен институтта «Тіл статистикасы және автоматтандыру» атты ғылыми топ құрылды.

Осы кезеңнен бастап, қазақ тілін статистикалық тұрғыдан зерттеу ісі жүйелі түрде қолға алынып, өз нәтижелерін бере бастады. Олардың алғашқысы ретінде 1973 ж. жарық көрген «Қазақ тексінің статистикасы» атты ғылыми жинақты атауға болады. Сонымен қатар, 1973-1974 жж. Одақтық «Тіл статистикасы» тобының ғылыми жетекшісі Раймонд Генрихович Пиотровский мен қазақстандық ғалым Қалдыбай Бектаевтың «Математические методы в языкознании» атты екі бөлімнен тұратын, жоғары оқу орындарына арналған оқу құралының қазақ елінде жарық көруі де осы жаңа саланың жетістігі болды. Сол кездері қазақ тіл білімінің жаңа саласы ретінде статистикалық лингвистиканың проблемалық мәселелері күн санап өсіп, олардың кейбір тұстары анықтала бастады. Солардың бірі қазақ мәтінінің әр әріпке (дыбысқа) шаққандағы ақпараттық өлшемін, яғни энтропияны анықтау болды. Осы орайда аталған ғылыми топ жетекшісі Қ.Бектаев пен оның шәкірті Д.Байтанаеваның қазақ мәтініне қатысты тәжірибелік мәліметтер негізінде жүргізілген ақпараттық-статистикалық ғылыми ізденісінің (1973) орны ерекше.

Сондай-ақ көркем әдебиет, публицистика, ғылыми-техникалық мәтіндер мен екітомдық «Қазақ тілінің түсіндірме сөздігі» (1959, 1961) материалдары бойынша Қ.Бектаевтың ЭЕМ арқылы жасаған қазақ тілі буындарының жиілік сөздігі (1973) қазақ тіл білімінде буынның ішкі құрылымына және сөздің буындық құрылымына ықтималды-статистикалық әдісті қолданған зерттеудің үлгісі болып саналады. Осымен байланысты 1978 ж. жарық көрген Қ.Бектаевтың «Статистико-информационная типология тюркского текста» атты докторлық монографиясы ғалымның қазақ тіл білімінің статистикалық зерттеу саласына қосқан сүбелі еңбегі болды. 1978 ж. отандық түркітану ғылымы үшін орта­ғасырлық жазба ескерткіш «Кодекс Куманикус» мәтіні тұңғыш рет ЭЕМ жадына енгізіліп, ол бойын­ша ЭЕМ көмегімен алынған «Куманша-қазақша жиілік сөздігі» қазақ тіл білімі үшін аса бағалы зерттеу жұмысы болды. Ал 1979 ж. «Ғылым» баспасынан жарық көрген М.О.Әуезовтің «Абай жолы» романының жиілік сөздігі» атты ұжымдық лексикографиялық еңбек те ғылыми топ қызметкерлерінің (А.Жұбанов, А.Зекенова, А.Белботаев, К.Алдабергенова) статистикалық лингвистика саласына қосқан елеулі еңбегінің нәтижесі екендігі даусыз.

70-жылдардан бастау алған статистикалық лингвистика саласы бойынша Тәуелсіздік алғанға дейінгі жарық көрген еңбектер легін төмендегіше санамалап көрсетуге болады: 1) К.Бектаев, А.Жұбанов, С.Мырзабеков, А.Белботаевтың «М.Әуезовтің 20 томдық шығармалар текстерінің сөздігі»; 2) ҚазССР ҒА Тіл білімі институтынан шық­қан «Абай тілі сөздігі» негізінде құрылған әліпбилі-жиілік сөздіктер; 3) А.Ахабаевтың «Қазіргі қазақ газеттері тілінің алфавитті-жиілік сөздігі»; 4) К.Бектаевтың «Қазақ ертегілері мәтіндерінің әліпбилі-жиілік сөздігі»; 5) К.Бектаев, А.Белботаев, К.Молдабековтің «Ғ.Мүсіреповтің «Кездеспей кеткен бір бейне» повесінің негізінде құрастырылған әліпбиліжиілік сөздігі»; 6) А.Белботаевтың «Математика тексінің алфавитті-жиілік сөздігі»; 7) К.Бектаев, Қ.Молдабековтің «Балалар әдебиеті тексінің алфавитті-жиілік сөздігі». «Қазақ тексінің статистикасы» жинағы қазақ тілінің квантитативтік құрылымын сипаттаған түркі тіл­дері бойынша жарық көрген алғашқы зерттеу болды. Қазақ тілінің әртүрлі стильдері бойынша жарық көрген жиілік сөздіктердің ішінде «М.Әуезовтің 20 томдық шығармалар текстерінің сөздігі» мен «Абай тілі сөздігінен» басқалары негізінен 1973 ж. жарық көрген «Қазақ тексінің статистикасы» атты кітапта жинақталған.

Бүгіні
Қазақ елінің тәуелсіздігі жарияланған 1991 ж. А.Байтұрсынұлы атындағы Тіл білімі институтында «Түсіндірме сөздік» бөлімі мен «Тіл статистикасы және автоматтандыру» ғылыми тобы біріктіріліп, «Қолданбалы лингвистика» бөлімі ретінде жаңаша аталып, қайтадан құрылуы бөлімнің ғылыми меңгерушісі болып тағайындалған осы саладағы белгілі ғалым Асқар Құдайбергенұлы Жұбановтың есімімен тығыз байланысты. А. Жұбанов қазіргі қазақ тілінің жаңа саласы – қолданбалы тіл білімінің теориялық және практикалық негізін қалыптастыру мен жаңа деңгейге көтеру жолында табысты жетекшілік етті. Мәселен, өткен ғасырдың 90-шы жылдары 20 томнан тұратын М.Әуезовтің шығармалар жинағы ЭЕМ (Электрондық есептеуіш машина) жадына енгізіліп, соның нәтижесінде 1995 ж.

«М.Әуезовтің 20 томдық шығармалар текстерінің жиілік сөздіктері» жүйесі жарық көрді. Соның негізінде ұлы жазушының тіл байлығы мен стильдік ерекшелігі жайында бірнеше ғылыми зерттеулер жүргізіліп, диссертациялар қорғалды. 1991-1993 жж. аралығында бөлімде «Қазақ тілінің қолданбалы саласындағы проблемалар» атты тақырыпты орындауда филол.ғ.д., профессор Ә.Болғанбаев, А.Жұбанов, Ш.Дәулетқұлов, С.Бизақов сияқты ғалымдар өнімді еңбек етті. Қолданбалы лингвистика бөлімі қазақ тілін автоматтандыру ісінің жаңа сатысына көтеріліп, 1991-1993 жж. «Қазақ тілінің «ҚАЗЫНА» атты автоматтандырылған картотекалық базасын жасау» атты тақырыпты қолға алды.

Көп жылдар бойы жинақталып-теріліп, қазақ тілінің бірден-бір «тіл байлығы» деуге болатындай, институттың «сөз қоржынында» сақталған қазақ тілінің картотекалық қорын сан мен сапа жағынан сұрыптап, компьютер жадына түсіріп, автоматты түрде пайдалану ісі тек бүгінгі таңда ғана емес, қазақ тілінің болашағы үшін де маңызды еді. Қағаз түріндегі кәртішкі-мәнмәтін қордың жалпы көлемі, орташа есеппен алғанда, 5 млн. шамасындай. Осындай үлкен көлемдегі мәнмәтін қорын автоматты жүйеге ауыстырмайынша, оны тілші қауымының ойдағыдай пайдалану мүмкіндігі және үнемі жаңартылып отыруы оңайлыққа түспейтіні белгілі. 1991-1993 жж. аралығында «Қолданбалы лингвистика» бөлімінің қызметкерлері «Қазына» қорына 900 мың кәртішкі-мәнмәтін ішінен 70 мыңдайын сұрыптап алып, оларды компьютер жадына енгізген болатын.

Бастапқы әріптері «А» әрпінен «С» әрпіне дейінгі сөздерге қатысты мәнмәтіндер «Тіл – қазына» компьютерлік базасына енгізіліп, тұтынушы-лексикографтар үшін қажетті деген мәліметті іздеп табу жұмыстары жүзеге асырылды. «Тіл – қазына» атты қазақ тілінің кәртішкімәнмәтіндік компьютерлік базаның негізгі мүмкіндіктерін қысқаша былай көрсетуге болады: – қажетті деген сөзге немесе сөзформаға қатысты кәртішкі-мәнмәтіндерді лезде тауып алып, оларды компьютердің экраны арқылы немесе қағаз бетіне басып шығарып та танысу мүмкіндігі;
– әрбір әріпке байланысты реестрлік сөздік түзілгендіктен, қажет деген сөздер мен оларға қатысты кәртішкі-мәнмәтіндерді лезде іздеп тауып алу мүмкіндігі;
– қажетті деген сөзге немесе сөзформаға (олардың бастапқы, ортаңғы, соңғы бөліктеріне) байланысты кәртішкі-мәнмәтіндерді авторына, шығармасына, баспа аттары мен шыққан жылдарына қатысты іздеп табу мүмкіндігі;
– «Тіл – қазына» компьютерлік базасында кәртішкі-мәнмәтіндерді өңдеуге, өшіруге немесе жаңадан қосуға да мол мүмкіндігі.

Қазақ лексикасының түсіндірме сөздіктері негізіндегі компьютерлік базасын іске қосу мақсатына сай 1968 ж. жарық көрген «Абай тілінің сөздігі» мәтіні (6 мың сөз, 1 мыңдай сөз тіркес), 1999 ж. баспадан шыққан «Қазақ тілінің сөздігі» (50 мың сөз) және 15 томдық «Қазақ әдеби тілінің сөздігі» мәтіні, сол сияқты «Ұлттық идея – Қазақстанның даму негізі» бағдарламасы бойынша: «Қазақ тілінің терминологиялық қорының компьютерлік базасын жасау және оны терминдік әлеуеті жоғары дереккөздермен толықтыру» атты ғылыми-зерттеу жұмысының негізгі нысаны – салалық екітілді (қазақша-орысша, орысшақазақша) терминологиялық сөздіктер мен қазақ тіліндегі салалық терминологиялық түсіндірме сөздіктердің материалдары «Тіл – қазына» компьютерлік базасына жинақталды. 1998 ж. аталмыш бөлім Институттың құрылымдық өзгерістеріне байланысты «Компьютерлік лингвистика» ғылыми тобы деп аталып, Фонетика бөлімінің құрамына енді. Атауы мен мәртебесі өзгергенімен, зерттеу бағыт-бағдары айқын ғылыми топ өз қызметін әрі қарай тиімді жалғастырды. Оның нақты нәтижесі осы ғылыми-зерттеу тақырыптардың жетекшісі А.Жұбановтың «Квантитативная структура казахского текста» (1987) және «Основные принципы формализации содержания казахского текста» (2002) атты докторлық монографиясында жан-жақты көрініс тауып, қазақ қолданбалы лингвистикасының болашақ дамуының бағыттары мен қағидаларын айқындады. Қазақ тіл біліміндегі компьютерлік лингвистиканың теориялық-әдістанымдық негізі ретінде анықталған осы зерттеудің нәтижесінде қазақ тілінің қолданбалы бағыты корпустық лингвистика, компьютерлік, квантитативтік лингвистика сияқты жаңа салалармен толықты.

«Компьютерлік лингвистика» ғылыми тобының негізгі зерттеу бағыты Тәуелсіз еліміздің мемлекеттік тілін қоғамның барлық саласында ғылым тілі ретінде қолдануға бағытталған «компьютерлендіру» ісіне арналды. Қазақ тілінің көптеген кезек күттірмейтін мәселелері, мысалы, лексикография саласы бойынша компьютерлік қор (база) жасау, қазақ мәтіндері корпустарының компьютерлік базасын құрастыру және қолданбалы лингвистика саласының басқа да мәселелері «Компьютерлік лингвистика» ғылыми тобының 2000 жылдардан бастап жүргізген ғылыми ізденістерінен көрініс тапты. Мәселен, 2000-2002 жж. «Қазақ мәтіні мазмұнын формализациялаудың негізгі принциптері», 2003-2005 жж. «Қазақ тілінің сөздіктер және иллюстративті-мәтіндік қорларының көпаспектілі компьютерлік базасы» атта жобалар жүзеге асырылды. «Тәуелсіз Қазақстан жағдайында қазақ тілінің ұлттық және мемлекеттік тіл ретінде негізгі даму үрдістері мен бағыттары» атты іргелі зерттеу бағдарламасы бойынша 2006-2008 жж. жүргізген «Қазақ тілінің компьютерлік базасы: лексикалық қордың ашық жүйесі» атты ғылыми зерттеу жұмысы 2003-2005 жж. жүргізілген зерттеулердің қисынды жалғасы болып саналады. 2006-2008 жж. зерттелген «Қазақ тілінің компьютерлік базасы: лексикалық қордың ашық жүйесі» атты тақырып бойынша жүзеге асырылған зерттеулер нәтижесі жаңа пішіндегі және жаңа мүмкіндіктерге ие болып отырған «Тіл – қазына» атты қазақ тілінің картотекалық және түсіндірме сөздіктері бойынша әрекет ететін компьютерлік базасының мүмкіндіктерінің мол екендігін көрсетті.

Қазақ лексикографиясында қалыптасатын әлемдік дәрежедегі жаңа ақпараттық технологияға сай «Автоматты сөздіктердің» атқаратын міндеті мен құрылымы, қазақ мәтінін автоматты өңдеу, автоматтанған қазақ тіліндегі ақпаратты іздестіру жүйе­­сінің мақсаты мен міндеттерін айқындау және қазақ сөзі деректерінің «Тіл – қазына» атты базасын құру, автоматты жүйелерді құрудың таза инженерлік тұстарымен, яғни компьютерге бағдарлама жасайтын маманға қажетті мәселелерінің теориялық және тәжірибелік тұстарын толық зерттеу нәтижесінде «Тіл – қазына» деректер базасының алгоритмдік құрылымның теориялық негіздері зерттеліп, 2009 ж. тақырып жетекшісі А.Қ.Жұбановтың «Қазақ сөзінің «Тіл – қазына» деректер базасы және оның теориялық негіздері» атты ғылыми монографиясы жарық көрді. 2007-2009 жж. «Қазақ тілінің терминологиялық қорының компьютерлік базасын жасау және оны терминдік әлеуеті жоғары дереккөздермен толықтыру» атты іргелі зерттеу тақырыбы нәтижелі орындалды. 2009-2011 жж.

«Компьютерлік лингвистика» ғылыми тобы қызметкерлері «Мәдени құндылықтар ретіндегі қазақ тіліндегі мәтіндер корпусы және сөздіктердің «Тіл – қазына» атты ұлттық компьютерлік қоры» атты ғылыми-зерттеу тақырыбын өз зерттеу нысаны ретінде алды. Бұл тақырыптың кіріспе бөлімінде әлемдік дәрежедегі компьютерлік мәтіндер корпусын жасаудың теориялық және практикалық жақтарының лингвистикалық және инженерлік деңгейлеріне қатысты мәселелер және корпустық лингвистиканың қазіргі тілтаным парадигмасында алатын орнына байланысты ғылыми тұжырымдарға шолу жасалды (Н.Хомский, АҚШ-тағы Браун корпусы, Бирменгем университеті корпустық лингвистика кафедрасының еңбектері, Ресейдегі В.П.Захаровтың, А.П.Барановтың тұжырымдары және т.б.). Корпустық лингвистиканың жетістіктерін өзіне сақтаған аса дамыған корпус түрі – ұлттық корпус.

Мұндай корпус белгілі дәрежеде ұлттық тілді толық түрде бейнелейді. Ұлттық корпустың репрезентативтілігі (тұлғалылығы) – сол тілдің жазба және сөйлеу түріндегі мәтіндерінің барлық типтерінің бейнеленуі. Ұлттық корпустың айтарлықтай дәрежеде, көлемді (ондаған, жүздеген миллион сөзқолданыс) болуы репрезентативтілікке жетудің қажетті шарты болып саналады. Ұлттық корпустың ажыратылмас бөлігі – оның белгіленген (аннотацияланған, мазмұндалған) бейнесі. Ұлттық корпус ғылыми зерттеулердің түр-түрін жүргізуді қамтамасыз етеді: лексикографияға, жасанды интеллектіге, әдебиеттануға, сөйлеу тілін талдау мен жинақтауға және лингвистиканың барлық салаларына қатысты зерттеу түрлері. Сонымен бірге беделді академиялық сөздіктер мен ғылыми грамматикаларды құрастыру да корпустар негізінде жүзеге асады. Ұлттық корпусты пайдаланушылар – әртүрлі саладағы тілшілер, әдебиеттанушылар, тарихшылар және гуманитарлық білім салаларының өкілдері. Ғалымдар ұлттық корпустың ана тілі мен шет тілін оқытуда, оқулықтар мен бағдарламалар құрастырудағы маңыздылығын аса жоғары бағалайды. «Мәдени құндылықтар ретіндегі қазақ тіліндегі мәтіндер корпусы және сөздіктердің «Тіл – қазына» атты ұлттық компьютерлік қоры» атты тақырып бойынша 2009 жылдан бастап жүргізіліп жатқан ғылыми-зерттеу жұмысының негізгі мақсаты – мәдени құндылықтар ретіндегі әлемдік дәрежедегі компьютерлік мәтіндер корпусын жасаудың лингвистикалық негіздемесін жасау. Ол үшін әлемдік дәрежедегі компьютерлік мәтіндер корпусын жасаудың лингвистикалық деңгейінің теориялық мәселелеріне байланысты материалдарға шолу жасау қажет болды.

Сондықтан да компьютерлік лингвистика ғылыми тобы қызметкерлерінің алдында, ең алдымен, мынадай міндеттер тұрды: – тілдік корпус терминінің мәнін айқындап, оның лингвистикалық табиғатына сипаттама беру; – тілдік корпус жасаудың теориялық негіздемелерімен танысу; – корпус жасаудың лингвистикалық деңгейін компьютерлік (инженерлік) деңгеймен байланыстыра отырып, олардың арақатынасын анықтау (көркем тіл мен техника тілін орайластыру); – мәтіндік бірліктеріне белгі-кодтарды сәйкестендірудің кезеңдік әдіс-тәсілдерін меңгеру, яғни лингвистикалық белгі-кодтарды қоюдың теориялық және практикалық мәселелерін шешу; – морфологиялық талдаудың дәстүрлі принциптеріне сүйене отырып, талдау үлгілеріне шолу жасау; – олардың ең тиімді, соңғы ғылыми жаңалықтармен байытылған нұсқаларын таңдап алу (сөз табы, сөзформалардың құрамына қарай дара және күрделі, деректі, дерексіз, жұрнақ, жалғау және т.б.), морфологиялық (грамматикалық) белгілерді сұрыптау және т.б. Сонымен, 2009 ж. таңдама мәтіндер бойынша тиісті сөзформаларға лингвистикалық ақпарат берудің (белгі-код қоюдың) бірінші кезеңі, яғни мәтінде қамтылған сөзформалардың барлығына жаппай морфологиялық белгі-код қою, ал 2010 жылғы екінші кезеңде жаппай қойылған белгікодтардың омонимдік қатарларын табу мен омоним сөзформалардың лингвистикалық (морфологиялық) сипаттамасын жасау көзделді.

Морфологиялық белгі-кодтар қоюдың принциптері айқындалғаннан кейін, мәтіндер корпусын жасау мақсатында Абай Құнанбаевтың толық шығармалар мәтініндегі, М.Әуезовтің «Абай жолы» романы және Ә.Кекілбаев шығармалары және т.б. мәтіндеріндегі сөзформаларға морфологиялық талдаулар жасалып, оларды таңбалаудың шартты белгілері біріздендірілді. Мәдени құндылықтар ретіндегі қазақ тіліндегі компьютерлік мәтіндер корпусын құрастырудың лингвистикалық деңгейі бойынша М.Әуезовтің 20 томдық шығармалар мәтініндегі және т.б. толық шығармалар жинақтарынан алынған тандама мәтіндеріндегі сөзформаларды сөздерге бөліктеудің, сөздік бірлігіне келтірудің (лемматизациялаудың) программалары және морфологиялық талдау арқылы оларға шартты белгі-кодтар қою әрекеті жүзеге асырылды. 2009-2011 жж. «Компьютерлік лингвистика» ғылыми тобы қызметкерлері «Мәдени құндылықтар ретіндегі қазақ тіліндегі мәтіндер корпусы және сөздіктердің «Тіл – қазына» атты ұлттық компьютерлік қоры» атты ғылыми-зерттеу тақырыбының заңды жалғасы ретінде 2012-2014 жж. «Қазақ әдеби тілінің аннотацияланған ұлттық корпусы», 2015-2017 жж. «Қазақ тілінің ұлттық корпусындағы метамәтіндік белгіленімдер ұстанымдары мен әзірлемесі» деген тақырыптарда зерттеу жүргізді. Зерттеу нәтижесінде Қазақ тілінің ұлттық корпусын құрастырудың алғышарт­­тарын қалыптастырып, метабелгіленіммен және морфологиялық, лексикалық, морфо-семантикалық белгіленімдермен жабдықталған 7 миллионға жуық сөзқолданыстан тұратын бастапқы мәтіндер корпусын жасап, іске қосты. Қазақ тіл білімі үшін корпустық лингвистикаға қатысты көптеген мәселелер арнайы зерттеуді қажет ететіні белгілі.

Оған жататындар: корпустық лингвистика мен оның негізгі ұғымдарының анықтамалары, корпустық лингвистиканың тіл білімі құрылымында алатын орны, әдіс-тәсілдері және т.б. Осы ретте 2017 ж. А.Жұбанов пен А.Жаңабекованың авторлығымен «Корпустық линг­вистика» оқулығы жарық көрді. Оқу құралында мынадай міндеттер көзделеді: оқырмандарды корпустық зерттеулер тарихымен таныстыру; оқырмандарды корпустық лингвистиканың тілдік және программалық құралдарын зерттеуге бағыттау; оқырмандарды корпустық лингвистиканың программалық құралдарымен және ақпараттық ресурстарымен жұмыс істеу дағдысын қалыптастыру; оқырмандарды корпустық деректерге негізделген зерттеулермен таныстыру және нақты тілдік материалдармен корпустар арқылы жұмыс істеудің тез және тиімді жүзеге асатындығын көрсету.

2016 ж. профессор А.Жұбановтың жетекшілігімен бұрын-соңды жарық көрген әртүрлі стильдегі жиілік сөздіктер жинақталып, біртұтас «Қазақ тілінің жиілік сөздігі» құрастырылды. Сондай-ақ 2016 ж. өзге ұлт өкілдеріне мемлекеттік тілді оқыту мақсатында лексикалық минимумдар жасау үшін Білім және ғылым министрі Е.Сағадиев тапсырмасы бойынша Институт А.Фазылжанованың басқаруымен «Жалпы білім берудегі қазақ тілінің жиілік сөздігін» құрастырды. «Жалпы білім берудегі жиілік сөздіктің» мақсаты – тілдегі белсенді сөздік қор шекарасын, сол арқылы қазақ тілін, әсіресе екінші тіл ретінде үйренетіндерге арналған тиімді оқулықтар мен оқу құралдарын, оларға база болатын лексика-грамматикалық минимум әзірлеуге қажетті лексикалық материалды анықтап беру; нәтижесінде Лексика-грамматикалық минимум жасалды. «Жалпы білім берудегі қазақ тілінің жиілік сөздігін» құрастыруға сөздіктің базасына көркем әдебиет, публицистикалық стиль, ғылыми, публицистикалық, сөйлеу стильдер мәтіндері алынды, яғни қазақ тілінің 5 функционалдық стилін қамтиды. 36265 сөзтізбеден (сөз, лексикалық бірлік) тұратын бұл сөздік дәстүрлі жиілік сөздіктер түрлері – үш түрлі құрылымда (Әліпбилі-жиілік сөздік; Жиілікті-әліпбилі сөздік; Кері әліпбиліжиілік сөздік) түзілді. Сонымен қатар әрбір стиль бойынша «Таралым сөздігі» (Распределительный словарь) де жасалды. Сонымен қатар неше түрлі сөз таптары мен стильдер бойынша түрлері, сондай-ақ өте көлемді сөзформалар сөздігі электрондық нұсқада жасалып, кітап сөздікте қалташаға қоса салынып берілді.

Қазақ жазуын латын әліпбиіне көшіру қарсаңында ұлттық пернетақтада қазақ әріптерін тиімді орналастыру үшін Институтқа қазақ әріптерін жиілік талдау жасауды тапсырды. Осы тапсырманы орындау үшін Қолданбалы лингвистика бөлімі қызметкерлері қазақ графемаларына ғана емес, сөзформалардың құрылымдық бірліктерінің барлығының жиілік сөздігін құрастыруды мақсат етті. Нәтижесінде әріп, әріп тіркесі, буын, қосымша, сөз, сөзформаның жиілік сөздіктері құрастырылды. «Қазақ сөзформа құрылымының жиілік сөздіктерінің» мақсаты – қазақ тілін латын қарпіне көшіруге қатысты мәселені шешудің ғылыми-практикалық (лингвостатистикалық негіздерін) алғышарттарын жасау. Нәтижесінде жиілікке негізделген ұлттық пернетақта жасалды. Ұлттық пернетақта жасауға негіз болған әріп, әріп тіркестері, сондай-ақ буын, қосымша, сөз, сөзформа жиілік сөздіктерінің мәліметтеріне статистикалық талдау 2018 ж. «Қазақ жазуын латын қарпіне көшірудің статистикалық негіздері» деген атпен (Монография// А.Жұбанов, А.Жаңабекова, Д.Тоқмырзаев) жарық көрді.

Қорыта айтқанда, Қолданбалы лингвистика бөлімі ХХ ғасырда түркі тілдері бойынша алғаш жиілік сөздіктер құрастырған қазақ лингвостатистикалық зерттеулерінің заңды жалғасы ретінде осы саланың ХХІ ғасырдағы ірі өнімдерінің бірі ретінде әртүрлі мақсатта құрастырылған бірнеше Жиілік сөздік шығарды. Бұл жиілік сөздіктер бүгінгі таңда мемлекеттің тілдің қолданыс аясын кеңейтуде – лексикалық минимум құрастыру, қазақ жазуын латын қарпіне көшіруде – ұлттық пернетақта жасау, емле мәселелерін шешті, әліпби таңдау т.б. мәселелерді шешуде практикалық дереккөз қызметін атқарып отыр.

Болашағы
– Ұлттық корпустарға қойылатын теңгерімділік және ауқымдылық талабына сәйкес Қазақ тілінің ұлттық корпусының мәтін көлемін арттыру және лингвистикалық белгіленімдер түрлерін көбейту, параллель корпустар жасау;
– Ауызша тілдің корпусын, диалектологиялық корпус жасау және т.б.
– Қазақ тілінің ұлттық корпусының іздеу жүйесін көпшілік пайдаланушылар сұранысына, лингвистикалық зерттеулер жүргізу мен әртүрлі практикалық құралдар шығару мақсатында кеңінен пайдалану мүмкіндігін қамтамасыз ету;
– Қазақ тілінде жарық көрген сөздіктердің электрондық базасын жасау;
– Сөйлеуді синтездеу және анализдеу;
– Нейрондық желімен қазақ тілін зерттеу;
– Машиналық аударма т.б.
Ғылыми зерттеулер
– «Қазақ тілінің қолданбалы саласындағы проблемалар» (1991-1993);
– «Қазақ тілінің «ҚАЗЫНА» атты автоматтандырылған картотекалық базасын жасау» (1991-1993);
– «Қазақ мәтіні мазмұнын формализациялаудың негізгі принциптері» (2000-2002);
– «Қазақ тілінің сөздіктер және иллюстративті-мәтіндік қорларының көпаспектілі компьютерлік базасы (Қазақ тілінің лексикалық қорларының компьютерлік базасы)» (2003-2005);
– «Қазақ тілінің компьютерлік базасы: лексикалық қордың ашық жүйесі» (2006-2008);
– «Қазақ тілінің терминологиялық қорының компьютерлік базасын жасау және оны терминдік әлеуеті жоғары дереккөздермен толықтыру» (2007-2009);
– «Мәдени құндылықтар ретіндегі қазақ тіліндегі мәтіндер корпусы және сөздіктердің «Тіл-қазына» атты ұлттық компьютерлік қоры» (2009-2011);
– «Қазақ әдеби тілінің аннотацияланған ұлттық корпусы» (2012-2014);
– «Қазақ тілінің ұлттық корпусындағы метамәтіндік белгіленімдер ұстанымдары мен әзірлемесі» (2015-2017);
– «Ұлттық пернетақта жасаудың лингвотеориялық және практикалық негіздері» (2021).

Тұлғалар
Қалдыбай Бектаев
(27.11.1920-16.10.1996)
Физика-математика ғылымының кан - дидаты, математика профессоры (1976), Шымкент педагогикалық институтының «Математика және информатика» кафедрасының меңгерушісі, Одақтық «Статистика речи» («Сөз статистикасы») тобының «Математикалық лингвистика» саласы бойынша ғылыми жетекшісі болды. Математикалық статистика саласының маманы, белгілі математик-ғалым профессор Қалдыбай Бектаев – ЭЕМ арқылы неше түрлі жиілік сөздіктер алуды автоматтандыру, компьютерлік аударма жасау мәселесін қазақ тіл білімінде тұңғыш көтерген ғалым. Қ. Бектаевтың жетекшілік етуімен 1969 ж. Қазақ ССР Ғылым академиясының Тіл білімі институтында « Түркі тілдерін статистикалық және ақпараттық зерттеу» атты Бүкілодақтық ғылыми фо - рум өтті. Осы форумнан кейін 1970 ж. Тіл білімі институтында « Тіл статисти - касы және автоматтандыру» атты ғылыми топ құрылды. Осы кезеңнен бастап қазақ тілін статистикалық тұрғыдан зерттеу ісі жүйелі түрде қолға алынып, өз нәтижелерін бере бастады. Кеңес Одағы кеңістігіндегі ғылыми конференцияларға кеңінен жол ашылды. Бірнеше жас ғалым статистикалық лингвистика сала - сынан кандидаттық диссертация қорғап, олардың ғылыми мақалалар жинағы, монографиялары, оқу құралдары жарық көрді. Солардың алғашқысы ретін - де 1973 ж. жарық көрген «Қазақ тексінің статистикасы» атты ғылыми жинақты атауға болады. 1978 ж. тілді зерттеу тәжірибесінде әртілді жалпы типологиялық тұрғыдан бағалауда қолданылатын статистикалық критерийлердің үлес салмағын анықтауға арналған Қ. Б. Бектаевтың « Статистико-информационная типология тюркского текста» атты докторлық диссертациясы негізінде жарық көрген мо - нографиясы басылып шықты. Бұл зерттеу түркі мәтіндері үшін ықтималдық және ақпараттық модельдеу әдістерін жүйелі түрде қолдануға арналған болатын. Ғалым түркі тілдерінің типологиялық ерекшеліктерін үндіеуропа тілдерімен салыстыра зерттеуді мақсат етіп қойып, оны формалды статистикалық-ықтималдық әдіс арқылы іске асырды. Қазақ тілінің жаңа салалары – математикалық линг вистика, статистикалық лингвистика, компьютерлік лингвистика бойынша жүргізілген ғылыми зерттеулердің ғылыми ұстазы – Қазақстанның еңбек сіңірген ғылым қайраткері (1980), Халықаралық ақпараттандыру академиясының акаде - мигi, Шымкент қаласының құрметті азаматы, Кембридж биографиялық орталығы кеңесiнiң құрметті мүшесi, Қазақстандық ғалым, физика-математика ғылымының кандидаты, математика профессоры (1976), филология ғылымдарының докторы, математика және информатика кафедрасының меңгерушісі Қалдыбай Бектайұлы Бектаев ҚазССР ҒА Тіл білімі институтында « Тіл статистикасы және автомат - тандыру» ғылыми тобын және ресейлік профессор Р. Г. Пиотровскиймен бірге Бүкілодақтық « Статистика речи» тобын ұйымдастырып, басқарды. Ол – бүкіл түркі тілдеріне алғаш рет лингвистикалық статистика әдісін қолданудың негізін қалаған ғалым. Оның еңбектері инженерлік лингвистика ғылыми бағытының пайда болуы мен дамуына үлкен үлес қосты. Кезінде Қ. Бектаевтың бастамасымен құрылған А. Байтұрысынұлы атындағы Тіл білімі институтындағы « Тіл статисти - касы және автоматтандыру» ғылыми тобының заңды жалғасы – «Қолданбалы линг вистика» бөлімінің қызметкерлері бүгінгі таңда осы саладағы әлемдік деңгейдегі тіл білімінің жаңа бағыты – корпустық лингвистика ғылымы бойынша ғылымизерттеу жұмысын жүргізіп, «Қазақ тілінің Ұлттық корпусын» құрастыру үстінде.
Асқар Жұбанов
(13.11.1937-11.06.2020)
1955-1960 жж. Абай атындағы Қазақ педагогикалық институтының физика-математика факультетін үздік бітірді. 1960- 1961 жж. Қазақ Мемлекеттік ауылшаруашылық институтына жұмысқа орнала сып, жоғары математика кафедрасының ассистент-мұғалімі қызметін атқарды. 1963-1967 жж. Қазақ Мемлекеттік ауылшаруашылық институтындағы жұмысын жалғастырып, жоғары математика кафедрасының ассистент-мұғалімі қызметін атқарады. 1967-1970 жж. Қазақ ССР Ғылым академиясы Тіл білімі институтының күндізгі бөлімінің аспиранты. Аспиранттық кезеңін Минск қаласындағы Шет тілдер институты жанында өткізді. 1970 жылдары Қазақ ССР Ғылым академиясы Тіл білімі институтында жаңадан ашылған «Статистика-лингвистикалық зерттеу және автоматтандыру» тобының кіші ғылыми қызметкері болып жұмысқа орналасты. 1973 ж. физика-математика ғылымдарының кандидаты, филология ғылымдарының докторы Қ. Б . Бектаевтың ғылыми жетекшілігімен, академик І . Кеңесбаевтың ғылыми кеңесшілігімен орындалған «ЭЕМ көмегімен қазақ мәтінін статистикалық зерттеу» атты тақырыпта кандидаттық диссертациясын қорғады. 1976 ж. Қазақ ССР ҒА Тіл білімі институтындағы « Статистика-лингвистикалық зерттеу және автоматтандыру» тобының аға ғылыми қызметкер дәрежесіне конкурс бойынша өтіп, ғылыми жұмысын жалғастырды. 1976-1986 жж. Институттың қоғамдық өміріне қызу қатынасып, Жергілікті комитеттің, Партия бюросының мүшелігіне қабылданып, оның хатшысының орынбасары және Институттың Халықтық бақылау комитетінің төрағасы қызметтерін атқарды. 2002 ж. «Қазақ мәтіні мазмұнын формалдаудың негізгі ұстанымдары» атты тақырыпта докторлық диссертация қорғады. 2004 ж. Жоғары аттестациялық комитеттің шешімі бойынша Тіл білімі мамандығы бойынша « Профессор» ғылыми атағын алды. 2002 ж. А. Байтұрсынұлы атындағы Тіл білімі институтындағы « Компьютерлік лингвистика» ғылыми тобының бас ғылыми қызметкері лауазымына тағайындалды. 7 монографияның, 4 оқу құралының, 200-ге жуық ғылыми еңбектің авторы, 6 жиілік сөздікті құрастырушылардың бірі. 2016 ж. жарық көрген « Жалпы білім берудегі қазақ тілінің жиілік сөздігінің» ғылыми кеңесшісі. А.Қ. Жұбановтың ғы лыми жетекшілігімен 5 кандидаттық және 3 магистрлік диссертация қорғалды.
Зекенова Аманкеш
(17.07.1943)
1960 жылы Қарағанды облысы Жаңаарқа ауданындағы Түгіскен орта мектебін алтын медальмен бітіріп, 1965 жылы Гурьев пединститутының (қазіргі Х . Досмұхамедов атындағы Атырау мемлекеттік университеті) тарих, тіл және әдебиет факультетін үздік тамамдаған. 1965-1975 жж. Түгіскен орта мектебінің мұғалімі, Партия мүшесі, Ауылдық кеңестің депутаты болып қызмет еткен. Одан кейін Жамбыл облысы Байұзақ ауданындағы М.Мәметова атындағы орыс мектебінде ұстаз болған. 1975-1990 жж. Қазақ ССР ҒА Тіл білімі институты (қазіргі А. Байтұрсынов атындағы Тіл білімі институты) аспиранты, «Статистика-лингвистикалық зерттеу және автоматтандыру» бөлімінің кіші ғылыми қызметкері, ғылыми қызметкері болып қызмет атқарған. 1990 жылдан бастап Абай атындағы Алматы мемлекеттік университетінің (қазіргі Абай атындағы Қазақ Ұлттық педагогикалық университеті) аға оқытушысы, доценті ретінде еңбек еткен. 1992 жылы « М . О. Әуезовтің драмалық шығармалары тіліне статистикалық зерттеу» тақырыбында кандидаттық диссертациясын қорғаған, ғылыми жетек - шісі – филол.ғ.д., профессор Қ. Бектаев. 1990-2006 жж. Абай атындағы Қазақ Ұлттық педагогикалық университеті Қазақ тілі кафедрасы, Практикалық қазақ тілі кафедрасының доценті қызметтерін атқарып, «Морфология», «Фонетика», « Статолингвистика», « Практикалық қазақ тілі» пәндерінен сабақ берген. Сонымен қатар, қосымша 1992-1995 жж. №1 қазақ-түрік лицейінің қазақ тілі мұғалімі қызметін атқарған. 2006-2009 жж. Алматы Құрлық әскерлері Әскери институты мемлекеттік тіл кафедрасының доценті болып еңбек еткен. 70-тен астам ғылыми мақалалар, баяндамалар, тезистер мен « М . О. Әуезов драмалық шығармалары тілінің лингвоквантитативтік сипаты» монографиясы (2007 ж.), «Текті бабалар ұрпақтары» (Шежірелік сипаттағы өмірдеректер, 2010 ж.) кітаптарының авторы, А.Байтұрсынұлы атындағы Тіл білімі институтынан 1975-1990 жж. шыққан жиілік сөздік, алфавиттті жиілік сөздік, кері алфавиттік жиілік сөздік сияқты жиілік сөздіктер мен лингвистикалық, статистикалық ғылыми жинақтар авторларының бірі.
Белботаев Алмасбек Батанұлы
(23.05.1949)
Белботаев Алмасбек Батанұлы 1949 жылы мамыр айының 23-і күні Оңтүстік Қазақстан облысы, қазіргі Ордабасы (бұрынғы − Арыс, кейініректе – Бөген) ауданы, Шұбар ауылдық советі, Сарытоғай (бұрынғы − Октябрь) ауылында шаруа отбасында дүниеге келді. 1956 жылы аталған « Октябрь» сегізжылдық орталау мектебінің бірінші сыныбына оқуға барып, 1966 жылы Шұбар ауылындағы В . И . Ленин атындағы орта мектепті бітірген. 1966 жылы Шымкент қаласындағы мұғалімдер даярлайтын педагогикалық институттың филология факультетіне түсіп, 1970 жылы «Қазақ тілі мен әдебиеті» бөлімінде «Қазақ тілі мен әдебиеті пәнінің мұғалімі» мамандығын алды. 1970 жылдың қыркүйегінен 1971 жылдың қаңтарына дейін Оңтүстік Қазақстан облысы Сайрам ауданындағы Кепе-Сарай ауылында № 25 В.Чкалов атындағы сегізжылдық орталау мектебінде қазақ тілі пәнінің мұғалімі, 1971 жылдың ақпан айынан 1993 жылдың қаңтарына дейін А. Байтұрсынұлы атындағы Тіл білімі институтында лаборант, аға лаборант, кіші ғылыми қызметкер, ғылыми қызметкер, аға ғылыми қызметкер болды. 1993 жылдың қаңтарынан 2002 жылдың тамызына дейін Түркістан қаласындағы Қ.Ясауи атындағы Халықаралық қазақ-түрік университетінде алғашында «Қазақ тілі мен әдебиеті», кейін «Қазақ тілі» кафедраларында кафедра доценті қызметін атқарушы, университет дайындық бөлімінің меңгерушісі, факультет деканының орынбасары және қазақ тілі кафедрасының доценті қызметтерін атқарды. 2002 жылдың қыркүйек айынан бүгінгі күнге дейін Тараз қаласындағы А.Ясауи атындағы ХҚТУ-дың Тараз институтында «Қазақ тілі мен әдебиеті» кафедрасының, 2004 жылдан 2007 жылдың қыркүйегіне дейін «Қазақ тілі» кафедрасының меңгерушісі, қыркүйектен кафедра доценті қызметтерін, ал 2008-2009 оқу жылынан бүгінге дейін Тараз инновациялық-гуманитарлық университетінің доценті қызметтерін атқарады. Қазіргі кезде осы университеттің «Филология» кафедрасының доценті. Бұл уақыттар ішінде қоғамдық жұмыстардан – ҚазССР ҒА А. Байтұрсынұлы атындағы Тіл білімі институтында жүргенде – 1971 жылдан бастауыш комсомол ұйымы хатшысының орынбасары, 1994 ж. Түркістан Орталығындағы Х ҚТУ Дайындық бөлімінің меңгерушісі, 2002 ж. Х ҚТУ ТИ Ғылыми кеңес мүшесі, факультет бю - росы және кеңесі мүшесі, 2007-2008 ж. Х ҚТУ ТИ «Қазақ тілі орталығының» жетекшісі, 2008-2009 жылдан 2012 ж. дейін ТИГУ-дың Ректорат, Ғылыми кеңес мүшелері құрамында болып, 2012 жылдан Университет ардагерлер кеңесінің хат - шы. 1992 жылы ф.-м.ғ.к., ф.ғ.д., проф. Қалдыбай Бектайұлы Бектаевтың ғылыми жетекшілігімен «Қазақ текстеріндегі сөз таптарының лингвостатистикалық си - паттамасы» деген тақырыпта кандидаттық диссертация қорғады. 2000 жылы 10 шілдеде Жоғарғы Аттестациялық Комиссияның шешімімен доцент ғылыми атағын алды. 2008 жылдан Қ.Ясауи атындағы Халықаралық қазақ-түрік универ - ситеті Сенатының 2008 жылғы 4 ақпандағы шешімімен (№ 3 хаттама) универ - ситет профессоры академиялық атағы берілді. Қазақстан Республикасы Білім және ғылым министрлігінің ҚҰ РМЕТ ГРАММОТАСЫМЕН, 2013 жылы − «Тараз инновациялық-гуманитарлық университетінің 5 жылдығы», 2018 жылы − « Тараз инновациялық-гуманитарлық университетінің 10 жылдығы» төсбелгілерімен марапатталды. 1916 жылы 19 мамырда Шымкент қаласында өткен ақын, жыршы, айтыскер, батыр Мәделіқожа Жүсіпқожаұлының туылғанына 200 жыл толуына орай ұйымдастырылған « Әділет деп соққан жүрегі...» атты Халықаралық ғылыми-тәжірибелік конференцияда батыр ақын туралы ғылыми баяндама жасап, қорытындысында « Мәделіқожа Жүсіпқожаұлы – 200 жыл (1816-2016)» төс белгісімен және «Алғыс хатпен» марапатталды.
Жаңабекова Айман Әбділдәқызы
(20.01.1972)
1993 ж. әл-Фараби атындағы Қазақ ұлттық университетінің Филология факультетін бітіргеннен кейін, Қызылорда облысы Жаңақорған ауданындағы №169 орыс орта мектебінде қазақ тілі мен әдебиеті пәнінің мұғалімі болып қызмет істеді. 1997 ж. әл-Фараби атындағы Қазақ ұлттық университеті Филология факультеті Қазақ филология сы кафедрасының сырттай бөлім аспиранты, 1998 жылдан бастап күндізгі бөлім аспирантурасында оқыды. 2003 ж. А. Байтұрсынұлы атындағы Тіл білімі институтының Грамматика бөліміне ғылыми қызметкер болып қабылданды. 2004 жылдан 2011 жылға дейін осы бөлімнің аға ғылыми қызметкері. 2011 жылдың қазан айынан бүгінге дейін Компьютерлік лингвистика бөлімінің меңгерушісі. 10-ға жуық монографияның, 100-ден астам мақаланың авторы.

Қолданбалы лингвистика бөлімінде жұмыс істеген қызметкерлер
Бұлбұл Карбозова
(05.02.1983)
2001 ж. әл-Фараби атындағы Қазақ ұлттық университетінің филология факультетіне оқуға түсіп, 2006 ж. университеттің Қолданбалы лингвистика бөлімін үздік дипломмен бітіреді. 2006 ж. ҚР БҒМ ҒК А. Байтұрсынұлы атындағы Тіл білімі институты Компьютерлік лингвистика ғылыми тобына аға лаборант қызметіне қабылданады. 2014-2017 жж. Абай атындағы ұлттық педагогикалық университетте докторантурада оқыды. «Қазақ тілінің жиілік сөздігінің (2016) авторларының бірі. 30-ға жуық ғылыми мақаланың авторы.

Бөлімнің ғылыми қызметкерлері
Бесіров Еркін
(14.12.1983)
2000-2004 жж. әл-Фараби атындағы Қазақ ұлттық университеті филология факультетінің «Аударма ісі» мамандығы бойынша бакалавриатты, 2007-2009 жж. магистратураны бітірді. 2009 ж. ҚР БҒМ ҒК А. Байтұрсынұлы атындағы Тілбілімі институты « Компьютерлік лингвистика» ғылыми тобына кіші ғылыми қызметкер қызметіне қабылданады. 2010 жылдан А. Байтұрсынұлы атындағы Тіл білімі институтынан, жылына төрт нөмірмен жарық көретін «Тілтаным» журналының техникалық редакторы және беттеушісі. «Қазақ тілінің ұлттық корпусын әзірлеу және жасау» жобасына қатысушы.
Барменқұлова Аида Серікханқызы
(03.09.1985)
2002 ж. Абай атындағы Қазақ Ұлттық Педагогикалық университетінің қазақ тілі мен әдебиеті факуль - тетіне түсіп, 2006-2008 жж. Абай атындағы Қазақ Ұлттық Педагогикалық университетінің филология факультеті бойынша магистратураны үздік дипломмен бітіреді. 2011 жылдан бастап А.Байтұрсынұлы атындағы Тіл білімі институтының Компьютерлік лингвистика ғылыми тобына кіші ғылыми қызметкер қызметіне қабылданады. 2021 ж. бастап А. Байтұрсынұлы атындағы Тіл білімі институты мен әл-Фараби атындағы ҚазҰУ-дың бірлескен оқу бағдарламасы бойынша «Филология» мамандығының PhD докторанты.
Қожахметова Ақтоты
(04.04.1984)
2002 ж. әл-Фараби атындағы Қазақ ұлттық университетінің филология факультетіне түсіп, 2007 ж. университеттің Қолданбалы лингвистика бөлімін бітірді. 2007 ж. А. Байтұрсынұлы атындағы Тіл білімі институның Компьютерлік лингвистика бөліміне аға лаборант қызметіне қабылданады. 2007 ж. бастап А. Байтұрсынұлы атындағы Тіл білімі институтының «Қолданбалы лингвистика» бөлімінде қызмет істеп келеді. 2014-2016 жж. Қазақ Ұлттық университетінің және «Ғылым ордасы» кешенінің базасындағы ғылыми-зерттеу институттарының бірлескен білім беру бағдарламасы бойынша «Лингвистика» мамандығы бойынша магистратура - ны бітірді. 2021 ж. бастап А. Байтұрсынұлы атындағы Тіл білімі институты мен әл-Фараби атындағы ҚазҰУ-дың бірлескен оқу бағдарламасы бойынша « Лингвистика» мамандығының PhD докторанты.
Тлегенова Гүлден Бақытқазықызы
(20.03.1988)
2005-2009 жж. әл-Фараби атын дағы Қазақ ұлттық университетінің Филология факультетінің «Филология: қазақ тілі» мамандығын бітірді. 2011-2013 жж. Шет тілдер және іскерлік карьера университетінің «Шет тілі: екі шет тілі» мамандығы бойынша магистратураны үздік бітірді. 2009 ж. А. Байтұрсынұлы атындағы Тіл білімі институтының Этнолингвистика бөлімінің аға лаборант ретінде қызметке қабылданды. 2015 жылдан қазірге дейін Қолданбалы лингвистика бөлімінде кіші ғылыми қызметкер болып жұмыс істейді.2017 ж. бастап А. Байтұрсынұлы атындағы ТБИ мен әл-Фараби атындағы ҚазҰУ-дың бірлескен оқу бағдарламасы бойынша «6D021300- Лингвистика» мамандығының докторанты.
Пірманова Күнсұлу Қамбарбекқызы
(15.09.1994)
2012-2016 жж. Әл-Фараби атындағы Қазақ ұлттық университеті қазақ филологиясының бакалавриатын, 2017-2019 жж. магистратурасын бітірді. 2019 жылдан бастап әл-Фараби атындағы Қазақ ұлттық университетінің Қазақ филологиясы факультетінің PhD докторанты. 2018 ж. бастап А. Байтұрсынұлы атындағы Тіл білімі институты Қолданбалы лингвистика бөлімінің кіші ғылыми қызметкері. Статистикалық, компьютерлік және корпустық лингвистика салалары бойынша шетелдік және қазақстандық ғылыми журналдарға ғылыми мақалалар жариялады, тағылымдамалардан өтті.
Нұрлан Меруерт
(20.09.1998)
2016 ж. Сүлейман Демирель университетінің филология факультетіне түсіп, 2020 ж. университеттің Қазақ филологиясы мамандығын бітірді. 2020 ж. әл-Фараби атындағы Қазақ ұлттық университетінің Компьютерлік лингвистика мамандығы бойынша магистратураға түсті. 2021 ж. Тіл білімі институтының Қолданбалы лингвистика бөліміне аға лаборант ретінде жұмысқа қабылданды.

Қолданбалы лингвистика бөлімінің жарияланымдары
Негізгі жарияланымдар
1. Джубанов А. Х. Квантитативная структура казахского текста (опыт лингвистического анализа на ЭВМ). – Алма-Ата, 1987.
2. Жұбанов Е., Малбақов М. «Қозы Көрпеш – Баян сұлу» эпосының текстологиясы. – Алматы, 1994.
3. Жубанов А. К. Основные принципы формализации содержания казахского текста. – Алматы, 2002.
4. Жұбанов А.Қ. Компьютерлік лингвистикаға кіріспе: Оқу құралы. –Алматы: Қазақ университеті, 2007.
5. Жұбанов А.Қ. Қолданбалы лингвистика: қазақтілінің статистикасы. Оқу құралы. – Алматы: Қазақ университеті, 2007.
6. Жұбанов А.Қ. Қолданбалы лингвистика: формалды модельдер: Оқу құралы. – 2 басылым. – Алматы: Қазақ университеті, 2007.
7. Жұбанов А.Қ. Қолданбалы тіл білімінің мәселелері. Вопросы прикладного языкознания. – Алматы: Арыс, 2008.
8. Жұбанов А.Қ. Қазақ сөзінің « Тіл – қазына» деректер базасы және оның теориялық негіздері. База данных « Тіл – қазына» казахского слова и ее теоретические основы. – Алматы: Арыс, 2009.
9. Жұбанов Қ. Қазақ тілі жөніндегі зерттеулер. – Алматы,1966;1999; 2009.
10. Жұбанов А.Қ. Қолданбалы лингвистика: қазақ тілінің статистикасы // Монография. – Алматы, 2013. – 209 б.
11. Жұбанов А.Қ. Компьютерлік лингвистикаға кіріспе // Монография. – Алматы, 2013. – 204 б.
12. Жұбанов А., Жаңабекова А., Карбозова Б., Қожахметова А. Қазақ тілінің жиілік сөздігі. – Алматы: «Қазақ тілі» баспасы, 2016. – 665 б.
13. Жұбанов А., Жаңабекова А. Корпустық лингвистика / Оқу құралы – Алматы: «Қазақ тілі» баспасы, 2017. – 336 б.
14. Жұбанов А., Жаңабекова А. Корпустық лингвистика. – Алматы: «Қазақ тілі» баспасы, 2017. – 336 б.
15. Жұбанов А., Жаңабекова А., Тоқмырзаев Д. Қазақ жазуын латын қарпіне көшірудің статистикалық негіздері (статистикалық жинақ). – Алматы: «А. Байтұрсынұлы атындағы Тіл білімі институты» баспасы, 2018. ISBN 978- 601-7293-62-8.
16. Жұбанов А., Жаңабекова А., Тоқмырзаев Д. Қазақ сөзформа құрылымының жиілік сөздіктері. – Алматы: А. Байтұрсынұлы атындағы Тіл білімі институты, 2018. – 552 б.
17. Жубанов А. К., Садыков Т. С., Сиразитдинов З.А. Синтез тюркской словоформы/ Монография. – Алматы, 2019. – 248 стр.
18. Жұбанов А., Жаңабекова А., Тоқмырзаев Д . О., Өтегенова Б. Қазақ ауызша тіл мәтіндерінің жиілік сөздігі // Монография. – Алматы, 2020. – 168 б.
19. Пірманова К., Жаңабекова А. Қазақ тілі мәтіндер корпусындағы сөзжасамдық белгіленімдер әзірлемесі. – Алматы, 2021. – 109 бет.
20. Жұбанов А. «Адам-компьютер-адам» жүйесіндегі табиғи тіл қызметінің ерекшеліктері // ҚР ҰҒА-ның Хабарлары. Тіл, әдебиет сериясы. 2003. № 4, 3-11 б.б.
21. Жұбанов А. Мәтін абзацтарын заттық-логикалық мазмұн тұрғысынан зерттеу// ҚР БҒМ мен ¥ ҒА Хабарлары, тіл, әдебиет сериясы, 2004, №4 (146). 21-28 бб.
22. Жұбанов А. Оқу лексикографиясының ғылыми пән ретіндегі ерекшелігі // ҚР ҰҒА Хабарлары. Филология сериясы. 2006, №5. 20-25 б.б.
23. Жұбанов А. Қазақ жазба мәтіндеріндегі графема қолданысының статистикасы// ҚР БҒМ мен ҰҒА Хабарлары. Тіл, әдебиет сериясы. 2007, №5, 28-32 б.б. ( Е . Жұбановпен бірге).
24. Жұбанов А. Қазақ тілінің « Тіл – қазына» атты ұлттық компьютерлік қорының мүмкіндіктері жайында // ҚР ҰҒА Хабарлары. Филология сериясы. 2008, №2. 19-23 б.б.
25. Жұбанов А. Жаңа ақпараттық технологияға көшу жағдайындағы қазақ лексикографиясы // ҚР ҰҒА Хабарлары. Филология сериясы. 2008, №5. 14-18 б.б.
26. Құлманов С.Қ. Мәтіндер корпусы негізінде қазақ тілінің грамматикалық сөздігін түзудің практикалық аспектілері // ҚР ҰҒА Хабарлары. – Алматы, 2011. №2.
27. Жаңабекова А. Ә., Карбозова Б. Тілдік корпустар жасауға қажетті негізсөздер сөздігін автоматты жолмен алудың практикалық мәселелері // « Білім беру жүйесінде кәсіби бағытты жүзеге асырудың өзекті мәселелері» атты ғылыми мақалалар жинағы. – Алматы: Інжу-Маржан, 2013. – 262 б. – 33-37 бб.
28. Карбозова Б. Мәтін ішіндегі лексикалық омонимдерді зерттеуде статистикалық әдістің рөлі // Материалы «Актуальные проблемы современных наук – 2013». – С. 29-32. – Польша, 2013
. 29. Жұбанов А., Жаңабекова А. Қазақ жазба мәтіндеріндегі әріп қолданысының статистикасы/ Қазақстан ғылымы мен өмірі» халықаралық ғылыми-көпшілік журнал ( Ж А К). – Астана, 2017.
30. Жұбанов А., Карбозова Б. Инженерлік тіл білімінің жалпы тіл теориясына қатысты атқаратын кейбір қызметтері/ Қазақстан ғылымы мен өмірі» халықаралық ғылыми-көпшілік журнал ( Ж А К). – Астана, 2017.
31. Жаңабекова А., Пірманова К. Технология программы полуавтоматической метаразметки казахского национального корпуса. Актуальные проблемы современной лингвистики и гуманитарных наук: сборник статей ХІ Всероссийской научно-методической конференции с международным участием. Москва, 15 марта 2019 г. – Москва: РУДН, 2019. – 727 с.: ил. ISBN 978-5-209-09321-3
32. Жаңабекова А., Пірманова К. Разработка программы словообразовательных разметок в корпусе текстов казахского языка. Языковые процессы и функционирование языков в поликультурном пространстве [электронный ресурс] : материалы Международной научно-практической конференции, посв. 75-летию Филиппова Гаврила Гаврильевича, г. Якутск, 28 марта 2019 г. / [под ред. А. Е. Шамаевой, А. К. Прокопьевой]. – Якутск: Издательский дом СВ ФУ, 2019. – 1 электр. опт. диск. ISBN 978-5-7513-2787-3
33. Жұбанов А., Жаңабекова А. Ұлттық қазақ әліпбиін пернетақтада орна ластырудың статистикалық негіздері //Қ.Шаяхметов атындағы «Тілқазына» ғылыми-практикалық орталығының журналы/ Тіл және қоғам. №1 (51), 2020.
34. Жұбанов А., Тоқмырзаев Д . О., Пірманова К.Қ. Қазақ тілінің мәтіндер корпу - сы – қазақ тілін зерттеудің жаңа (парадигмасы) үлгісі // Туған тіл альманахы ( Еларалық, қоғамдық-саяси, әдеби-ғылыми альманах) Туған тіл №1 (42), 2020. – 84-89 бб.
35. Жаңабекова А. Латын графикалы қазақ ұлттық пернетақтасын құрастырудың лингвостатистикалық негіздері. Восьмая Международная конференция по компьютерной обработке тюркских языков «TurkLang-2020». ( Труды конфе - ренции). Уфа: ИИЯЛ УФИЦ РАН, 2020. – 286 с. ISBN 978-5-91608-199-2
36. Пірманова К. О национальных корпусах казахского языка. Восьмая Между народная конференция по компьютерной обработке тюркских языков «TurkLang-2020». ( Труды конференции). Уфа: ИИЯЛ УФИЦ РАН, 2020. – 286 с. ISBN 978-5-91608-199-2
37. Жұбанов Е.Қ. Ауызекі поэзия тілін зерттеудің лингвистикалық аспектілері // Қазақ ССР Ғылым академиясының Хабаршысы. 1977, № 4. 61-68 б.б.
38. Жаңабекова А. Ә., Пірманова К.Қ. Қазақ тілі мәтіндер корпусындағы сөзжасамдық белгіленімдер қою бағдарламасы //Қазақстанның ғылымы мен өнері №5. – Астана, 2019. – 154-158 бб.
39. Жаңабекова А. Ә., Жиілік сөздіктердің мемлекеттік тілдің қолданысындағы маңызды орны // Наука и жизнь Казахстана. – 2020. – №4/2. 269-275 бб. ( Б.Өтегеновaмен бірге)
40. Жаңабекова А., Пірманова К. Орыс тілінің ұлттық корпусының сөзжасамдық белгіленімі: міндеттері мен әдістері. Абай атындағы ҚазҰПУ Хабаршысы №4 (70), 2019
41. Пірманова К., Жаңабекова А. Қазақ тілінің ұлттық корпусындағы жартылай сөзжасамдық қызмет атқаратын -лы/-лі, -ша/-ше, -ғы/-гі қосымшалары. Абай ат. ҚазҰПУ Хабаршысы №4 (70), 2019.
42. Жаңабекова А., Пірманова К. «Қазақ тілінің мәтіндер корпусының» жұмыс істеу механизмдері. Вестник Академии Педагогических Наук Казахстана, №3 (май-июнь), 2020 год.
43. Пірманова К., Тоқмырзаев Д. Технология программы полуавтоматической метаразметки и принципы автоматизации морфологической разметки текстов национального корпуса казахского языка. Абай атындағы ҚазҰПУ Хабаршысы №4 (74), 2020.
44. Жаңабекова А. Жиілік сөздіктердің мемлекеттік тілдің қолданысындағы маңызды орны. Қазақстанның ғылымы мен өмірі. 4/2. 2020.
45. Жаңабекова А. Қазақ лингвистерінің ерекше міндеттерінің бірі – ұлттық қазақ тілі корпусын құрастыру. Абай атындағы ҚазҰПУ Хабаршысы №3 (61), 2017.
46. Жаңабекова А., Пірманова К. Разработка лексико-семантической разметки в Национальном корпусе казахского языка. TÜRKOLOGİYA, №2, 2020 жыл, Азербайджан.
47. Жубанов А. Статистическое исследование казахского текста на уровне абзацев // Тілтаным. 2001. №2. – С. 35-41.
48. Жубанов А. К. Формальное описание словарной статьи автоматического словаря казахского языка (АСКЯ) // Тілтаным. 2002. №2. – С. 26-40.
49. Жұбанов А. Компьютерлік лингвистика және қазіргі қазақ тіл білімі// Тілтаным. 2003, № 3(11). 28-36 б.б.
50. Жұбанов А. Құдайберген Жұбанов зерттеулеріндегі модельдеу әдісінің көрінісі // Тілтаным. 2006, № 1, 3-9 б.б.
51. Жұбанов А. Ғылыми-техникалық лексикография және арнаулы сөздіктер түрлері // Тілтаным (Языкознание). А. Байтұрсынұлы атындағы Тіл білімі институты, Алматы.2006, №2, 146-153 бб.
52. Жұбанов А. Автоматтанған оқу жүйесінің негізгі ұстанымдары // Тілтаным. 2006, №4, 186-191 б.б.
53. Жұбанов А. Есептеуіш лексикография – қазақ тіл білімінің жаңа ғылыми бағыты // Тілтаным. 2008, №2, – 58-63 бб.
54. Жұбанов А. Корпустық лингвистика – қазақ тіл білімінің жаңа бағыты // Тілтаным. 2009 жыл, №2 (34) – 3-11 бб.
55. Жаңабекова А. Тілдік корпус ұғымының мәні, сипаттамасы // Тілтаным, 2009. №4.
56. Карбозова Б. Қазақ тілі мәтіндер корпусындағы омонимдер мәселесі // Тілта - ным. 2011, №4.
57. Құлманов С.Қ. Қазақ тілі мәтіндері корпусы – қазақ тілінің жиілік сөздіктерін, грамматикалық сөздігін, екітілді аударма сөздіктер жасаудың негізі // А. Байтұрсынұлы атындағы Тіл білімі институтының « Тілтаным» журналы. – Алматы, 2011. №2.
58. Жұбанов А.Қазақ тілінің аннотацияланған мәтіндер корпусындағы етістік сөздерге лексика-морфологиялық белгі-код қоюдың (белгіленім) алғышарттары // Тілтаным. – Алматы, 2012. – № 1. – 18-25 бб.
59. Бесіров Е. Корпустық лингвистика және корпустар // Тілтаным. – Алматы, 2012. – №2. – 200-206 бб.
60. Жұбанов А.Қ. Қазақ тілінің мәтіндер корпусы – қазақ тілін зертеудің жаңа (парадигмасы) үлгісі // Тілтаным. – Алматы, 2013. № 3.
61. Жұбанов А.Қ. «Қазақ әдеби тілінің жиілік сөздігін» құрастырудың теориялық негіздері // Тілтаным. – Алматы, 2013. № 2.
62. Жұбанов А. Түркі тілдерінің көпаспектілі компьютерлік қорын құру қажет // А.Байтұрсынұлы атындағы Тіл білімі институтының 50 жылдығына арналған «Қазақ тіл білімі: тарих, тәжірибе, болашақ» атты халықаралық ғылымитеориялық конференция материалдары. – Алматы, 2011. – 10 б.
63. Жұбанов А. Мәтіндер корпусы – лингвистер үшін ас күшті ақпараттық ресурс //«Фонетика ғылымдарының өзекті мәселелері: даму көздері мен болашағы» атты халықаралық ғылыми-теориялық конференция материалдары. – Алматы, 2012. – 186-193 бб.
64. Жаңабекова А. Қазақ әдеби тілінің аннотацияланған мәтіндер корпусына морфологиялық білімдер жүйесін енгізудің практикалық тәжірибелері және оларды оқыту жүйесіне енгізудің ғылыми-әдістемелік негіздері // «Қазақ тіл білімі: жаңа ғылыми парадигмалар мен оқытудың инновациялық технологиялары» атты халықаралық ғылыми-теориялық конференция материалдары. – Алматы, 2012. – 197-201 бб.
65. Жаңабекова А. Ұлттық корпус дегеніміз не? // «Мәдениеттер тоғысындағы тіл, әдебиет, аударма және журналистика мәселелері» атты халықаралық ғылымипрактикалық конференция материалдары. – Алматы, 2012. – 1Т. – 57-61 бб.