作者:Анна Кузнецова 3 年以前
 284
 
                     
                    
                        Цифровизация в лингвистике
                        
                        
                            
                            
                         
                     
                 
             
            
                
                    
                    Цифровизация в лингвистике
Направление “Big Data”
Неструктурированные данные
Не имеют никакой связанной с ними структуры, либо не организованы в установленном порядке
Полуструктурированные данные
Имеют другие маркеры для отделения семантических элементов и обеспечения иерархической структуры записей и полей
Данные не соответствуют строгой структуре таблиц и отношений
Структурированные данные
Хранящаяся в СУБД информация, файлы CSV или таблицы Excel.
Имеющие связанную с ними структуру таблиц и отношений
Революция Deep Learning
Принцип действия
Обратный проход(backward)
Прямой проход(feed forward)
Сферы применения
Генерация текстов, например, написание стихов.
Интернет-магазины, социальные сети, чат-боты
Машинные переводы с одного языка на другой
Универсальная грамматика
Бихевиористская теория
Изучение универсальных категорий языка.
Функционалистическая теория
Когнитивная грамматика
Описание лексикона и синтаксиса
Рассмотрение когнитивных аспектов языковых явлений
Гипотеза, что грамматика, семантика, лексика существует в континууме, а не как отдельные процессы в целом
Генеративная  грамматика
Изучение гипотетической врожденной структуры языка