作者:Анна Кузнецова 3 年以前
255
Цифровизация в лингвистике
Цифровизация в лингвистике
Направление “Big Data”
Неструктурированные данные
Не имеют никакой связанной с ними структуры, либо не организованы в установленном порядке
Полуструктурированные данные
Имеют другие маркеры для отделения семантических элементов и обеспечения иерархической структуры записей и полей
Данные не соответствуют строгой структуре таблиц и отношений
Структурированные данные
Хранящаяся в СУБД информация, файлы CSV или таблицы Excel.
Имеющие связанную с ними структуру таблиц и отношений
Революция Deep Learning
Принцип действия
Обратный проход(backward)
Прямой проход(feed forward)
Сферы применения
Генерация текстов, например, написание стихов.
Интернет-магазины, социальные сети, чат-боты
Машинные переводы с одного языка на другой
Универсальная грамматика
Бихевиористская теория
Изучение универсальных категорий языка.
Функционалистическая теория
Когнитивная грамматика
Описание лексикона и синтаксиса
Рассмотрение когнитивных аспектов языковых явлений
Гипотеза, что грамматика, семантика, лексика существует в континууме, а не как отдельные процессы в целом
Генеративная грамматика
Изучение гипотетической врожденной структуры языка