Направления дальнейшего исследования

Не смотря на то, что изначальные исследовательские цели проекта не финализированы на данном этапе, работа над проектом проявила множество особенностей обрабатываемых текстов.

Мы прояснили специфику текстов Цветной Триоди, важность цветовой разметки для определения внутренней структуры текстов, оценили эффективность работы готовых инструментов-элайнеров, провели серию экспериментов по лемматизации билингвального корпуса, а также отметили наиболее проблемные аспекты и предложили идеи для поиска решений.

Проект продолжается.

Мы – Настя и Лев – продолжаем исследовать изложенные в этом описании методы и инструменты, а также искать новые решения, которые могут приблизить проект к искомому результату.

Что дальше?
  • использование мультиязычных моделей трансформеров с дообучением
  • оптимизация алгоритма проверки качества сведения текстов
  • выравнивание текстов Цветной Триоди с оценкой качества
  • публикация параллельного корпуса на самостоятельной платформе или интеграция в Liturcorpora