Впредь можно будет легко выявить случаи скачивания и выдачи за свою собственную работу готового и/или переведенного с любого иностранного языка материала из Интернета.
Подобными ухищрениями частенько пользовались и продолжают активно пользоваться, в частности, недобросовестные учащиеся вузов. Ситуация затрудняется еще и тем, что обнаружить такой плагиат довольно сложно или практически невозможно, отчасти благодаря услуге онлайн-переводчиков.
Группа во главе с Альберто Баррон-Седеньо (Alberto Barron-Cedeno) из Политехнического университета Каталонии, Испания, использовала ряд статистических методов для проверки подозрительных документов.
Один из методов предполагает разбивку текста на фрагменты из 5 предложений и выявление слов, одинаковых на обоих языках.
При другом способе используется двуязычный словарь для автоматической проверки количества совпадений одинаковых слов или терминов. Более того, с целью упрощения процесса проверки данный метод позволяет переводить документы на языки родственной группы.
Результаты исследований удивили даже самих авторов. Разработанная ими техника позволила не только выявить все скопированные документы, но и обнаружить выделенные в текстах фрагменты, где было зафиксировано чрезмерное злоупотребление перефразировки оригинала.
Специалистам лучше присмотреться к текстам и документам, которые отмечает система.
Далее: Ажиотажный запуск GTA V подорван ранней утечкой файлов