Академическое издательство Springer представило свою новую разработку — компьютерную программу SciDetect, которая призвана выявлять научные тексты, созданные в автоматическом режиме. Авторы нового инструмента уверены, что так удастся противостоять распространившейся моде на создание искусственных академических текстов, в шутку либо для реальных целей. Пресс-релиз о новой программе опубликован на сайте издательства, о разработке также пишет сайт журнала Science.
Создателем программы выступила команда разработчиков Labbé. Метод, использованный в программе, похож на технологию, используемую почтовыми серверами для распознавания спама, только сами грамматические образцы используются в данном случае иные.
Мода на такие специфические академические шутки началась в 2005 году, когда три аспиранта Массачусетского технологического института создали программу SCIgen, которая умела автоматически генерировать наукообразные тексты по компьютерным наукам. С тех пор аналогов это программе появилось еще несколько. Ученые периодически развлекаются, отправляя такие статьи в рецензируемые научные журналы или как тезисы для выступления на конференции.
Одним из самых известных случаев была «статья», названная «Rooter: A Methodology for the Typical Unification of Access Points and Redundancy», которая была принята WMSCI к публикации без рецензирования статьи, а авторы приглашены на конференцию. После этого «авторы» сообщили о своей шутке, так что конференция WMSCI лишилась финансовой поддержки со стороны IEEE.
Эта же статья прославилась и в России: в сентябре 2008 года она — под заглавием «Корчеватель: Алгоритм типичной унификации точек доступа и избыточности» — вышла в издававшемся в Курске «Журнале научных публикаций аспирантов и докторантов», который тогда входил в список научных журналов ВАК Минобрнауки России. Эту проверку качества рецензирования организовала редакция газеты «Троицкий вариант» (Настоящий материал (информация) произведен, распространен и (или) направлен иностранным агентом Автономной некоммерческой организацией для издания научно-популярной газеты «ТРОИЦКИЙ ВАРИАНТ-НАУКА», либо касается деятельности иностранного агента Автономная некоммерческая организация для издания научно-популярной газеты «ТРОИЦКИЙ ВАРИАНТ-НАУКА») во главе с Михаилом Гельфандом. В тексте было оставлено немало явных указаний на природу статьи, например, благодарность лично Гельфанду за привлечение внимания к проблеме публикации случайных текстов, в списке литературы присутствовал автор по фамилии Softporn, отношение сигнал/шум измерялось в нанометрах, а время — в цилиндрах (хорошо, что не в колах).
SciDetect, представленная сейчас, позволяет выявлять подобные статьи. По мнению экспертов, мнения которых представляет Science, программа на деле нужна не столько для того, чтобы ловить обманщиков, сколько для того, чтобы редакциям журналов обезопасить себя от курьезной ошибки и сохранить свой имидж. На что Springer отвечает, что программное обеспечение не может заменить профессиональную работу по рецензированию и академической оценке статьи, но дает издателям дополнительный инструмент против поддельных научных статей.