Скрипт в помощь копирайтерам и администраторам сайтов. Скрипт позволяет массово проверять тексты на уникальность через text.ru API, берёт их из Word-файла (.docx) и сохраняет результаты проверки в формате Excel. Результаты наглядно продемонстрируют, какие тексты требуют доработки, а какие можно сразу выкладывать на сайт.
- Чтение статей из .docx-файла (каждая статья разделяется пустой строкой).
- Автоматическая отправка каждого текста на проверку уникальности через API text.ru.
- Ожидание завершения проверки (до 1 минуты) с периодическим опросом статуса.
- Сохранение отчёта с результатами (уникальность, заспамленность, «вода», ссылка на подробности) в Excel-файл.
-
Клонируйте репозиторий (или скопируйте скрипт в удобное для вас место):
git clone https://github.com/username/text-ru-bulk-check.git cd text-ru-bulk-check -
Установите зависимости (убедитесь, что у вас установлен Python 3.7+):
pip install -r requirements.txt
-
Получите API-ключ text.ru (если у вас его нет):
Зарегистрируйтесь на text.ru Получите ваш userkey в личном кабинете.
-
Укажите свой API-ключ в скрипте:
Откройте файл mass_check_textru.py (или как он у вас называется). В блоке if name == "main": замените api_key = "Ваш_API_ключ" на ваш ключ.
-
Подготовьте Word-файл с текстами (например, articles.docx):
❗ Каждый текст (статья) должен быть отделе от следующего пустой строкой. Так скрипт корректно прочитает их и разобьёт на отдельные статьи.
-
Запустите скрипт:
python mass_check_textru.py
По умолчанию скрипт ожидает, что входной файл называется articles.docx и результаты будут сохранены в text_ru_results.xlsx. При желании вы можете поменять эти названия в коде.
В результате выполнения появится файл text_ru_results.xlsx, в котором каждая строка будет соответствовать проверенному тексту. Столбцы и пример заполнения ячеек:
Текст Уникальность Заспамленность Вода Ссылка Ошибка Пример текста
Психология личности 95% 15% 10% https://text.ru/antiplagiat/1234567890
... ... ... ... ... ...
Текст — первые несколько символов проверяемой статьи (для идентификации).
Уникальность — итоговый % уникальности, определённый text.ru.
Заспамленность — оценка «заспамленности» (чрезмерного употребления слов).
Вода — оценка «водности» (много неинформативных слов/конструкций).
Ссылка — прямая ссылка на результат проверки (вы увидите отчёт text.ru в браузере).
Ошибка — если что-то пошло не так во время проверки или опроса статуса, здесь будет текст ошибки.
Настройки и доработки
Можно сделать веб-приложением (открывать веб-страницу) для удобства работы.
Если вы хотите отключить «заспамленность» и «воду», можно убрать "jsonvisible": "detail" или просто игнорировать поле seo_check.
Для чтения/записи Excel используются pandas и openpyxl.
Лицензия
Проект распространяется по лицензии MIT. См. LICENSE для подробностей.