Skip to content

Автоматизированная проверка текстов через API text.ru 📄🔍 В помощь копирайтерам и контент-мейкерам. Скрипт позволяет массово проверять тексты на уникальность, заспамленность и "воду" с помощью API text.ru. Результаты сохраняются в удобный Excel-файл.

License

Notifications You must be signed in to change notification settings

anna-zam/Mass_text_API_text_ru

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Mass Text Check with text.ru

Скрипт в помощь копирайтерам и администраторам сайтов. Скрипт позволяет массово проверять тексты на уникальность через text.ru API, берёт их из Word-файла (.docx) и сохраняет результаты проверки в формате Excel. Результаты наглядно продемонстрируют, какие тексты требуют доработки, а какие можно сразу выкладывать на сайт.

Возможности

  • Чтение статей из .docx-файла (каждая статья разделяется пустой строкой).
  • Автоматическая отправка каждого текста на проверку уникальности через API text.ru.
  • Ожидание завершения проверки (до 1 минуты) с периодическим опросом статуса.
  • Сохранение отчёта с результатами (уникальность, заспамленность, «вода», ссылка на подробности) в Excel-файл.

Быстрый старт

  1. Клонируйте репозиторий (или скопируйте скрипт в удобное для вас место):

    git clone https://github.com/username/text-ru-bulk-check.git
    cd text-ru-bulk-check
    
  2. Установите зависимости (убедитесь, что у вас установлен Python 3.7+):

    pip install -r requirements.txt
  3. Получите API-ключ text.ru (если у вас его нет):

    Зарегистрируйтесь на text.ru Получите ваш userkey в личном кабинете.

  4. Укажите свой API-ключ в скрипте:

    Откройте файл mass_check_textru.py (или как он у вас называется). В блоке if name == "main": замените api_key = "Ваш_API_ключ" на ваш ключ.

  5. Подготовьте Word-файл с текстами (например, articles.docx):

    ❗ Каждый текст (статья) должен быть отделе от следующего пустой строкой. Так скрипт корректно прочитает их и разобьёт на отдельные статьи.

  6. Запустите скрипт:

        python mass_check_textru.py

    По умолчанию скрипт ожидает, что входной файл называется articles.docx и результаты будут сохранены в text_ru_results.xlsx. При желании вы можете поменять эти названия в коде.

Структура Excel-отчёта

В результате выполнения появится файл text_ru_results.xlsx, в котором каждая строка будет соответствовать проверенному тексту. Столбцы и пример заполнения ячеек:

Текст	           Уникальность	Заспамленность	Вода	Ссылка	Ошибка Пример текста

Психология личности     95%	    15% 	10%	https://text.ru/antiplagiat/1234567890	

... ... ... ... ... ...

Текст — первые несколько символов проверяемой статьи (для идентификации).
Уникальность — итоговый % уникальности, определённый text.ru.
Заспамленность — оценка «заспамленности» (чрезмерного употребления слов).
Вода — оценка «водности» (много неинформативных слов/конструкций).
Ссылка — прямая ссылка на результат проверки (вы увидите отчёт text.ru в браузере).
Ошибка — если что-то пошло не так во время проверки или опроса статуса, здесь будет текст ошибки.

Настройки и доработки

Можно сделать веб-приложением (открывать веб-страницу) для удобства работы.
Если вы хотите отключить «заспамленность» и «воду», можно убрать "jsonvisible": "detail" или просто игнорировать поле seo_check.
Для чтения/записи Excel используются pandas и openpyxl.

Лицензия

Проект распространяется по лицензии MIT. См. LICENSE для подробностей.

About

Автоматизированная проверка текстов через API text.ru 📄🔍 В помощь копирайтерам и контент-мейкерам. Скрипт позволяет массово проверять тексты на уникальность, заспамленность и "воду" с помощью API text.ru. Результаты сохраняются в удобный Excel-файл.

Topics

Resources

License

Stars

Watchers

Forks

Languages