Шингл
Шингл – это часть текста (обычно от 4-х до 7-ми), которая рассматривается с точки зрения уникальности. Разделяется шингл таким образом, что одно и то же слово повторяется в различных шинглах. К примеру, для фразы «вчера образовался крупный затор в сторону области» шинглы третьего размера будут выглядеть следующим образом:
— вчера образовался крупный
— образовался крупный затор
— крупный затор в
— затор в сторону
— в сторону области.
Такое разделение текста необходимо для проверки его уникальности. Чем больше совпадений по шинглам будет выявлено, тем меньше уникальность текста в целом.
Различные сервисы по проверке текстов предлагают пользователям самостоятельно выбрать размер шингла. Все тексты необходимо проверять через данные сервисы на уникальность по размеру шингла не более 7. Ставить размер более 7 не имеет смысла, так как качество такой проверки будет минимальным. Оптимальный размер шингла: 4-6.