Поговорим о тагах (метках), как о способе категоризации контента. Как известно, тагами помечают какие-либо сущности, то есть привязывают к некой категории, как например я помечаю тагами посты в этом блоге. Если вы нажмете на какой-либо таг, то увидите список постов по теме. Всё работает и, достаточно удобно.
Однако, категоризация может не работать. Часто, разработчики включают систему категоризации, основанную на тагах, как некую модную фишку, ставшую по-сути стандартом де-факто для современных приложений, не подозревая, что это может не работать на благо.
Почему так происходит? Всё потому, что разработчики отдают “власть народу”, и пользователи на сайте получают в свои руки инструмент для категоризации. Но вот беда, обычные люди не задумываются, как работают таги - люди просто не соблюдают принцип ортогональности, поэтому, как результат, мы можем получить примерно следующее:
- Javascript
- JS
- Java Script
Все эти 3 варианта будут означать одно и то же - то, что помеченный, к примеру, пост касается языка Javascript. Теперь, если вы нажмёте, например на таг “JS”, то вы можете и не увидеть остальные посты, касающиеся языка Javascript, которые помечены остальными двумя тагами, но не были помечены тагом “JS”.
Еще хуже дело обстоит тогда, когда пользователи могут иметь различные мнения, к какому тагу относится некоторый контент. Приведу пример. Предствим, что у нас имеется сайт, на котором мы продаем музыкальные альбомы и пользователи могут отнести альбом к тому или иному стилю, отметив его тагами. Один человек будет относить стиль альбома к тагу “Rap”, второй к “R’n'B”, третий, может вообще отнести его, например, к фанку :) В общем - ничего хорошего не выйдет, и никакие выпадающие подсказки с уже существующими в системе тагами тут не помогут.
Так как же исправить ситуацию? Сразу могу сказать, что только одним способом - убрав для пользователей возможность категоризовать контент сайта при помощи тагов. Я уверен - этим должна заниматься команда сайта, но никак не пользователи. Иначе, всё, что мы получим - это бесполезное облако тагов и некачественно категоризованный контент. Чтобы сделать навигацию, которая заменит нам таги в таких случаях, нужно воспользоваться системой поиска, это будет куда более гибкий и удобный инструмент.
Итак, подведем итоги:
- Категоризация контента тагами, задача не пользователя. Если, всё же вы на свой риск хотите отдать этот инструмент пользователям, то позаботьтесь о постмодерации тагов, а то получится примерно как ситуация с выбором школы на Одноклассниках, когда могут существовать несколько школ с одинаковым номером, но написанным по-разному.
- Таги должны быть ортогональными - не должно быть одновременно тагов, как например, “JS” и “Javascript”.
- Если у команды проекта нет ресурсов на самостоятельную разметку контента тагами, то лучше сделать удобный поиск с поддержкой морфологии и релевантностью - это более удобный и понятный пользователю инструмент. Можно воспользоваться отличным движком Sphinx.
Вот вроде и всё. Спешу откланяться.
Also interesting
Tags: категоризация, ортогональность, таги
Вот мои пять копеек. Категоризация тегами и категориями, вообще говоря, разные типы категоризации, но оба соответствуют человеческому когнитивному аппарату: категории соответствуют ИП-категориям, теги соответствуют категориям типа “фамильное сходство”. На больших сайтах типа Хабра, когда надо получить выборку статей по определённой теме, теги очень хорошо работают, т.к. на каждую мелочь блог не создашь. Да, есть несовпадения, есть банальные опечатки. No one is perfect. Но эта схема работает.
Поиск тоже дело хорошее, но это другой инструмент, и одно другому не мешает.