Логичный ход, попробовать отдать классификацию ИИ. Прогнали тяжёлые модели, DeepSeek и GPT. Работают неплохо, но промахи всё равно есть. Решили взять нашу внутреннюю модель, которую можно дообучать под свои кейсы. Первая итерация, обучили её на тех данных, что размечали операторы, и дружно поняли: сами данные слишком «грязные». Значит, сначала наводим порядок с разметкой.
Вариант номер один, «олдскул». Выгружаем задачи в Excel, отдаём техсаппорту на ручную разметку, потом вносим обратно. Работает, но очень медленно . И тут вспоминаю ночную поддержку Такси (моя первая работа в Яндексе). Сидим в офисе (да, ночью), ~~пьем пиво~~ плотно работаем. У ребят из клиентского отдела была «модерка», удобное окно тикета и горячие клавиши для распределения. В Excel пять кликов мышью, в модерке одна кнопка. Скорость космическая. Вот что нам нужно для качественных данных.
Открываю Cursor и говорю: «Сделай веб-морду, которая загружает Excel с задачами и даёт удобно их размечать». Минут через десять у меня на ноутбуке уже открывается локальный интерфейс, базовый, но рабочий. Первый фичреквест, тёмная тема. Ночью белые окна враг. Cursor делает переключатель, который, правда, работал в одну сторону: нажал и вечная ночь. Обратно никак. Уточнили, поправили. Отдаём интерфейс «разметчикам», объясняем, что они тут первооткрыватели, и если эксперимент взлетит, будет премия. И я со спокойной душой ухожу на выходные.