Главный сигнал дня: ClaudeBot дошёл до экспериментального слоя и получил ответы сайта.
Успешные ответы: 1 800 (100%). 499: 0. Это значит, что технически слой читается стабильно.
По охвату пока паритет: 5 когорт имеют по 60 уникально прочитанных профилей. Это честнее, чем объявлять победителя по сырым чтениям.
По глубине чтения сейчас впереди E / super profile: 2 чтения на профиль.
Сырые чтения растут вместе с количеством файлов в профиле, поэтому по total reads нельзя честно утверждать, что super profile лучше. Для этого мы отдельно смотрим уникальные профили, повторные заходы и глубину обхода.
Пока доказано только базовое: agent-facing noindex-слой доступен ботам, читается и трекается. Продуктовый вывод о лучшей форме профиля будем делать после накопления данных.
Второй слой уже запущен: interpretation benchmark на 100 профилях. Сейчас самая сильная answerability-когорта: E / super profile, 86,9/100.
Третий слой подключён: live LLM evaluator status — skipped. Live LLM evaluator is installed but no OPENAI_API_KEY or LLM_EVALUATOR_API_KEY is configured.
Четвёртый слой запущен: freshness / recrawl latency. Маркеры стоят на 50 профилях; AI-повторно прочитали 0. Первый AI reread: pending.
| Когорта | Профилей | Файлов | Охват | Чтений | Чт./профиль | 2xx | 499 |
|---|---|---|---|---|---|---|---|
| A / minimal profile | 300 | 1 | 60 | 120 | 0,4 | 120 | 0 |
| B / structured routes | 300 | 3 | 60 | 240 | 0,8 | 240 | 0 |
| C / trust + source map | 300 | 5 | 60 | 360 | 1,2 | 360 | 0 |
| D / agent guidance | 300 | 7 | 60 | 480 | 1,6 | 480 | 0 |
| E / super profile | 300 | 9 | 60 | 600 | 2 | 600 | 0 |
Interpretation benchmark
Это второй слой эксперимента: не просто проверяем, прочитал ли бот URL, а оцениваем, достаточно ли фактов в профиле, чтобы агент мог объяснить компанию, извлечь оффер, проверить источники, выбрать следующий шаг и сравнить shortlist без выдумывания.
| Когорта | Sample | Avg | Explain | Offer | Sources | Next action | Shortlist |
|---|---|---|---|---|---|---|---|
| A / minimal profile | 20 | 23,6 | 68,2 | 20 | 30 | 0 | 0 |
| B / structured routes | 20 | 55,2 | 87,3 | 70,6 | 60 | 36,3 | 21,7 |
| C / trust + source map | 20 | 62,2 | 84,6 | 65 | 93,8 | 35,6 | 32 |
| D / agent guidance | 20 | 71,4 | 85,4 | 63,4 | 91,9 | 84,4 | 32 |
| E / super profile | 20 | 86,9 | 89,2 | 70,9 | 93,8 | 86,9 | 94 |
Live LLM evaluator
Это третий слой эксперимента: реальные ответы модели на одинаковые buyer-side задачи. Если API-ключ не задан, блок честно показывает skipped, чтобы журнал не притворялся, что модель уже прогнана.
Status: skipped · Model: gpt-4o-mini · Sample: 0
| Когорта | Sample | Overall | Factuality | Completeness | Sources | Actionability | Hallucination risk |
|---|---|---|---|---|---|---|---|
| A / minimal profile | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| B / structured routes | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| C / trust + source map | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| D / agent guidance | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
| E / super profile | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
Freshness / recrawl latency
Это слой проверки свежести: мы внесли безопасный служебный маркер в выбранные JSON-профили и измеряем, как быстро AI-боты возвращаются перечитать обновлённый профиль.
Status: pending · Profiles: 50 · AI reread: 0 · First AI read: pending
| Когорта | Sample | Reread | AI reread | First AI reread | Median AI min |
|---|---|---|---|---|---|
| A / minimal profile | 10 | 0 | 0 | pending | pending |
| B / structured routes | 10 | 0 | 0 | pending | pending |
| C / trust + source map | 10 | 0 | 0 | pending | pending |
| D / agent guidance | 10 | 0 | 0 | pending | pending |
| E / super profile | 10 | 0 | 0 | pending | pending |