бортовой журнал agent readability lab

Дневной срез: 2026-04-24

Найдено 1 800 чтений экспериментального слоя, из них 1 800 AI-bot reads. Уникально прочитано 300 профилей.

2026-04-24

Главный сигнал дня: ClaudeBot дошёл до экспериментального слоя и получил ответы сайта.

Успешные ответы: 1 800 (100%). 499: 0. Это значит, что технически слой читается стабильно.

По охвату пока паритет: 5 когорт имеют по 60 уникально прочитанных профилей. Это честнее, чем объявлять победителя по сырым чтениям.

По глубине чтения сейчас впереди E / super profile: 2 чтения на профиль.

Сырые чтения растут вместе с количеством файлов в профиле, поэтому по total reads нельзя честно утверждать, что super profile лучше. Для этого мы отдельно смотрим уникальные профили, повторные заходы и глубину обхода.

Пока доказано только базовое: agent-facing noindex-слой доступен ботам, читается и трекается. Продуктовый вывод о лучшей форме профиля будем делать после накопления данных.

Второй слой уже запущен: interpretation benchmark на 100 профилях. Сейчас самая сильная answerability-когорта: E / super profile, 86,9/100.

Третий слой подключён: live LLM evaluator status — skipped. Live LLM evaluator is installed but no OPENAI_API_KEY or LLM_EVALUATOR_API_KEY is configured.

Четвёртый слой запущен: freshness / recrawl latency. Маркеры стоят на 50 профилях; AI-повторно прочитали 0. Первый AI reread: pending.

Когорта Профилей Файлов Охват Чтений Чт./профиль 2xx 499
A / minimal profile 300 1 60 120 0,4 120 0
B / structured routes 300 3 60 240 0,8 240 0
C / trust + source map 300 5 60 360 1,2 360 0
D / agent guidance 300 7 60 480 1,6 480 0
E / super profile 300 9 60 600 2 600 0

Interpretation benchmark

Это второй слой эксперимента: не просто проверяем, прочитал ли бот URL, а оцениваем, достаточно ли фактов в профиле, чтобы агент мог объяснить компанию, извлечь оффер, проверить источники, выбрать следующий шаг и сравнить shortlist без выдумывания.

Когорта Sample Avg Explain Offer Sources Next action Shortlist
A / minimal profile 20 23,6 68,2 20 30 0 0
B / structured routes 20 55,2 87,3 70,6 60 36,3 21,7
C / trust + source map 20 62,2 84,6 65 93,8 35,6 32
D / agent guidance 20 71,4 85,4 63,4 91,9 84,4 32
E / super profile 20 86,9 89,2 70,9 93,8 86,9 94
E / super profile currently has the strongest answerability score. Treat this as a proxy for agent usefulness, not as proof of ranking or recommendation behavior.

Live LLM evaluator

Это третий слой эксперимента: реальные ответы модели на одинаковые buyer-side задачи. Если API-ключ не задан, блок честно показывает skipped, чтобы журнал не притворялся, что модель уже прогнана.

Status: skipped · Model: gpt-4o-mini · Sample: 0

Когорта Sample Overall Factuality Completeness Sources Actionability Hallucination risk
A / minimal profile 0 0 0 0 0 0 0
B / structured routes 0 0 0 0 0 0 0
C / trust + source map 0 0 0 0 0 0 0
D / agent guidance 0 0 0 0 0 0 0
E / super profile 0 0 0 0 0 0 0
Live LLM evaluator is installed but no OPENAI_API_KEY or LLM_EVALUATOR_API_KEY is configured.

Freshness / recrawl latency

Это слой проверки свежести: мы внесли безопасный служебный маркер в выбранные JSON-профили и измеряем, как быстро AI-боты возвращаются перечитать обновлённый профиль.

Status: pending · Profiles: 50 · AI reread: 0 · First AI read: pending

Когорта Sample Reread AI reread First AI reread Median AI min
A / minimal profile 10 0 0 pending pending
B / structured routes 10 0 0 pending pending
C / trust + source map 10 0 0 pending pending
D / agent guidance 10 0 0 pending pending
E / super profile 10 0 0 pending pending
Freshness markers are published. Waiting for AI/search bot rereads after the controlled update.
Первые данные хорошие технически, но научный вывод по когортам пока рано делать.