Дневной срез: 2026-04-24 — Бортовой журнал AgentHub

Найдено 1 800 чтений экспериментального слоя, из них 1 800 AI-bot reads. Уникально прочитано 300 профилей.

2026-04-24

Главный сигнал дня: ClaudeBot дошёл до экспериментального слоя и получил ответы сайта.

Успешные ответы: 1 800 (100%). 499: 0. Это значит, что технически слой читается стабильно.

По охвату пока паритет: 5 когорт имеют по 60 уникально прочитанных профилей. Это честнее, чем объявлять победителя по сырым чтениям.

По глубине чтения сейчас впереди E / super profile: 2 чтения на профиль.

Сырые чтения растут вместе с количеством файлов в профиле, поэтому по total reads нельзя честно утверждать, что super profile лучше. Для этого мы отдельно смотрим уникальные профили, повторные заходы и глубину обхода.

Пока доказано только базовое: agent-facing noindex-слой доступен ботам, читается и трекается. Продуктовый вывод о лучшей форме профиля будем делать после накопления данных.

Второй слой уже запущен: interpretation benchmark на 100 профилях. Сейчас самая сильная answerability-когорта: E / super profile, 86,9/100.

Третий слой подключён: live LLM evaluator status — skipped. Live LLM evaluator is installed but no OPENAI_API_KEY or LLM_EVALUATOR_API_KEY is configured.

Четвёртый слой запущен: freshness / recrawl latency. Маркеры стоят на 50 профилях; AI-повторно прочитали 0. Первый AI reread: pending.

Когорта	Профилей	Файлов	Охват	Чтений	Чт./профиль	2xx
A / minimal profile	300	1	60	120	0,4	120
B / structured routes	300	3	60	240	0,8	240
C / trust + source map	300	5	60	360	1,2	360
D / agent guidance	300	7	60	480	1,6	480
E / super profile	300	9	60	600	2	600

Interpretation benchmark

Это второй слой эксперимента: не просто проверяем, прочитал ли бот URL, а оцениваем, достаточно ли фактов в профиле, чтобы агент мог объяснить компанию, извлечь оффер, проверить источники, выбрать следующий шаг и сравнить shortlist без выдумывания.

Когорта	Sample	Avg	Explain	Offer	Sources	Next action	Shortlist
A / minimal profile	20	23,6	68,2	20	30	0	0
B / structured routes	20	55,2	87,3	70,6	60	36,3	21,7
C / trust + source map	20	62,2	84,6	65	93,8	35,6	32
D / agent guidance	20	71,4	85,4	63,4	91,9	84,4	32
E / super profile	20	86,9	89,2	70,9	93,8	86,9	94

E / super profile currently has the strongest answerability score. Treat this as a proxy for agent usefulness, not as proof of ranking or recommendation behavior.

Live LLM evaluator

Это третий слой эксперимента: реальные ответы модели на одинаковые buyer-side задачи. Если API-ключ не задан, блок честно показывает skipped, чтобы журнал не притворялся, что модель уже прогнана.

Status: skipped · Model: gpt-4o-mini · Sample: 0

Когорта	Sample	Overall	Factuality	Completeness	Sources	Actionability	Hallucination risk
A / minimal profile	0	0	0	0	0	0	0
B / structured routes	0	0	0	0	0	0	0
C / trust + source map	0	0	0	0	0	0	0
D / agent guidance	0	0	0	0	0	0	0
E / super profile	0	0	0	0	0	0	0

Live LLM evaluator is installed but no OPENAI_API_KEY or LLM_EVALUATOR_API_KEY is configured.

Freshness / recrawl latency

Это слой проверки свежести: мы внесли безопасный служебный маркер в выбранные JSON-профили и измеряем, как быстро AI-боты возвращаются перечитать обновлённый профиль.

Status: pending · Profiles: 50 · AI reread: 0 · First AI read: pending

Когорта	Sample	First AI reread	Median AI min
A / minimal profile	10	pending	pending
B / structured routes	10	pending	pending
C / trust + source map	10	pending	pending
D / agent guidance	10	pending	pending
E / super profile	10	pending	pending

Freshness markers are published. Waiting for AI/search bot rereads after the controlled update.

Первые данные хорошие технически, но научный вывод по когортам пока рано делать.