Возможно, завтра объявят о том, что найден бозон Хиггса. Последнюю неделю подогревается интерес к этому событию. Перечитал (5 лет прошло, sic) статью Игоря Иванова об современном эксперименте в физике элементарных частиц. Не смог отказать себе в удовольствии, и проследил методологическую связь между физикой высоких энергий и качеством поиска. Эксперимент в области качества поиска тоже уже перешел от императивной стадии "pagerank - это круто" или "стоп-слова надо исключать из запроса" к стадии "цвет страницы связан с релевантностью на 0.01% на уровне достоверности 99.5%". Техника эксперимента тоже ушла от "что это такое у нас вылетает, если мы подадим ток?" до "пропустим миллионы частиц с огромными энергиями, зафиксируем миллиарды событий, отфильтруем нужные события, посчитаем доверительные интервалы". Для нас такими событиями являются запросы, клики по ним. Изучаются эффекты масштабом в сотые проценты от "удовлетворенности пользователя". Нельзя утверждать, что эффект есть, можно лишь утверждать, что он есть на уровне доверия 99%, 99.9%, 99.99%. Результатов экспериментов ждут подчас неделями. Также каждый клик/неклик будет обработан сотней способов. Коллеги оценят цитату:
"Ясно также, что не завершения эксперимента ждали физики 12 лет. Они ждали, когда статистики накопится достаточно много, а методы ее обработки станут достаточно «прозорливыми», чтобы углядеть искомый сигнал на нужном уровне статистической значимости. Развитие ситуации было вовсе не столь прямолинейное: закончился эксперимент — и сразу открытие. На самом деле нужные события время от времени регистрировались на протяжении последних лет, и постепенно росла уверенность, что действительно наблюдается искомый сигнал, а не проявление фоновых процессов. Были и более ранние публикации этой же группы, посвященные поиску одиночного топ-кварка, в которых сообщалось, что статистика пока не позволяет сделать выводы о существовании этого процесса, но и не противоречит ему. Сейчас же произошло лишь одно: вероятность «случайного совпадения» стала настолько малой, что физики уже имели право сказать: в нашем эксперименте действительно есть указание на существование искомого процесса. Поскольку эксперимент продолжается, то через год-полтора стоит ожидать новую публикацию по этой теме, с более точным результатом измерения вероятности процесса одиночного рождения топ-кварка.
НравитсяИнтересно, кстати, заметить, что разница между собственно экспериментом и его обработкой становится наиболее явной по окончании работы какого-то большого эксперимента. Иногда даже складывается такая парадоксальная ситуация. Эксперимент, скажем, за пять своих последних лет работы накопил столько статистики, что ее просто некому стало обработать. Молодежь уже на этот эксперимент не идет — ведь он закончился! — группа редеет, все заняты подготовкой нового эксперимента, заниматься обработкой старого уже недосуг. В результате сырые данные со всеми своими возможными открытиями так и лежат, пылятся, никто за них и не берется. Эксперимент проведен, но остался не расшифрован."
0 comments:
Отправить комментарий