machinelearningmastery.ru

Машинное обучение, нейронные сети, искусственный интеллект
Header decor

Home

Искусственный интеллект - это связь между большими данными и измерениями на уровне людей

Дата публикации Oct 3, 2019

Майнак Мазумдар, главный специалист по данным и исследованиям, Nielsen Global Media

Истина в измерении никогда не была более важной, чем сегодня. Поэтому истина - наша единственная повестка дня. Но прийти к этой истине никогда не было так сложно. Хотя многие рассматривают большие данные как панацею для измерения в мире, насыщенном цифровыми данными, мы знаем, что это не так просто.

Нильсенапанелина протяжении десятилетий были основой измерения уровня человека, и они остаются такими же и сегодня. Однако рост больших данных нельзя игнорировать как источник ценной информации. Но большие данные сами по себе не подходят для репрезентативных измерений. Подумайте о том, когда вы переключаете канал на вашем телевизоре. Это изменение становится частью больших данных, но нет записей о том, кто внес изменение или кто стал его свидетелем.

Чтобы подчеркнуть недостатки больших данных с точки зрения измерения, мы провелианализ в США ранее в этом годуэто сравнило данные телеприставки с данными телеприставки, которые мы откалибровали по данным панели Nielsen. Анализ показал, что некалиброванные данные по своей природе являются предвзятыми и недопредставляют аудиторию меньшинства.

Однако нельзя сказать, что большие данные не имеют значения. Наоборот. Но это должно быть основано на основополагающем наборе истины. Вот где наши панели и искусственный интеллект (ИИ) вступают в игру. Наши панельные данные - ключ к измерению на уровне людей - являются идеальным набором для обучения больших данных.

Благодаря применению ИИ, мы используем большие данные, чтобы значительно расширить наши возможности измерения при сохранении качества и репрезентативности. Сегодня ИИ является неотъемлемой частью нашей методологии измерений. Например, он сыграл ключевую роль в развитии наших расширенных измерительных возможностей дляместные телевизионные рынки, который сочетает в себе масштаб больших данных (данные о пути возврата {RPD} от телевизоров) с полностью репрезентативными данными панели на рынке.

Поскольку мы стремились интегрировать RPD в наши локальные измерения, мы определили четыре ключевых использования ИИ.

Распознавание образцов данных

Когда мы исследовали способы интеграции RPD в наши измерения, мы определили ограничения, связанные с RPD через то, что мы называем «анализом общих домов». Для этих анализов, которые продолжаются сегодня, мы сравниваем данные настройки счетчиков Nielsen с данными настройки RPD. Эти анализы охватывают более 5000 домов (12 000 телевизоров) каждый месяц и обнаружили, что RPD пропускает некоторые настройки.

Чтобы устранить этот недостаток, мы разработали запатентованную методику, которая использует классификаторы для распознавания шаблонов, связанных с отсутствующей настройкой в ​​домах RPD. Оттуда, алгоритмы ИИ убирают эти дома из использования в измерении.

Знание, когда телеприставки включены и телевизоры выключены

Обычные домашние анализы Нильсена анализируют более 77 миллионов минут настройки за месяц, что дает мощную информацию. Однако эта настройка не всегда точна. Например, люди не всегда выключают свои приставки, когда выключают свои телевизоры. RPD представляет эти ситуации как просмотр телевизора, хотя никто не смотрит.

Мы можем преодолеть это ограничение, используя классификаторы глубокого обучения для выявления ситуаций, когда приставка включена, когда телевизор выключен. Затем алгоритм удаляет неверную настройку из RPD.

Определение характеристик домохозяйства и демографической информации из РДП

RPD безымянный и безликий, и он не может предоставить демографическую информацию. Демографическая информация имеет решающее значение для правильного представления всех слоев населения. Кроме того, точное измерение означает возможность измерять людей, а не только домохозяйства.

Таким образом, чтобы разблокировать мощную информацию в домах RPD, мы калибруем RPD с известными характеристиками, демографическими данными и информацией о настройке из более чем 45 000 измерительных домов Nielsen и сторонних заданных характеристик и демографии. Затем мы добавляем эти входные данные в запатентованную рекуррентную нейронную сеть и метод смешанного целочисленного программирования, который точно определяет характеристики и демографию домов RPD. Этот алгоритм ИИ позволяет нам точно сообщать демографические характеристики людей и домохозяйств.

Определение местоположения приставки

Информация панели Nielsen предоставляет информацию о зрителе и местоположение просмотра. RPD тоже не предоставляет. Мы можем, однако, получить эту информацию от RPD через AI. Мы используем научно обоснованную методологию для определения того, какой член домохозяйства смотрит и где просмотр происходит в доме.

Исследования показали, что местоположение комнаты является одним из ключевых факторов, определяющих, какие члены домохозяйства находятся в аудитории просмотра. Поэтому мы используем классификатор для определения местоположения комнаты телеприставки, где происходит настройка в домах RPD. Таким образом, мы можем использовать эту переменную в процессе присваивания зрителю

Сегодня, когда доступно так много информации, заманчиво просматривать большие данные в розовых очках. Однако без связи с людьми большие данные далеко не точны. Мы обнаружили, что ИИ является мощным способом решения проблемы больших данных, и рады предложить инновации клиентам. Эта инновация извлекает выгоду как из обширной информации, которую предоставляют большие источники данных, так и из набора истин, который гарантирует, что они могут планировать, активировать и измерять на основе данных, которые являются репрезентативными и точными.

Оригинальная статья

Footer decor

© machinelearningmastery.ru | Ссылки на оригиналы и авторов сохранены. | map