machinelearningmastery.ru

Машинное обучение, нейронные сети, искусственный интеллект
Header decor

Home

Особенности разработки для обнаружения мошенничества с кредитными картами

Дата публикации Aug 9, 2018

Функциональное проектирование является ключом к успеху в моделировании. Хорошая разработка функций может уловить природу проблемы и, следовательно, обеспечить лучший результат. Что такое особенность? Функция описывает скрытые паттерны. В этой главе мы рассмотрим особенности разработки в литературе о мошенничестве с кредитными картами, мошенничестве со страховыми требованиями и мошенничеством в сфере здравоохранения. Читатели узнают, как другие исследователи данных создают функции для мошенничества в различных отраслях.

Мошенничество с кредитными картами происходит в основном в двух видах: мошенничество с приложениями и мошенничество с транзакциями. Мошенничество с использованием приложений аналогично мошенничеству с использованием личных данных, когда один человек использует личные данные другого человека для получения новой карты. Мошенничество с транзакцией происходит, когда карта украдена или утеряна карта для проведения мошеннических транзакций. Также произошел значительный рост количества поддельных карт.

Мошенник будет пытаться максимально использовать карту в течение короткого периода времени, прежде чем карта будет обнаружена и приостановлена. Таким образом, мы должны увидеть аномальные транзакции за короткий промежуток времени. С этой целью, если мы агрегируем транзакции за определенный период времени, мы сможем обнаружить резкие изменения.

Позвольте мне представить гипотетический пример, чтобы продемонстрировать, как можно создавать функции. Эти транзакционные данные включают в себя идентификатор продавца, категорию продавца, местоположение продавца, метку времени, способ и тип транзакции, а также сумму транзакции.

Агрегирование транзакций, мин, макс, среднее или сумма, может выявить много идей. Сотни функций могут быть созданы из данных транзакции. Ниже приведены некоторые предложения:

Агрегация по времени:

  • Средние или максимальные суммы, потраченные на одну транзакцию за последнюю неделю, две недели или XX недели
  • Средние или максимальные суммы, потраченные за день за последнюю неделю, две недели или XX недель,
  • Средние или максимальные суммы по категориям продавцов за последнюю неделю, две недели или XX недель,

Агрегирование по коду категории продавца:

  • Средняя сумма за день, потраченный в течение 30-дневного периода на все транзакции, кроме этой, с тем же типом продавца, что и эта транзакция
  • Общее количество транзакций с тем же продавцом за последние 30 дней
  • Средняя сумма, потраченная в течение 1 недели за последние 3 месяца на тот же тип продавца, что и эта транзакция

Агрегирование по местоположению и времени продавца:Первые две транзакции в приведенной выше таблице произошли в Нью-Йорке (NYC) и Бостоне (BOS) в течение 8 минут. Вероятно, карта была взломана.

  • Количество точек розничной торговли в день и продолжительность между точками за последнюю неделю, две недели или XX недель,
  • Минимальное количество минут между транзакциями двух торговых точек за последнюю неделю, две недели или XX недели,

Агрегирование по методу транзакции:Транзакции с магнитной полосой подвержены мошенничеству, чем транзакции с использованием чипа или PIN-кода. Таким образом, мы можем создать общую сумму по типу транзакции на карту.

  • Средняя сумма по методу транзакции в день за последнюю неделю, две недели или XX недель,
  • Количество транзакций по методам транзакций в день за последнюю неделю, две недели или XX недель,

Будет полезно наблюдать за стратегиями разработки функций, предложенными другими исследователями.Whitrow et al. (2009)подробно опишите, как они получили атрибуты данных посредством агрегирования.Бхаттачарья и соавт. (2010)атрибуты данных отчета, включая основные атрибуты и производные атрибуты.Bahnsen et al. (2016)расширить стратегию агрегации транзакций и создать функции, основанные на периодическом поведении времени транзакции с использованием распределения фон Мизеса. Затем в этих исследованиях при обнаружении мошенничества с кредитными картами применяются методы обучения под наблюдением: вспомогательные векторные машины (SVM), случайные леса (RF) и т. Д.Сундаркумар и Рави (2015)перечислите атрибуты данных в своем приложении для обнаружения мошенничества в банковской сфере и в страховании.Vlasselaer et al. (2017)разработать их сетевые функции, исследуя сеть держателей кредитных карт и продавцов и получая зависящий от времени показатель подозрительности для каждого сетевого объекта.

К сожалению, из-за частного характера финансовых транзакций практически нет общедоступных наборов данных кредитных карт. Лопес-Рохас и соавт. (2016) в своей статьеPaySim: финансовый симулятор мобильных денег для обнаружения мошенничествапредложить инструмент моделирования PaySim для генерации аналогичных транзакций на основе их исходного набора данных транзакций мобильных денег. СинтетическийНабор данныхдоступно на Kaggle.com.

Управление служб управления и предпринимательства в штате Оклахомапокупка транзакций по кредитным картамимеется в наличии. Этот набор данных содержит информацию о покупках, сделанных в рамках программ покупки карт, управляемых государством и высшими учебными заведениями.

Для дальнейших обсуждений, пожалуйста, нажмитеВот,

Оригинальная статья

Footer decor

© machinelearningmastery.ru | Ссылки на оригиналы и авторов сохранены. | map