Atualização dinâmica de modelo de regressão logística binária para detecção de fraudes em transações eletrônicas com cartão de crédito

Beraldi, Fidel

doi:10.11606/d.45.2014.tde-05022015-232801

Cited by 2 publications

(3 citation statements)

References 0 publications

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…Nesse caso, a área sob a curva ROC é uma medida bem aceita pois considera as distribuic ¸ões das duas classes de interesse para todos possíveis pontos de corte. Outra medida amplamente utilizada é a estatística KS, derivada do teste de hipótese não paramétrico de Kolmogorov-Smirnov [3] A RF teve melhor performance no conjunto de treinamento para ambas as métricas, mas perdeu performance na generalizac ¸ão para o período de teste, já o modelo LGBM teve uma performance um pouco pior do que a RF no conjunto de treinamento mas conseguiu melhor generalizac ¸ão, alcanc ¸ando as melhores médias no conjunto de dados de teste. O SVM foi o algoritmo que teve pior desempenho, pelo tempo de processamento só foi testado o núcleo linear, outros núcleos podem melhor a performance do classificador, mas exigem um algo tempo computacional para convergência.…”

Section: Resultados E Discussõesunclassified

Detecção de fraude no comércio eletrônico brasileiro

Cristovao¹,

Buscaglia²

2022

Anais Do II Workshop De Matemática, Estatística E Computação Aplicadas À Indústria

View full text Add to dashboard Cite

Introduc ¸ãoO e-commerce brasileiro segue em rápida expansão e faturou mais de R$ 161 bilhões em 2021 [5]. O cartão de crédito é uma das principais formas de pagamento utilizadas na modalidade, entretanto o crescimento de sua popularidade o tornou visado pelos fraudadores. A fraude é uma preocupac ¸ão constante dos e-commerces brasileiros, que sofre mais de R$ 3.6 mil em tentativas de fraudes por minuto [1]. Por este motivo, o tema chama atenc ¸ão de pesquisadores e trabalhos científicos e se tornou um tópico de pesquisa frequente com o crescimento do interesse em big data e aprendizado de máquina [6]. Existem diversos desafios encontrados na literatura para a criac ¸ão de modelos de aprendizado de máquina na previsão de fraudes, alguns exemplos são o desbalanceamento entre as classes, a tendência não estacionária da distribuic ¸ão e a falta de dados públicos para análise. O desbalanceamento entre classes acontece pois o número de compras não fraudulentas é muito maior do que de tentativas de fraudes, já que a quantidade de bons consumidores é muito grande. Já a distribuic ¸ão não estacionária se dá pela mudanc ¸a de comportamento de bons consumidores, por exemplo devido à períodos promocionais, e de fraudadores, dado que eles podem mudam seu comportamento a fim de burlar os sistemas de detecc ¸ão [8], esse problema também é conhecido como concept drift. Por fim, os dados para pesquisas acadêmicas sobre o tema são escassos devido à características sensíveis das informac ¸ões, pois existem muitas informac ¸ões pessoais, como CPF e e-mail, e informac ¸ões sensíveis, como informac ¸ões do cartão de crédito utilizado na compra. O presente trabalho tem como objetivo comparar diferentes algoritmos de aprendizado de máquina em uma base real de compras online e estudar o impacto do concept drift na predic ¸ão. MetodologiaUtilizaremos uma base de dados real de compras online de uma loja de e-commerce composta por 11.211.709 transac ¸ões realizadas entre julho/2021 e outubro/2021, sendo 419.895 com marcac ¸ões de fraude, 3.745% do total de transac ¸ões. As marcac ¸ões podem ocorrer pelo processo

show abstract

Section: Resultados E Discussõesunclassified

Detecção de fraude no comércio eletrônico brasileiro

Cristovao¹,

Buscaglia²

2022

Anais Do II Workshop De Matemática, Estatística E Computação Aplicadas À Indústria

View full text Add to dashboard Cite

show abstract

“…Figura 2. Etapas para geração do modelo O passo seguinte foi a escolha dos melhores indicadores por meio do IV (Information Value), que indica quanto uma variável é boa para explicação da variável resposta (no caso do estudo, um fraudador de um não fraudador) [Beraldi, 2014]. Consideramos índices entre 0,1 e 0,5 como ponto de corte para manter no estudo [Siddiqi, 2006].…”

Section: Análise Descritiva E Seleção Das Variáveisunclassified

“…Foi escolhido o algoritmo de regressão logística [Beraldi, 2014] pelos três principais motivos: facilidade de interpretação dos coeficientes por pessoas menos técnicas; fácil implantação no ambiente de produção; output simples e de fácil entendimento. Outros algoritmos foram testados, porém a regressão logística foi o que apresentou melhor resultado.…”

Section: Treinamento Do Algoritmounclassified

Aplicando modelo de aprendizagem supervisionada para apoio ao score de autenticação biométrica

Mukuno

Moraes

Haddad

et al. 2021

Anais Do XLVIII Seminário Integrado De Software E Hardware (SEMISH 2021)

View full text Add to dashboard Cite

O reconhecimento facial já faz parte na vida de muitos de nós. Grande parte dos smartphones atuais efetua o desbloqueio do aparelho utilizando a face como forma de identificar o dono do aparelho e proporcionar acesso aos dados. No entanto, ele também vem ganhando espaço para outros objetivos, principalmente em soluções corporativas como controle de acessos, validação de documentos e para compras online. A fim de aumentarmos a acurácia de nosso score biométrico, foi desenvolvido um modelo de cálculo de risco que leva em consideração o comportamento do consumidor, baseado em seu histórico de transações, visando a diminuição de fraudes

show abstract

Atualização dinâmica de modelo de regressão logística binária para detecção de fraudes em transações eletrônicas com cartão de crédito

Cited by 2 publications

References 0 publications

Detecção de fraude no comércio eletrônico brasileiro

Detecção de fraude no comércio eletrônico brasileiro

Aplicando modelo de aprendizagem supervisionada para apoio ao score de autenticação biométrica

Contact Info

Product

Resources

About