DOI: 10.11606/d.45.2014.tde-05022015-232801
|View full text |Cite
|
Sign up to set email alerts
|

Atualização dinâmica de modelo de regressão logística binária para detecção de fraudes em transações eletrônicas com cartão de crédito

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1

Citation Types

0
0
0
3

Publication Types

Select...
2

Relationship

0
2

Authors

Journals

citations
Cited by 2 publications
(3 citation statements)
references
References 0 publications
0
0
0
3
Order By: Relevance
“…Nesse caso, a área sob a curva ROC é uma medida bem aceita pois considera as distribuic ¸ões das duas classes de interesse para todos possíveis pontos de corte. Outra medida amplamente utilizada é a estatística KS, derivada do teste de hipótese não paramétrico de Kolmogorov-Smirnov [3] A RF teve melhor performance no conjunto de treinamento para ambas as métricas, mas perdeu performance na generalizac ¸ão para o período de teste, já o modelo LGBM teve uma performance um pouco pior do que a RF no conjunto de treinamento mas conseguiu melhor generalizac ¸ão, alcanc ¸ando as melhores médias no conjunto de dados de teste. O SVM foi o algoritmo que teve pior desempenho, pelo tempo de processamento só foi testado o núcleo linear, outros núcleos podem melhor a performance do classificador, mas exigem um algo tempo computacional para convergência.…”
Section: Resultados E Discussõesunclassified
“…Nesse caso, a área sob a curva ROC é uma medida bem aceita pois considera as distribuic ¸ões das duas classes de interesse para todos possíveis pontos de corte. Outra medida amplamente utilizada é a estatística KS, derivada do teste de hipótese não paramétrico de Kolmogorov-Smirnov [3] A RF teve melhor performance no conjunto de treinamento para ambas as métricas, mas perdeu performance na generalizac ¸ão para o período de teste, já o modelo LGBM teve uma performance um pouco pior do que a RF no conjunto de treinamento mas conseguiu melhor generalizac ¸ão, alcanc ¸ando as melhores médias no conjunto de dados de teste. O SVM foi o algoritmo que teve pior desempenho, pelo tempo de processamento só foi testado o núcleo linear, outros núcleos podem melhor a performance do classificador, mas exigem um algo tempo computacional para convergência.…”
Section: Resultados E Discussõesunclassified
“…Figura 2. Etapas para geração do modelo O passo seguinte foi a escolha dos melhores indicadores por meio do IV (Information Value), que indica quanto uma variável é boa para explicação da variável resposta (no caso do estudo, um fraudador de um não fraudador) [Beraldi, 2014]. Consideramos índices entre 0,1 e 0,5 como ponto de corte para manter no estudo [Siddiqi, 2006].…”
Section: Análise Descritiva E Seleção Das Variáveisunclassified
“…Foi escolhido o algoritmo de regressão logística [Beraldi, 2014] pelos três principais motivos: facilidade de interpretação dos coeficientes por pessoas menos técnicas; fácil implantação no ambiente de produção; output simples e de fácil entendimento. Outros algoritmos foram testados, porém a regressão logística foi o que apresentou melhor resultado.…”
Section: Treinamento Do Algoritmounclassified