Audio-Assisted Movie Dialogue Detection

Kotti, Margarita; Ververidis, Dimitrios; Evangelopoulos, Georgios; Panagakis, Yannis; Kotropoulos, Constantine; Maragos, Petros; Pitas, Ioannis

doi:10.1109/tcsvt.2008.2005613

Cited by 13 publications

(7 citation statements)

References 26 publications

(67 reference statements)

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…Observamos que o parâmetro de áudio MFCC demonstrou-se ser superior na coleta de informações do áudio para identificação de cenas de violência doméstica em comparação com os outros parâmetros ZCR e Energia, alcançando uma acurácia média de 73,14%. Além disso, pelo fato de até o momento dessa pesquisa não termos encontrados em nossas nenhum estudo dessa natureza sendo realizado, abordando especificamente cenas de violência doméstica, consideramos que nossa abordagem apresenta bons resultados se comparados com outros trabalhos envolvendo apenas reconhecimento de algum outro tipo de cena acústica, utilizando parâmetros de áudios, e que obtiveram resultados de acurácias não tão distantes dos nossos, como por exemplo em [Kotti et al 2008] com 82%, [Stowell et al 2015] apresentando sistemas com acurácias entre 55% e 77% , [Yang et al 2016] com 79,9%, [Elizalde et al 2016] Para trabalhos futuros, poderemos utilizar uma abordagem de utilização de diferentes classificadores utilizando os parâmetros MFCC e Energia isoladamente e em conjunto para o aprendizado de máquina, pois demonstraram ter melhores resultados do que ZCR, considerando a ampliação do número de amostras de áudios em nossa base de dados, pois acreditamos que essa evolução da base pode ampliar a capacidade de aprendizado de máquina e consequentemente alcançar uma melhor acurácia como resultado.…”

Section: Conclusãounclassified

An acoustic scene classification approach involving domestic violence using machine learning

Souto

Mello

Furtado

2019

Anais Do XVI Encontro Nacional De Inteligência Artificial E Computacional (ENIAC 2019)

View full text Add to dashboard Cite

A classificação e detecção de cenas acústicas é uma área de pesquisa em rápido desenvolvimento, pois o sinal produzido pelo som de um áudio contém informações que dados visuais não podem representar. Neste artigo lidamos com o problema de detecção de cenas acústicas envolvendo violência doméstica. Para tanto, propomos a utilização de um método de aprendizado de máquina utilizando o classificador SVM para detectar cenas de violência doméstica de um homem contra uma mulher utilizando o som. Apresentamos análises de experimentos com três diferentes parâmetros extraídos dos áudios. Como resultado, obtemos o melhor desempenho utilizando o parâmetro MFCC conseguindo uma acurácia de 73,14%.

show abstract

Section: Conclusãounclassified

An acoustic scene classification approach involving domestic violence using machine learning

Souto

Mello

Furtado

2019

Anais Do XVI Encontro Nacional De Inteligência Artificial E Computacional (ENIAC 2019)

View full text Add to dashboard Cite

show abstract

“…Researchers have found that audio may play more important than video for the content analysis of audiovideo sometimes [18], and audio information processing is much faster than video information processing [19]. Hence,audio information is used in film content analysis and understanding more and more in recent years.…”

Section: Introductionmentioning

confidence: 99%

“…In film content analysis and understanding, audio event change detection is the most important step, which is base of movie audio content analysis and understanding. In past, there are some film audio processing reports which focus on the detection people and music, for example, University of Southern California have studied two people dialogue, many people dialogue and mixture events in movies [5], Aristotle University of Thessaloniki used audio detect movie dialogue [19]. Asian Institute of Technology of Thailand classified movies into several kinds by detection music and song in movies.…”

Section: Introductionmentioning

confidence: 99%

Audio Event Change Detection and Clustering in Movies

Yang¹,

Liu²,

Qin³

et al. 2013

JMM

View full text Add to dashboard Cite

This paper proposed a method of audio event chage detection and clustering in movies. Three steps criterion method is used to detect audio event change in movies ,non silece segment is gotton from audio events by using energy firstly, potential audio event change point is gotton by calculating the distance of two sliding windows secondly , penalty distance is used to judge whether a potential audio enent change point is real or not lastly. Spectural clustering is used to estimate the number of audio events and k-means is used to cluster the same audio events . Experimental results have demonstrated that the proposed method can reach a satisfactory results

show abstract

“…An important aim of an external mediator is to obtain a good yet general blueprint of a dialog situation by analyzing the ongoing conversational dynamics, intended as the alternating speech behavior exploited by the partners during negotiation [2,4,3]. The ability to carefully capture and classify conversational dynamics could also be employed to enhance the performance of a wide range of applications, such as dialog detection [9], speaker recognition/verification [5], and event detection in meeting scenarios [10], also considering video cues. More consistently, it would improve social signalling applications [1][2][3][11][12][13][14], such as the ones that link conversational dynamics to social roles (e.g., dominance [15], mirroring [3] and others [1]), or those that face interesting and complex challenges such as the ''thin slice'' detection, i.e., the ability of predicting the outcome of a specific conversational exchange in very limited time [13].…”

Section: Introductionmentioning

confidence: 99%