2022
DOI: 10.1002/widm.1450
|View full text |Cite
|
Sign up to set email alerts
|

Machine learning methods for generating high dimensional discrete datasets

Abstract: The development of platforms and techniques for emerging Big Data and Machine Learning applications requires the availability of real‐life datasets. A possible solution is to synthesize datasets that reflect patterns of real ones using a two‐step approach: first, a real dataset X is analyzed to derive relevant patterns Z and, then, to use such patterns for reconstructing a new dataset X′ that preserves the main characteristics of X. This survey explores two possible approaches: (1) Constraint‐based generation … Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1

Citation Types

0
1
0

Year Published

2024
2024
2024
2024

Publication Types

Select...
2
1

Relationship

0
3

Authors

Journals

citations
Cited by 3 publications
(2 citation statements)
references
References 51 publications
0
1
0
Order By: Relevance
“…Syntetický obsah sa vzťahuje na digitálne médiá vytvorené alebo upravené pomocou technológií AI, ako sú generatívne adversárne siete (GAN), ktoré napodobňujú reálny vizuálny alebo zvukový materiál s vysokou presvedčivosťou. Tieto technológie umožňujú vytváranie realistických obrázkov, videí, zvukov a textov, ktoré môžu byť nerozoznateľné od autentického obsahu vytvoreného ľuďmi alebo zachyteného prostredníctvom tradičných metód (Manco, Ritacco, Rullo, Saccá & Serra, 2022).…”
Section: Dezinformácieunclassified
“…Syntetický obsah sa vzťahuje na digitálne médiá vytvorené alebo upravené pomocou technológií AI, ako sú generatívne adversárne siete (GAN), ktoré napodobňujú reálny vizuálny alebo zvukový materiál s vysokou presvedčivosťou. Tieto technológie umožňujú vytváranie realistických obrázkov, videí, zvukov a textov, ktoré môžu byť nerozoznateľné od autentického obsahu vytvoreného ľuďmi alebo zachyteného prostredníctvom tradičných metód (Manco, Ritacco, Rullo, Saccá & Serra, 2022).…”
Section: Dezinformácieunclassified
“…This can be done using techniques such as combinatorial testing and variational autoencoder [25]. Another approach is constraint-based generation, where a dataset is generated to satisfy given support constraints on itemsets [26]. Probabilistic generative modeling is another approach that models data generation as a sampling process from a parametric distribution, often encoded as a neural network [27].…”
Section: Related Workmentioning
confidence: 99%