Jenni Santaharju scite author profile

Jenni Santaharju

5Publications

5Citation Statements Received

79Citation Statements Given

How they've been cited

How they cite others

Affiliations

Helsinki Art Museum, Institute of Evolutionary Biology, University of Helsinki

Publications

Order By: Most citations

Clustering Lexical Variation of Finnic Languages Based on Atlas Linguarum Fennicarum

Honkola

Santaharju

Syrjänen

et al. 2019

View full text Add to dashboard Cite

The article focuses on lexical relations of the Finnic languages. Here we studied whether lexical data is suitable for detecting the coarse-grained and fine-grained substructure within the Finnic group. We evaluated this by clustering old lexical variation from a dialectal dataset covering the whole Finnic speaker area (Atlas Linguarum Fennicarum; ALFE) using quantitative methods adopted from population genetics, and by comparing our results to groups suggested by earlier linguistic literature. We found the main lexical division between northeastern and southwestern Finnic. According to our lexical analysis, the Finnic languages are Finnish, North Estonian, South Estonian, Livonian, Karelian, Veps, and Votic-Ingrian. These groups matched well with the earlier suggested divisions, and we concluded that lexical data could be utilised more often in defining linguistic sub-structures, especially in linguistic situations that involve dialect continua.

show abstract

Lects in Helsinki Finnish - a probabilistic component modeling approach

et al. 2021

View full text Add to dashboard Cite

This article examines Finnish lects spoken in Helsinki from the 1970s to the 2010s with a probabilistic model called Latent Dirichlet Allocation. The model searches for underlying components based on the linguistic features used in the interviews. Several coherent lects were discovered as components in the data, which counters the results of previous studies that report only weak covariation between features that are assumed to be present in the same lect. The speakers, however, are not categorical in their linguistic behavior and tend to use more than one lect in their speech. This implies that the lects should not be considered in parallel with seemingly uniform linguistic systems such as languages, but as partial systems that constitute a network.

show abstract

Katomuotojen eteneminen yleiskielen <i>hd</i>-yhtymässä Helsingin puhekielessä

Kuparinen¹,

Santaharju

Leino

et al. 2022

Virittäjä

View full text Add to dashboard Cite

Artikkeli tarkastelee yleiskielen hd-yhtymän (kahdeksan) esiintymiä Helsingin puhekielessä ja mallintaa katomuotojen (kaheksan) etenemistä reaaliajassa. Artikkelin aineistona käytetään osaa Helsingin puhekielen pitkittäiskorpuksesta, joka kattaa haastatteluja kolmesta eri aikapisteestä: 1970-, 1990- ja 2010-luvuilta. Artikkeli esittää kokonaiskuvan hd-yhtymän variaatiosta ja muutoksesta näiden kolmen aikapisteen välillä ja tarkastelee myös lekseemikohtaisia eroja. Katomuotojen oletetaan etenevän diffuusiomallin mukaisesti hitaasti muotoryhmästä toiseen. Artikkeli osoittaa, että katomuodot yleistyvät Helsingin puhekielessä haastattelukierrokselta toiselle. Valtaosa havaittavasta muutoksesta on peräisin muutamista keskeisistä lekseemeistä, mutta kato etenee myös uusiin lekseemeihin. Kadon etenemistä seurataan niin morfologisten muotoryhmien kuin yksittäisten lekseemien tasolla. Tilastollisina menetelminä hyödynnetään korrelaatiotestejä ja Wilcoxonin testejä. Tulokset osoittavat kadon etenevän Helsingin puhekielessä diffuusiomallin mukaisesti muotoryhmästä toiseen, mutta kato on kaikkein yleisintä hyvin yleisissä sanoissa. The advancement of /d/ deletion after /h/ in Helsinki Finnish The article examines the linguistic variable /hd/ (kahdeksan) in Helsinki Finnish and models the advancement of /d/ deletion in the variable (kaheksan) in real time. The article uses a subset of the longitudinal corpus of Finnish spoken in Helsinki, which includes recordings dating from three points in time: the 1970s, the 1990s and the 2010s. The article presents an overview of the variation and change in the variable between these three time points, and simultaneously examines differences between lexemes and lexeme groups. Deletion is assumed to follow a diffusion pattern, slowly advancing from one morphological group to another. The article shows that such deletion becomes more common over time. The observed change is mostly due to a few high-frequency lexemes, but deletion advances to new lexemes as well. The diffusion is followed both in morphological groups and in lexemes. Methodologically the study uses statistical correlation tests and Wilcoxon signed-rank tests. The results indicate that deletion advances according to the diffusion pattern in Helsinki Finnish even though deletion is most common in very frequent words.

show abstract

Miksi kato leviää?

Knuutila

Kuparinen²,

Santaharju³

et al. 2022

sja

View full text Add to dashboard Cite

Artikkeli tarkastelee syitä katomuotojen esiintymiselle yleiskielen hd-yhtymän asemassa (kaheksan) Helsingin puhekielen pitkittäiskorpuksessa. Mahdollisina syinä tarkastellaan esimerkiksi sanan frekvenssiä sekä muotoseikkoja, kuten hd-yhtymän sijoittumista vokaali- tai konsonanttivartaloon, ja merkitysseikkoja, kuten erisnimiä verrattuna muihin sanoihin. Menetelmällisesti tutkimuksessa hyödynnetään logistisen regression mallia sekä päätöspuuta. Artikkeli osoittaa, että voimakkaimmin kadon todennäköisyyteen Helsingin puhekielessä vaikuttaa sanan frekvenssi. Muotoseikoista kadon todennäköisyyteen vaikuttavat negatiivisesti hd-yhtymän esiintyminen konsonanttivartalossa, pitkän vokaalin, diftongin tai painottoman tavun jäljessä. Sanan kuuluminen erisnimiin on puolestaan merkitysseikoista keskeinen este kadon esiintymiselle. Frekvenssin vaikutus on kuitenkin kaikkein suurin: mikäli sana ei muoto- tai merkityssyistä olisi erityisen hyvin soveltuva katomuodoille, voi korkea frekvenssi silti kasvattaa kadon todennäköisyyttä. Vastaavasti sanoissa, joissa on hyvät edellytykset kadolle, voi matala frekvenssi pitää kadon laajuuden alhaisena.

show abstract

Muutosmallit Helsingin puhekielessä

Kuparinen¹,

Mustanoja²,

Peltonen³

et al. 2019

sja

View full text Add to dashboard Cite

Artikkeli soveltaa William Labovin kehittämää ja sosiolingvistisessä tutkimuksessa keskeiseksi noussutta muutosmalliteoriaa Helsingin puhekielen pitkittäiskorpukseen, joka koostuu haastatteluista 1970-, 1990- ja 2010-luvuilta. Artikkeli tutkii, muuttuvatko Helsingin puhekielen piirteet muutosmallien mukaisesti. Samalla tarkastellaan muutosmallien teorian taustaoletuksia ja ongelmakohtia. Tutkimus osoittaa, että Helsingin puhekielestä löytyy vähintään yksi yhteensopiva piirre kaikkiin muutosmalleihin. Osa malleista näyttää kuitenkin esiintyvän hyvin spesifeissä tilanteissa. Kaikkein yleisimmältä muutosmallilta vaikuttaa sukupolvittainen muutos, jota onkin pidetty tavallisena muutoksen tapana. Samalla havaitaan, että muutosmallien ja muutoksen vaiheen välillä näyttää olevan yhteys: esimerkiksi sukupolvittainen muutos vaikuttaa tavalliselta muutoksen tavalta tilanteissa, joissa piirre on yksinomaistumassa tai katoamassa käytöstä. Artikkeli osoittaa myös, että yksittäinen muutosmalli toteutuu harvoin yli kolmen aikapisteen. Kahden aikapisteen välillä yhdeltä muutosmallilta näyttänyt tendenssi saattaakin kolmannessa aikapisteessä pysähtyä, kääntyä tai harpata eteenpäin. Labovin alkuperäisen ajatuksen mukaan näennäisaikamenetelmä ei voi erottaa toisistaan muutosmalleja. Tämä tutkimus osoittaa, että myös kahden aikapisteen reaaliaikatutkimus on altis tulkintavirheille. Tutkimus tuottaa myös uutta tietoa Helsingin puhekielen nykyvariaatiosta. Muutosmallien teorian tarkastelun yhteydessä havaitaan esimerkiksi, että yleiskielen ts:n vastineeksi on Helsingin puhekielen aineistossa vakiintumassa astevaihtelu tt ~ t, ja että paikallissijojen loppuheitto näyttää tasaisen variaation piirteeltä, jossa ei ole meneillään muutosta.

show abstract

scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.

Contact Info

hi@scite.ai

10624 S. Eastern Ave., Ste. A-614

Henderson, NV 89052, USA

Blog Terms and Conditions API Terms Privacy Policy Contact Cookie Preferences Do Not Sell or Share My Personal Information

Made with 💙 for researchers

Part of the Research Solutions Family.