Artikkelissamme selvitämme Helsinkiä tarkoittavien slanginimien, Hesan ja Stadin, käyttöä uudentyyppisen aineiston ja menetelmän avulla. Aiemmissa näitä nimiä koskevissa tutkimuksissa lähtökohta on ollut kvalitatiivinen, mutta tässä tutkimuksessa lähdemme liikkeelle laajasta digitaalisesta aineistosta ja tilastollisista menetelmistä. Tutkimuksemme on uusi avaus nimistöntutkimuksessa, ja nimitämme sitä korpusavusteiseksi nimistöntutkimukseksi, lyhyemmin korpusonomastiikaksi. Aineistonamme on laaja Suomi24-keskustelufoorumista muodostettu ja Kielipankista saatava Suomi24-korpus, josta olemme hakeneet Hesa- ja Stadi-nimet. Tutkimus toteutetaan korpusavusteisena diskurssintutkimuksena. Molemmat nimet esiintyvät aineistossa yli 45 000 kertaa. Analyysimme alkaa tilastollisesta kollokaatioanalyysista, minkä jälkeen kummankin nimen kollokaateista on valittu tarkasteltavaksi 200 merkitsevintä kollokaattia. Kollokaatit on ryhmitelty merkityksensä perusteella luokkiin, jotka muodostavat näiden sanojen kontekstista fraseologisin perustein havaittavan diskurssiprosodian. Hesa- ja Stadi-nimet jakavat yhteisiä diskursseja, mutta niillä on myös omia diskurssejaan. Hesaa käytetään, kun Helsinkiä katsotaan ulkopuolelta ja se on esimerkiksi muuttamisen tai matkustamisen kohde; lisäksi Hesasta jatketaan matkaa muualle, mikä näkyy monina kaupunkia merkitsevinä kollokaatteina. Erilaisista paikoista ja kaupungeista sekä liikkumisesta ja matkustamisesta keskustelu onkin Hesan yhteydessä tavallista. Stadi-nimi kuvastaa puolestaan syntyperäistä ja aitoa helsinkiläistä identiteettiä, mikä tukee aiempia havaintoja nimen käytöstä. Stadia käytetäänkin juuri silloin, kun puhutaan "meistä stadilaista" ja katsotaan kaupunkia ikään kuin sisältäpäin. ”Stadilaisuutta” korostetaan myös slangisanojen käytöllä Stadi-nimen yhteydessä, ja toisinaan muulta tulleista käytetyt nimitykset ovat melko affektiivisia. Menetelmämme nostaa esiin uutena piirteenä erityisesti sen, että matkustaminen ja liikkuminen on erityisesti Hesaan liittyvien diskurssien läpileikkaava teema. Myös Stadiin liittyy liikkuminen, mutta näkökulma on selvästi erilainen: liikkuminen tapahtuu pikemmin Stadissa kuin sitä kohti tai sieltä pois. Aiempaa tutkimusta tukevat havainnot, jotka liittyvät aidon helsinkiläisen identiteettiin korostamiseen Stadi-nimellä.
Artikkelissani tarkastelen Suomi24-keskustelupalstan homouteen ja heterouteen liittyviä toistuvia diskursseja. Analyysi on toteutettu korpusavusteisena diskurssintutkimuksena (CADS), jossa suureen dataan perustuva tilastollinen avainsana-analyysi nostaa esiin suomalaisen yhteiskunnan sosiaalisesti jaetut diskurssit. Tulokset yhtäältä tukevat aiempia media-analyyseissä tehtyjä havaintoja voimakkaista affekteista ja vihapuheesta sekä homoseksuaalisuuden politisoitumisesta ja uskonnollistumisesta. Toisaalta se myös paljastaa homodiskurssien henkilöitymisen tai liittymisen tiettyihin henkilöryhmiin ja paikkoihin. Heterodiskurssit puolestaan eroavat selvästi homodiskursseista: niille on tyypillistä sekä rationaalinen että tunnepohjainen suuntautumiseen, seksuaalisuuteen ja sukupuoleen liittyvä keskustelu ja omien halujen ja seksuaalisuuden itserepresentointi.
This article illustrates the grammatical and error annotations of a morphologically rich learner language with the help of the International Corpus of Learner Finnish (ICLFI). It especially focuses on problems and solutions in morphological and error annotation, both of which are challenging due to the rich morphological structure of the target language. The article also introduces existing Finno-Ugric learner data and their annotation schemes, and compares those with the ones used in ICLFI annotations. Learner data variables, taxonomy, and principles in grammatical and error annotation are also discussed with the help of the ICLFI in the present article.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.