annotation_guide.tex

%% LyX 1.3 created this file.  For more info, see http://www.lyx.org/.
%% Do not edit unless you really know what you are doing.
\documentclass[12pt,finnish]{book}
\usepackage[T1]{fontenc}
\usepackage[latin1]{inputenc}
\usepackage{a4wide}
\setcounter{secnumdepth}{0}
\usepackage{array}
\usepackage{longtable}
\usepackage{makeidx}
\makeindex
\IfFileExists{url.sty}{\usepackage{url}}
                      {\newcommand{\url}{\texttt}}
\usepackage[numbers]{natbib}

\makeatletter

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% LyX specific LaTeX commands.
%% Bold symbol macro for standard LaTeX users
\newcommand{\boldsymbol}[1]{\mbox{\boldmath $#1$}}

%% Because html converters don't know tabularnewline
\providecommand{\tabularnewline}{\\}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% User specified LaTeX commands.
\usepackage{ae,aecompl}
\usepackage[plainpages=false,pdfpagelabels]{hyperref}
\usepackage[pdftex]{graphicx}
\usepackage{lscape}

% Change this if using latex instead of pdflatex:
\graphicspath{{jpgfigs/}}
\DeclareGraphicsExtensions{.jpg,.eps}

\usepackage{makeidx}
\usepackage[T1]{tipa}
\usepackage{tipx}
\usepackage{longtable}
\usepackage{multirow}

\input{/home/lennes/bin/tex/fihyph}

\renewcommand\ttdefault{pcr}

\AtBeginDocument{
  \renewcommand{\labelitemiii}{\normalfont\bfseries{--}}
  \renewcommand{\labelitemiv}{\normalfont\bfseries{--}}
}

\usepackage{babel}
\makeatother
\begin{document}

\title{Puheaineiston annotaatio eli nimikointi}


\author{Mietta Lennes\\
Sanna Ahjoniemi}


\date{Versio 1.01\\
\today}

\maketitle
\tableofcontents{}


\part{\label{par:Puheen-annotaatio}Puheen annotaatio}


\chapter{\label{sec:Mita-on-annotaatio?}Mitä on annotaatio?}

\textbf{Annotointi\index{annotoida} eli nimikointi\index{nimikointi}
on puhe- tai muun aineiston kuvaamista, luokittelua ja jäsentelyä
systemaattisella tavalla.} Digitaalisesti tallennettu puhenäyte nimikoidaan
yleensä jollakin tähän tarkoitukseen kehitetyllä tietokoneohjelmalla
(esim. Praat, Puh-editori, CLAN, Anvil). Tämä annotaatio-oppaan osa
kannattaa lukea ensin, jos ei ole aikaisemmin nimikoinut l. annotoinut
puheaineistoa.%
\footnote{Lisätietoa puhekorpusten tuottamisesta ja eri korpuksissa käytetyistä
annotaatiotavoista löytyy esim. teoksesta \emph{The Production of
Speech Corpora} \citep{Schiel04}.%
}

Nimikoinnilla (engl. \emph{labeling}) eli annotoinnilla (\emph{annotation}
> \emph{to annotate}) tarkoitetaan sitä, että digitaalisesti tallennettuun
puhenäytteeseen liitetään systemaattisesti nimikkeitä\index{nimike}
(\emph{labels}) eli annotaatioita\index{annotaatio} (\emph{annotations})
eli symbolisia kuvauksia näytteen sisällöstä. Nimikoitavan ääni- tai
videonäytteen on oltava digitaalisessa muodossa ts. yhtenä tai useampana
tiedostona esim. tietokoneen kovalevyllä tai erityyppisillä levykkeillä.%
\footnote{Myös erilaiset \textbf{kirjoitetun tekstin} joukkoon lisätyt tagit
(\emph{tag}) ovat annotaatioita. Tällöin aikaulottuvuutta vastaa tekstin
lineaarinen rakenne (merkkien sijainti tekstin alkuun nähden) ja ääninäytteen
segmenttiä vastaa jokin tekstin osa, jonka ympärille tagit on merkitty.
Tässä oppaassa käsitellään kuitenkin ainoastaan puheaineiston annotaatiota.%
} Alkuperäistä tallennetta, esim. ääni- tai videotiedostoa, jota annotaation
avulla kuvataan, kutsutaan tässä yhteydessä \emph{signaaliksi}\index{signaali}.
Jos kuvataan ääneen luettua, kirjoitettua tekstiä, annotoitava signaali
on aina puhesignaali. 

\textbf{Nimikoinnissa annotaatiot on sidottava ääni- tai videonäytteen
aikaulottuvuuteen.} Tämän tavoitteen saavuttamiseksi näytettä kuunnellaan
ja/tai katsellaan ja siitä piirrettyjä analyysikuvia tarkastellaan
nimikointiin tarkoitetulla ohjelmalla. Kuuntelun ja katselun perusteella
luodaan ääni- ja/tai videonäytteen \char`\"{}pariksi\char`\"{} tai
laajennukseksi nimikointitiedosto, joka sisältää näytteen kuvaukset.
Tätä varten näyte yleensä \emph{segmentoidaan}\index{segmentoida}:
siitä rajataan halutulla tarkkuudella \emph{segmenttejä}\index{segmentti}
(ääni- tai videopätkiä, joilla on määrätty alku- ja loppupiste sekä
ajallinen kesto; engl. \emph{segment}). Segmenteille voidaan sitten
antaa nimiä eli \emph{nimikoida} ne. Myös näytteen tietyille yksittäisille
ajanhetkille (aikapisteille, engl. \emph{time point}) voidaan antaa
nimiä (näin syntyy ns. \emph{ankkureita}\index{ankkuri}, engl. \emph{anchor}\index{anchor}).
Nimikoinnin tarkoituksena on muodostaa \char`\"{}maamerkkejä\char`\"{},
joiden perusteella alkuperäisestä puhesignaalista voidaan löytää halutut
osat ja kohdistaa niihin vaikkapa akustisia analyyseja tai muita toimenpiteitä.
\textbf{Nimikointi on välttämätöntä, jos halutaan hallita ja hyödyntää
suurta määrää puheaineistoa.}

Pelkkä ääninäytteen litterointi esimerkiksi tekstitiedostoon ei siis
vielä ole nimikoimista, koska siinä litteraatin eri osia ei kytketä
ääninäytteen vastaaviin ajallisiin kohtiin. Kannattaa huomata, että
litteraatti tai mikä tahansa muu transkriptio on aina tulkinta alkuperäisestä
aineistosta. Siksi pelkän litteraatin avulla ei pitäisi koskaan tutkia
puhetta --- vaarana on, että tulee pikemminkin tutkineeksi litteroijan
näkemystä, joka on vieläpä kuvattu kirjoitetulla kielellä! Käyttämällä
nimikointia aineiston kuvausmenetelmänä varmistetaan mahdollisimman
suora ja tarkka yhteys alkuperäiseen puhetallenteeseen, jolloin tutkijalla
ja tutkimuksen arvioijalla on mahdollisuus tarkistaa ja korjailla
puheesta luotuja kuvauksia.

Annotaatiotyylejä on erilaisia ja tutkija voi kehittää oman annotaatiotavan
sen mukaan, minkälaisista puheen ilmiöistä on kiinnostunut. Annotaatio
voi olla esimerkiksi ortografinen ts. oikeinkirjoitusta noudattava
litteraatti\index{litteraatio} (engl. yl. \emph{transliteration\index{transliteration},
transcript}\index{transcript})\emph{}%
\footnote{Huom. suomessa käsite \emph{translitteraatio} tarkoittaa lähinnä tietyn
kielen kirjoitusasun muuntamista merkkijärjestelmästä toiseen, esim.
venäjänkielisen kirjoituksen kyrillisten aakkosten muuntamista latinalaiselle
aakkostolle. Translitteraatio ei siis ole aivan sama asia kuin litteraatio,
jossa puhetta ''kirjainnetaan''.%
}, morfologisten yksiköiden kuvaus, prosodisten piirteiden kuvaus tai
vaikkapa foneettinen transkriptio puheesta. Ensin mainitussa tapauksessa
segmenttirajat voivat olla vaikkapa yksittäisten sanojen tai lauseiden
välillä, kun taas foneettista tutkimusta varten rajataan usein yksittäisiä
äänteitä.

Jos erilaisia puheen yksiköitä halutaan käyttää hyödyksi yhdessä,
voidaan luoda useita annotaatio- tai nimikointikerroksia tai -tasoja:
yhdelle merkitään esimerkiksi äänteiden rajat, toiselle sanojen rajat,
kolmannelle lauserajat jne. Samalla tallenteella voi myös olla useita
rinnakkaisia annotaatioita: eri tutkijat voivat annotoida saman aineiston
kukin oman näkemyksensä mukaisesti.

Automaattisia segmentointi- ja nimikointimenetelmiä yritetään jatkuvasti
kehittää eri puolilla maailmaa. Toistaiseksi tarkimman nimikoinnin
saa kuitenkin aikaan ihminen, sillä puheen nimikointi vaatii monenlaisten
kielellisten tulkintojen tekemistä. Samasta syystä voidaan todeta
myös, että sekä puheen litterointi, transkriptio että nimikointi ovat
aina jossakin määrin subjektiivisia tuotoksia: niiden tarkkuus ja
johdonmukaisuus riippuvat nimikoijan intresseistä, tiedoista, taidoista
ja teoreettisesta näkemyksestä.


\section{\label{sec:Miksi-puhetta-nimikoidaan}Miksi puhetta nimikoidaan eli
annotoidaan?}

Nimikointityökalua käyttämällä puhenäytteestä on helppo nopeasti ja
tarkasti etsiä, rajata ja kuunnella eri pituisia osia. Tämä helpottaa,
nopeuttaa ja tarkentaa merkittävästi litterointia ja transkriptiota.
Esimerkiksi intonaatiotranskription tekeminen helpottuu, kun kuulohavaintoa
voidaan heti verrata äänisignaalista laskettuun perustaajuuskäyrään.

Nimikoidusta äänitiedostosta voidaan mitata tarkasti puheen eri yksiköiden
kestoja. Mittauksia voidaan suorittaa jopa täysin automaattisesti
(edellyttäen että puhe on nimikoitu mittausten kannalta järkeviin
yksiköihin). Erilaiset akustiset analyysit voidaan automaattisesti
kohdistaa vain tarvittaviin osiin näytettä. Nimikoinnin perusteella
tehdyt mittaukset voidaan milloin tahansa toistaa täysin identtisinä.
Tutkimustuloksiin on siten helppo myöhemmin palata. 

Digitaalinen ääninäyte säilyy tarvittaessa täysin muuttumattomana
pitkiäkin aikoja ja siitä voidaan tehdä identtisiä kopioita. Alkuperäistä
digitoitua ääninäytettä (esim. keskusteluäänite) ei tarvitse välttämättä
pilkkoa pienempiin osiin jokaista tutkimusta tai demoa varten, vaan
se voidaan säilyttää kokonaisena esimerkiksi CD- tai DVD-levyillä,
eikä tällöin menetetä informaatiota esimerkiksi taukojen kestoista. 

Digitaalista, systemaattisesti nimikoitua puheaineistoa on helppo
jakaa muidenkin tutkijoiden kanssa. Muut tutkijat voivat nopeasti
tutustua nimikoituun puhenäytteeseen ja käyttää sitä soveltuvin osin.
Nimikointeihin voidaan tehdä muutoksia ja lisäyksiä oman tarpeen mukaan.
Tämän oppaan periaatteiden mukaisesti nimikoitu äänitiedosto voidaan
liittää osaksi kaikkien tutkijoiden käyttämää puhetietokantaa, eikä
tutkijoiden tarvitse aina itse kerätä ja nimikoida uusia aineistoja.

Annotaation tekeminen on usein pitkäveteistä puurtamista. Jokaisen
puheentutkijan olisi kuitenkin hyödyllistä yrittää annotoida itse
ainakin koemielessä pieni osa käyttämästään aineistosta, sillä näin
oppii ymmärtämään annotaatioprosessia ja sen vaikutuksia tutkimukseen.
Usein annotoidessa löytää myös mielenkiintoisia uusia tutkimuskohteita.


\subsection{\label{sub:Johdonmukainen-annotaatio}Johdonmukainen annotaatio}

Puheen kuvauksessa tulee pyrkiä noudattamaan yhtenäisiä periaatteita,
jotta aineiston annotaatio pysyisi kauttaaltaan mahdollisimman tasalaatuisena
ja jotta se olisi kenen tahansa tutkijan käytettävissä ja ymmärrettävissä.
Annotoijalle pitää olla aina täysin selvää, mitä ilmiötä, yksikköä
tai käsitettä ollaan annotoimassa, ja tietyntyyppiset yksiköt pitää
rajata ja merkitä johdonmukaisesti aina samalla tavalla. 

Käytännössä ihmiset ovat usein eri mieltä annotoitavien yksiköiden
rajauksesta ja nimikkeistä. Yhdessä sovitut annotointiperiaatteet
on helppo unohtaa, ja tyypillisesti annotoija muuttaa yhdenkin annotaatioprojektin
aikana näkemystään ''hyvästä annotaatiosta'' useita kertoja. Tämä
on aivan luonnollinen ilmiö, sillä monet teoreettiselta kannalta hyödylliset
puheen yksiköt eivät olekaan selkeästi erotettavissa ja rajattavissa
todellisesta puhesignaalista. Puheessa ei esimerkiksi normaalisti
ole taukoja sanojen välillä, ja puheentuoton aikana ihmisen ääntöelimistö
on käytännöllisesti katsoen jatkuvassa liikkeessä, joten äänteiden
rajatkin ovat ''sumeita''. Annotointi perustuu siis aina annotoijan
tulkintaan puheaineistosta.

Tämän oppaan tarkoituksena on antaa yleisiä ohjeita erilaisten yksiköiden
annotointia varten. Tavoitteena on, että jokainen tutkija käyttää
annotoidessaan tässä oppaassa määriteltyjä yksiköitä niin pitkälle
kuin se on mahdollista. Mikäli tutkija haluaa tarkentaa määritelmiä
tai käyttää kokonaan uusia yksiköitä, ne tulisi määritellä ja julkaista
virallisesti Puh-editorin avulla (ks. \ref{sec:Uuden-annotaatioyksikon-maaritteleminen}).


\section{\label{sec:Akustisten-analyysien-hyodyntaminen}Akustisten analyysien
hyödyntäminen nimikoinnissa}

Puhetta voidaan nimikoida sekä akustisin että auditiivisin perustein.
Digitaalisen puheen analysointiin luodut tietokoneohjelmat tuottavat
puheesta erilaisia akustisia analyyseja, joita voi hyödyntää myös
nimikoinnissa. Näitä ovat mm. spektrogrammi, perustaajuuskäyrä, intensiteettikäyrä,
aaltomuoto ja spektrianalyysi.


\subsection{\label{sub:Spektrogrammi}Spektrogrammi}

Äänteiden nimikoinnissa erityisesti \emph{\label{sub:leveakaistainen-spektrogrammi}leveäkaistainen
spektrogrammi\index{leve\"akaistainen spektrogrammi}} (laskentaikkunan
koko n. 4,3 ms) on usein hyödyllinen, sillä siinä erottuvat selvästi
äänen spektrirakenteen nopeat ajalliset muutokset, jotka liittyvät
puhujan artikulaatioliikkeisiin. \emph{\label{sub:kapeakaistainen-spektrogrammi}Kapeakaistaisesta
spektrogrammista\index{kapeakaistainen spektrogrammi}} (laskentaikkunan
koko n. 29--35 ms) näkyvät puolestaan parhaiten puheen soinnillisten
osien perustaajuuden ja osasävelten liikkeet, joten sitä voidaan hyödyntää
prosodisten piirteiden, erityisesti intonaation kuvauksessa.


\subsection{\label{sub:Intensiteettikayra}Intensiteettikäyrä}

Intensiteetti (joka on epäsuorassa yhteydessä havaittuun äänekkyyteen)
on riippuvainen äänteen laadusta: esim. vokaalit ovat luonnostaan
äänekkäämpiä kuin konsonantit, sillä ääntöväylä on vokaalien aikana
avoimempi. Intensiteettikäyrä voi siksi auttaa joidenkin äännerajojen
havaitsemisessa. Laajemmin tarkasteltuna intensiteettikäyrä voi myös
antaa informaatiota puhujan aiheuttamasta puheäänen voimakkuuden lisäyksestä
ja liittyy siten myös prosodisiin ilmiöihin. Intensiteettikäyrä on
kuitenkin herkkä puhujan ja mikrofonin väliselle etäisyydelle: jos
puhuja liikahtaa vähänkin suhteessa mikrofoniin, esim. kääntää päätään
kun mikrofoni on pöydällä, tämä vaikuttaa äänisignaalista laskettuun
intensiteettiin. \char`\"{}Headsettiin\char`\"{} kiinnitetty mikrofoni
pysyy paremmin paikallaan puhujan suun vieressä, joten intensiteettikäyrässä
näkyvät heilahdukset johtuvat tässä tapauksessa todennäköisemmin puheentuoton
muutoksista. Huomaa, että intensiteettikäyrästä saadut desibeliarvot
eivät tarkoita sinänsä mitään, jollei alkuperäistä äänitettä ole kalibroitu
(ts. suhteutettu tiettyyn referenssiääneen jo äänityshetkellä)!


\subsection{\label{sub:Perustaajuuskayra}Perustaajuuskäyrä}

\emph{Puheen perustaajuus\index{perustaajuus}} eli \emph{F0\index{F0}}
viittaa soinnillisissa äänteissä siihen taajuuteen, jolla äänihuulet
''värähtelevät'' tai paukahtelevat toisiaan vasten. Yksittäistä
jaksoa, jonka aikana äänihuulet erkaantuvat toisistaan ja palaavat
takaisin yhteen, kutsutaan \emph{periodiksi}%
\footnote{Kapeakaistaisessa spektrogrammissa (ks. \ref{sub:kapeakaistainen-spektrogrammi})
soinnillisten äänteiden osasävelet (\emph{harmonics}) erottuvat aaltoilevina
raitoina, joista alimmainen kuvaa perustaajuutta. Leveäkaistaisessa
spektrogrammissa (\ref{sub:leveakaistainen-spektrogrammi}) puolestaan
erottuvat yksittäiset äänihuuliperiodit pystysuorina raitoina. Periodit
voi erottaa myös äänen aaltomuodosta toistuvina aaltokuvioina, kun
aaltomuotoa tarkastellaan suurennettuna.%
}\index{periodi}\index{periodisuus}. Periodeja esiintyy siis vain
soinnillisissa äänteissä, ja samasta syystä laskennallisessa perustaajuuskäyrässä
näkyy katkos soinnittomien äänteiden kohdalla, vaikka puheen melodia
havaitaankin jatkuvana.

Perustaajuus ilmoitetaan yleensä hertseinä\index{hertsi}: esimerkiksi
miespuhujille tyypillinen sadan hertsin perustaajuus siis tarkoittaa
sataa äänihuulten värähdystä sekunnissa. Perustaajuuskäyrän muoto
voi oikein tulkittuna hyvin nopeasti ja tarkasti vahvistaa tai kumota
kuulonvaraisen ja subjektiivisen havainnon puheen sävelkulussa tapahtuvasta
noususta tai laskusta. Joskus se voi auttaa myös äänteiden nimikoinnissa:
pienikin perustaajuuden muutos voi olla syynä kuulonvaraisesti löytyneeseen
rajakohtaan.

Laskennallinen perustaajuus ei kuitenkaan ole sama asia kuin havaittu
intonaatio tai sävelkulku. Perustaajuuskäyrään ei kannata luottaa
sokeasti, sillä siinä voi laskennallisista syistä esiintyä äkillisiä
hyppäyksiä ja toisaalta perustaajuuskäyrään vaikuttavat myös äännekohtaiset
seikat. Prosodiikasta kiinnostuneen kannattaa katsella lähempää myös
äänen aaltomuotoa (\ref{sub:Aaltomuoto}) ja spektrogrammeja (\ref{sub:Spektrogrammi}),
sillä ne voivat paljastaa perustaajuusanalyysin virhelähteitä (esim.
narinaan liittyvät epäsäännölliset äänihuuliperiodit).


\subsection{\label{sub:Aaltomuoto}Aaltomuoto}

Aaltomuoto eli oskillogrammi kuvaa ääniaaltoa eli alkuperäiseen ääneen
liittyviä ilmanpaineen ajallisia vaihteluita, jotka on rekisteröity
tietystä paikasta mikrofonin avulla. Tietokoneen näytöllä olevan aaltomuotokäyrän
yksikkö on kuitenkin tavallisesti voltti (V), sillä mikrofoni on muuntanut
ilmanpaineen vaihtelut sähköiseen muotoon, joka on sitten näytteistetty
digitaaliseksi äänisignaaliksi. 

Aaltomuotokäyrän vaaka-akseli kuvaa siis aikaa, joka etenee vasemmalta
oikealle. Pystyakseli kuvaa ääniaaltojen laajuutta eli amplitudia.
Mitä suurempi ääniaallon amplitudi on tarkasteltavalla ajanjaksolla,
sitä suurempi on vastaavasti ollut ilmanpaineen muutos ja sitä voimakkaampi
ääni on ko. ajanjaksolla ollut. Äänen amplitudi ei kuitenkaan vastaa
suoraan ts. lineaarisesti havaittua äänenvoimakkuutta eli äänekkyyttä.
Äänekkyyshavaintoon vaikuttavat ihmisen kuulojärjestelmän ominaisuudet
(psykoakustiikka) ja muutkin seikat.

Aaltomuotokäyrää voidaan käyttää esimerkiksi äänteiden tarkkaan segmentointiin
spektrogrammin ohella, sillä siitä näkyvät äänessä tapahtuneet pienimmätkin
muutokset. Aaltomuoto voi paljastaa myös äänenlaadussa tapahtuneita
muutoksia, jotka voivat selittää esimerkiksi perustaajuuskäyrän odottamattomia
katkoksia tai hypähtelyjä.


\section{\label{sec:Aineiston-luomat-rajoitukset}Aineiston luomat rajoitukset}

Mitä enemmän taustahälyä annotoitavassa signaalissa on, sitä epätarkempaa
annotointi on. Hyvin hälyisestä aineistosta ei kannata yrittää etsiä
kovin hienojakoisia piirteitä, sillä lopputuloksesta voi tulla heikkotasoinen.
Jos esim. puheäänitteessä on tasainen mutta melko vaimea taustakohina,
äänteiden rajat pystyy yleensä akustisen signaalin kuvauksia katsomalla
määrittämään riittävän tarkasti esimerkiksi äännekestojen mittaamista
varten. 

Erilaiset hälyn lähteet ja taustahälyn tyypit on syytä kuvata mahdollisimman
tarkasti jo tallenteen (Recording) taustatiedoissa.%
\footnote{Tallenteen taustatiedot\index{taustatiedot} eli ns. \emph{metatiedot\index{metatiedot}}
tai \emph{metadata\index{metadata}} on kuvattava Puh-editorin avulla
aina, kun aloitetaan kokonaan uuden puheaineiston annotaatio.%
} Jos häly ei jatku koko tallenteessa, tallenteen käyttökelpoisuutta
lisää huomattavasti, jos hälyn ajallinen levinneisyys on merkitty
omaan annotaatiokerrokseensa (ks. \emph{Noise}-annotaatioyksikkö,
\ref{sub:Noise-haly}).


\section{\label{sec:Annotointityokalut}Annotointityökalut}

Puheen annotointiin on olemassa monia työkaluja, joilla on erilaisia
ominaisuuksia. Tämä ohjeistus soveltuu parhaiten annotointiin Puh-editori-nimisellä
ohjelmalla. Annotaatiota voi kuitenkin tehdä myös muilla ohjelmilla,
kunhan pitää mielessään tässä dokumentissa annetut ohjeet (ks. esim
kuva \ref{fig:Esimerkki-dialogin-annotaatiosta}). Tällöin annotaatiotiedostot
voidaan automaattisesti muuntaa puhetietokantajärjestelmään sopiviksi.

\begin{landscape}%
\begin{figure}
\begin{center}\includegraphics[%
  width=22cm,
  keepaspectratio]{/home/lennes/annotation_guide/jpgfigs/conv_ann_example.jpg}\end{center}


\caption{\label{fig:Esimerkki-dialogin-annotaatiosta}Esimerkki dialogin annotaatiosta\index{dialogin annotaatio, esimerkki}
Praat-ohjelmalla. Puhujien S1 ja S2 puheeseen liittyvät annotaatioyksiköt
on merkitty eri kerroksiin. Topic-kerroksessa on vapaamuotoinen englanninkielinen
kuvaus puheenaiheesta: tässä on menossa keskustelu vanhoista elokuvista.}
\end{figure}
\end{landscape}


\subsection{\label{sub:Annotointi-Puh-editorilla}Annotointi Puh-editorilla}

Puh-editori ohjaa käyttäjää noudattamaan ohjeita ja määrittelemään
käyttämänsä annotaatioyksiköt tarkasti. Puh-editorissa voidaan annotoida
lukuisia annotaatiokerroksia samanaikaisesti. Puh-editoria käyttämällä
kaikki annotaatiot ovat suoraan yhteensopivia liitettäväksi puhetietokantaan,
ja niitä voidaan myös helposti jakaa muiden tutkijoiden kanssa. Puh-editori
voidaan asentaa tietokoneisiin, joissa on Windows- tai \linebreak
Linux-käyttöjärjestelmä. Editorin voi ladata ilmaiseksi omalle koneelleen
www-osoitteesta

\url{http://www.csc.fi/kielipankki/puhe/index.phtml}

Samassa paikassa on myös ohjelman käyttöopas.


\subsection{\label{sub:Annotointi-Praat-ohjelmalla}Annotointi Praat-ohjelmalla}

Jos käytät annotointiin Praat-ohjelmaa (\citealt{Boersma}), kaikki
tekemäsi annotaatiokerrokset (Tier) ovat fyysisesti täysin erillisiä.
Eri kerroksissa olevien yksiköiden välisiä suhteita voi kuitenkin
kuvata niiden mahdollisen ajallisen päällekkäisyyden avulla. Tätä
tietoa voi Praatin sisällä hyödyntää vain skripteissä. 

Praat-ohjelmalla tehdyt annotaatiotiedostot (TextGrid) on mahdollista
muuntaa puhetietokannan käyttämään muotoon. Osoitteessa

\url{http://www.csc.fi/kielipankki/puhe/index.phtml} 

on linkki ohjattuun konvertointi- ja julkaisutyökaluun (\emph{Publish
TextGrid Web Wizard}), joka muuntaa Kielipankin puheaineistoista tehdyt
annotaatiotiedostot Puh-editorin ymmärtämään muotoon ja julkaisee
annotaatiokerrokset. Tämä mahdollisuus kannattaa huomioida jo Praatilla
annotoitaessa. 

\begin{itemize}
\item Varmista, että sellaisilla eri kerroksissa olevilla annotaatioyksiköillä,
joilla on keskenään esimerkiksi osa-kokonaisuussuhde, on täsmälleen
päällekkäiset alku- ja loppurajat. Esim. jos annotoit Praatilla sanakerroksen
ja tavukerroksen, varmista, että sanan alkuraja on täsmälleen samalla
kohdalla kuin sanan ensimmäisen tavun alkuraja, ja että sanan loppuraja
on täsmälleen samassa kohdassa kuin sanan viimeisen tavun loppuraja
(ks. esimerkkejä sanakerroksesta kuvassa \ref{fig:Esimerkki-dialogin-annotaatiosta}).
Tietyssä kerroksessa oleva rajaviiva voidaan kohdistaa toisessa kerroksessa
olevan rajan kanssa ''tarttumalla'' rajaan hiirellä, vetämällä se
toisessa kerroksessa olevan rajan päälle ja vapauttamalla sitten hiiren
painike. Kohdistettujen rajojen perusteella voidaan haku- ja analyysivaiheessa
yhdistää tavuyksiköt vastaaviin sanayksiköihin. 
\item \label{ite:piirteiden-annotointi-Praatilla}Jos jonkin annotaatiokerroksen
A yksiköille pitää määrittää lisäpiirteitä tai \linebreak -ominaisuuksia
niin, että kutakin segmenttiä tms. yksikköä vastaa aina maksimissaan
yksi toisen tason B yksikkö tai piirre, pidä huolta, että kerros A
on tyyppiä IntervalTier ja kerros B tyyppiä PointTier. Merkitse kerrokseen
B piste tai ankkuri (point) silmämääräisesti suunnilleen A-kerroksen
vastaavan yksikön puoliväliin. Anna tarvittaessa B-tason pisteille
nimet, jotka kuvaavat piirteen arvoja tai sisältöjä. \\
Tässä tapauksessa PointTieriä kannattaa käyttää, koska segmenttirajoja
joutuu merkitsemään vähemmän, eikä B-tason rajojen kohtia yleensä
tarvitse korjata, vaikka A-tason segmenttien rajat hieman muuttuisivatkin.
PointTierin sisältämät piirrearvot on Puh-editorissa helppo muuntaa
A-tasolle merkittyjen yksiköiden piirteiksi.
\end{itemize}

\part{\label{par:Annotaatioyksikot}Annotaatioyksiköt}

Tutkijan ja annotoijan on hyvä huomata, että seuraavat yleisluonteiset
annotaatioyksiköt on muodostettu ensisijaisesti niiden laajaa käyttöä
ajatellen. Tarkoitus ei siis ole ollut juuttua lujasti mihinkään tiettyyn
teoreettiseen viitekehykseen vaan antaa ohjeet siitä, kuinka puheaineistosta
voidaan rajata usein käytettyjä yksiköitä ja piirteitä mahdollisimman
yksiselitteisesti siten, että yksiköt soveltuvat tietokantajärjestelmään.
On myös itsestään selvää, että kaikki yksiköt eivät sellaisenaan sovellu
kaikkien aineistojen nimikointiin.%
\footnote{Tässä oppaassa kuvatut yksiköt ja niiden käyttöohjeet vastaavat Kielipankin
julkaiseman RDF-skeeman \url{http://www.csc.fi/kielipankki/puhe/schemas/official/annotation/coreUnits.rdfs}
sisältämiä määrittelyjä. Kielipankin tarjoama Puh-editori tukee kyseistä
RDF-skeemaa ja ohjaa annotoijaa käyttämään oikein valmiiksi määriteltyjä
perusyksiköitä. Tätä ohjeistoa ja annotaatioyksiköitä kannattaa kuitenkin
soveltaa myös muilla ohjelmilla annotoitaessa.%
}

Tutkijalle jää lopullinen vastuu siitä, ovatko näin syntyneestä tietokannasta
tehdyt haut mielekkäitä ja siitä, kuinka hän itse yhdistelee erilaisia
yksiköitä niin, että saa haluamansa tiedon esille. Mikään alla kuvatuista
yksiköistä ei yksinään tuota kovin hyödyllistä tietokantaa, mutta
kun samasta aineistosta on olemassa useita erityyppisiä annotaatiokerroksia
--- mahdollisesti jopa monen eri annotoijan tekeminä --- on tietokannan
rakenteessa paljon implisiittistä informaatiota, joka voidaan oikein
rakennetuilla hakukriteereillä houkutella päivänvaloon. Näin myös
eri alojen tutkijat voivat toimia paremmin yhteistyössä ja hyödyntää
toistensa tietämystä.


\chapter{\label{cha:Yksikoiden-kaytto}Kuinka annotaatioyksiköitä käytetään?}


\section{\label{sec:Annotaatioyksikoiden-kaytto}Annotaatioyksiköiden käyttö}

Tässä oppaassa esiteltävät annotaatioyksiköt ovat perusyksiköitä,
jotka on pyritty määrittelemään selkeästi mutta vain yleisellä tasolla,
jotta eri tutkijat voisivat soveltaa niitä mahdollisimman laajasti.
Näihin yksiköihin ei kuitenkaan ole pakko tyytyä. Mikäli tutkija tai
annotoija päätyy systemaattisesti käyttämään tietystä perusannotaatioyksiköstä
tarkempaa tai hienojakoisempaa kuvaustapaa, tai mikäli hän päätyy
annotoimaan täysin uudenlaista piirrettä puheaineistosta, on tarpeen
määritellä uusi annotaatioyksikkö. Uusia yksiköitä voidaan määritellä
Puh-editorilla, jolla määritelmät voidaan myös julkaista muille tutkijoille.%
\footnote{Puh-editoria ei silti ole välttämätöntä käyttää varsinaiseen puheaineiston
nimikointiin, kunhan yksiköiden määritelmiä noudatetaan. Uudet yksiköt
tulisi kuitenkin aina määritellä Puh-editorin avulla, jotta niiden
käyttötapa selkiytyy muille annotoijille.%
} 


\section{\label{sec:Uuden-annotaatioyksikon-maaritteleminen}Uuden annotaatioyksikön
määritteleminen}

Perusannotaatioyksiköistä voidaan tarvittaessa \emph{periyttää\index{periyttäminen}}
aliyksiköitä\index{aliyksikkö}, joilla on samat ominaisuudet kuin
emoyksiköllään, mutta sen lisäksi joitakin uusia ominaisuuksia. Tällöin
on huomattava, että \emph{uusi aliyksikkö perii välttämättä kaikki
ne ominaisuudet ja piirteet, jotka sen emoyksiköllä on}, eikä aliyksikkö
siis saa olla ristiriidassa emoyksikön määritelmän kanssa.%
\footnote{Tämä ehto on seurausta yksiköiden määritelmien tallennukseen käytettävästä
standardoidusta RDF-dokumenttiformaatista, joka mahdollistaa määritelmien
perusteella tapahtuvan koneellisen päättelyn. Esimerkiksi Puh-editori
voi RDF-muotoisten määritelmien perusteella valvoa, että annotoija
todella noudattaa määritelmässä mainittuja rajoituksia.%
} Jotta uusien aliyksiköiden luominen olisi mahdollisimman joustavaa,
on useimpien tämän oppaan yksiköiden kuvauksen tarkka muoto jätetty
annotoijan päätettäväksi.

Kuvitellaan, että esimerkiksi annotaatioyksikölle \emph{MyBasicUnit}
on määritelty ominaisuus \emph{label} (nimike tai tekstikuvaus), jolle
on määritelty tietty joukko mahdollisia arvoja, esimerkiksi ''tyyppi1,
tyyppi2, tyyppi3''. Jos tälle yksikölle määritellään uusi aliyksikkö,
niin myös aliyksiköllä on välttämättä ominaisuus \emph{label} joka
voi saada (ainakin) samat kolme arvoa. Aliyksikölle voidaan kyllä
lisätä uusia ominaisuuksia mutta ei poistaa perittyjä. 

Sellaisia kokonaan uusia yksiköitä, jotka eivät voi olla minkään aikaisemmin
määritellyn varsinaisen annotaatioyksikön aliyksiköitä, voidaan periyttää
esimerkiksi apuyksiköstä \textbf{Chunk} (\ref{sec:Chunk-jakso}),
jolla ei ole etukäteen annettuja ominaisuuksia ja jonka ''perilliset''
voivat siksi kuvata mitä tahansa tallenteen tapahtumaa tai piirrettä.


\subsection{\label{sub:Milloin-tarvitaan-uusi}Milloin tarvitaan uusi annotaatiokerros?}

\emph{Periaatteena on, että kaikille sellaisille annotoitaville ilmiöille,
jotka voivat esiintyä tallenteessa päällekkäisinä, tulisi luoda erilliset
annotaatiokerrokset. }

Samassa annotaatiokerroksessa voidaan siis kuvata vain yhdentyyppisiä
taikka useammantyyppisiä mutta toisensa poissulkevia yksiköitä. Esimerkiksi
tietyn puhujan sisään- ja uloshengitykset (ks. \ref{sub:Breathing-hengitys})
kannattaa merkitä omaan kerrokseensa, koska puhuja pystyy periaatteessa
tuottamaan puhetta (ja tekemään kaikenlaista muutakin) sekä sisään-
että uloshengittäessään. Toisaalta sekä sisään- että uloshengitykset
voidaan taloudellisimmin kuvata samassa kerroksessa, koska puhuja
ei voi tehdä molempia yhtä aikaa.


\subsection{\label{sub:Sama-vai-eri}Sama vai eri yksikkö?}

Jos yksiköiden rajat eri annotaatiokerroksissa \emph{poikkeuksetta
yhtenevät}, kyseessä on saman yksikön kaksi eri piirrettä. Tällöin
toisen annotaatiokerroksen rajaukset ovat redundantteja, ja turhan
lisätyön sekä virheiden välttämiseksi kannattaisi annotaatiokäsitteistöön
määritellä vain yksi yksikkö, jolla on kaksi piirrettä.


\subsection{\label{sub:piirteiden-maarittely}Annotaatioyksikön piirteiden määritteleminen}

Puh-editorissa annotaatioyksiköille voi lisätä haluttuja ominaisuuksia
tai piirteitä, joille voi tarvittaessa määritellä rajatun joukon sallittuja
arvoja. Puh-editorilla voi esimerkiksi lisätä jollekin yksikölle piirteen
''painoaste'' ja luetella tälle vaikkapa arvot ''0,1,2,3'', joilla
haluaa kuvata havaitun painollisuuden määrää. Jos joku jatkossa käyttää
samaa määritelmää, hän voi Puh-editorissa antaa ko. yksiköille ainoastaan
painoasteita nollasta kolmeen. Tämä helpottaa ja yhtenäistää kuvauksen
valintaa. Piirteille voitaisiin yhtä hyvin antaa muuntyyppisiäkin
arvoja, esim. ''painollinen, painoton''. Koska valittujen piirrearvojen
joukko on periaatteessa mielivaltainen ja riippuu käyttäjän tarpeista,
on useimpien piirteiden määrittely jätetty käyttäjien tehtäväksi.


\subsubsection{\label{sub:yksikoiden-yhteiset-ominaisuudet}Kaikkien yksiköiden
yhteiset ominaisuudet}

Kaikilla annotaatioyksiköillä on myös joukko valmiiksi esimääriteltyjä
piirteitä. Annotoija voi tarvittaessa määritellä kullekin yksikölle
erikseen \emph{\label{yksikon-aanilahde}äänilähteen\index{äänilähde}}
(\emph{soundSource}\index{soundSource}), mikäli esimerkiksi puhuja
vaihtuu keskellä annotaatiokerrosta. Myös kunkin yksikön \emph{\label{yksikon-kieli}kielen\index{kieli}\index{yksikön kieli}}
(\emph{language}\index{language}) voi määritellä erikseen, mikäli
halutaan osoittaa, etä puhuja käyttää kesken kaiken vieraskielisiä
sanoja. Äänilähteellä ja kielellä on oletusarvot, jotka on määritelty
kyseisen tallenteen metatiedoissa. Oletusten mukaisia piirrearvoja
ei siis tarvitse erikseen annotoida. Kuhunkin yksikköön voi lisätä
vapaamuotoisen \emph{\label{yksikon-kommentti}kommentin} (\emph{comment}\index{comment}),
jossa voi vaikkapa kuvailla yksikön rajaamisessa esiintyneitä vaikeuksia
tai erikseen määrittelemättömiä lisäominaisuuksia. Yksikön \emph{\label{yksikon-tila}tilaa\index{yksikön tila}}
tai \emph{työvaihetta\index{yksikön työvaihe}} (\emph{status}\index{status})
voi kuvata jollakin seuraavista piirteistä: 

\begin{quote}
0 ei määritelty

1 virheellinen\index{virheellinen annotaatio}

2 tekeillä (kesken\index{keskeneräisyys})

3 OK (valmis, hyväksytty\index{nimikoinnin hyväksyminen}\index{annotaation hyväksyminen})

4 kelluva (ei aikaan sidottu)\index{kelluva yksikkö}
\end{quote}
\textbf{Yksikön saa merkitä valmiiksi (status = 3) ainoastaan siinä
tapauksessa, että on itse tarkastanut ja hyväksynyt yksikön kaikkine
nimikkeineen ja todennut, että se noudattaa annotaatioyksikön määritelmässä
ja tässä oppaassa annettuja suosituksia.}

\emph{\label{Kelluva-yksikko}Kelluva yksikkö}\index{kelluva yksikk\"o}
(\emph{floating unit}\index{floating unit}; status = 4) tarkoittaa
sellaista annotaatioyksikköä, jonka halutaan olevan mukana annotaatiossa,
mutta jolle ei voida määrittää alkamis- ja päättymisaikaa. Kelluvina
yksiköinä voidaan kuvata esimerkiksi erilaisia abstrakteja lingvistisiä
yksiköitä, joille ei nähdä olevan suoraa vastinetta puhesignaalissa.
Samassa annotaatiokerroksessa olevilla kelluvilla yksiköillä on tietty
keskinäinen järjestys, muttei siis esimerkiksi ajallista kestoa.

Jokaisella yksiköllä on myös ominaisuudet \emph{alkupiste} ja \emph{loppupiste}
(vaikka nämä olisivatkin täsmälleen samassa aikapisteessä tai vaikka
yksikkö olisi kelluvassa tilassa). Alku ja loppu tallentuvat yksikön
piirteinä automaattisesti, kun yksikön rajoja siirretään jollakin
annotaatioeditoriohjelmalla. Lisäksi Puh-editori tallentaa jokaiselle
yksikölle automaattisesti \emph{luontiajan} ja viimeisimmän \emph{muokkausajankohdan}.

Mikäli käytät nimikointiin Praat-ohjelmaa, lue ohje piirteiden annotoinnista
Praatilla (\ref{ite:piirteiden-annotointi-Praatilla}).


\section{Suositeltava annotointijärjestys}

Uuden puhetallenteen annotointi aloitetaan yleensä karkeimmalta tasolta,
esimerkiksi vuorojen (\emph{Turn}, ks. \ref{sub:Turn-vuoro}) tai
puhunnosten (\emph{PhoneticUtterance}, ks. \ref{sub:PhoneticUtterance-puhunnos})
annotaatiosta. Samalla aineisto litteroidaan (puheen kielellinen sisältö
saatetaan kirjoitettuun muotoon), jollei aineiston tekstisisältö ole
ennalta tiedossa (esim. ääneen luettu puhe). Annotointijärjestys riippuu
kuitenkin ennen kaikkea siitä, minkälaiset piirteet aineistosta aiotaan
nimikoida.

Jos tallenteesta on olemassa aiemmin julkaistu annotaatiokerros, josta
aiot julkaista oman version, on suositeltavaa, että käytät pohjana
aiemmin julkaistua annotaatiokerrosta. Näin on mahdollista hakuvaiheessa
hyödyntää tietoa siitä, mitä kohtia olet muuttanut. Toisen tekemää
annotaatiokerrosta on myös paljon helpompi muuttaa kuin nimikoida
itse kokonaan uusi alusta asti.

Jotkut annotaatioyksiköt eivät oikeastaan kuvaa signaalia sellaisenaan,
vaan ovat jonkinasteisia abstraktioita. Tällöin ne ovat myös riippuvaisia
jostakin toisesta, yleensä konkreettisemmin signaalia kuvaavasta yksiköstä.
Esimerkiksi tavuja (ks. \ref{sub:Syllable-tavu}) ei lingvistisessä
mielessä esiinny puheessa sellaisenaan, vaan ne voidaan tunnistaa
tai analysoida vasta, kun puhutut saneet (ks. sanayksikkö, \ref{sub:Word-Sana})
on tunnistettu. Tämän vuoksi tavuyksiköitä ei pitäisi annotoida sellaisenaan
vaan yhdessä sanekerroksen kanssa tai vasta sanekerroksen annotoinnin
jälkeen, jolloin tavujen yhteys saneyksiköihin voidaan ilmaista. Myös
prominenssi on aina riippuvainen jostakin toisesta nimikointikerroksesta,
esim. tavu- tai sanakerroksesta. Jäljempänä mainitaan jokaisen yksikön
kohdalla, onko yksikkö riippuvainen joistakin muista annotaatioyksiköistä.


\section{Perusyksiköiden kuvaukset}

Jokaisen alempana esitetyn perusannotaatioyksikön kuvaus on jaettu
neljään osaan. Ensimmäinen osa sisältää yksikön määritelmän. Toisessa
osassa on ohjeita ja vinkkejä yksikön paikantamiseen ja rajaamiseen.
Kolmannessa osassa käydään läpi yksikön suhteet muihin yksiköihin
eli annetaan ohjeita siitä, minkä annotaatiokerroksen yksiköiden rajojen
kanssa yksikön rajat pitäisi tarpeen tullen kohdistaa. Neljännessä
osassa esitetään, minkälaisia symbolisia kuvauksia tai luokituksia
(nimikkeitä tai piirrearvoja) kyseisen nimikointikerroksen yksiköille
on mahdollista antaa.


\chapter{\label{cha:Foneettiset-yksikot}Foneettiset yksiköt}


\section{\label{sub:PhoneticUtterance-puhunnos}PhoneticUtterance\index{PhoneticUtterance}
\--- puhunnos\index{puhunnos}}


\subsection*{Määritelmä ja käyttötarkoitus}

Puhunnos on jakso, jonka aikana sama puhuja yhtäjaksoisesti artikuloi.
Puhunnoksen voi päättää tauko, hengitys (jonka aikana ei artikuloida),
täytetty tauko, tms.


\subsection*{Paikantaminen ja rajaaminen}

Rajataan mahdollisimman tarkasti signaalin ja kuulohavainnon perusteella.
Mikäli samassa signaalissa esiintyy päällekkäin useita puhujia, rajaamisessa
kannattaa käyttää apuna signaalin visualisointeja, jotka auttavat
löytämään puhunnoksen alun ja lopun. 

Jos aineisto on laaja, puhunnosten rajaamisessa voidaan käyttää apuna
automaattisia menetelmiä ts. puhunnokset (tai tauot) voidaan alustavasti
rajata äänisignaalin intensiteetin perusteella. Rajaus on kuitenkin
tarkistettava käsin.%
\footnote{Ohje tämän tehtävän suorittamiseksi Praat-ohjelmalla löytyy www-osoitteesta

\url{http://www.helsinki.fi/\~{}lennes/praat-scripts/howto/pilkkominen.html}%
}


\subsection*{Riippuvuudet muista yksiköistä}

Puhunnokset liittyvät suoraan signaaliin/signaaleihin, jossa/joissa
ko. puhuja esiintyy. Mikäli sane- ja foonikerrokset ovat olemassa,
puhunnoksen rajojen pitäisi noudattaa ao. sane- ja äännerajoja silloin
kun mahdollista.


\subsection*{Kuvauksen valinta}

Noudatetaan (suomen) ortografiaa ilman välimerkkejä tai isoja alkukirjaimia,
mutta puhe kuvataan siinä muodossa kuin se on lausuttu, ts. puhunnoksen
sisältöä ei muunneta esimerkiksi kirjoitetun kielen mukaiseen asuun.

Jos puheen kielellinen sisältö on ainakin suurelta osin ennalta tiedossa
(esim. luettu teksti) ja teksti on olemassa sähköisessä muodossa,
puhunnosten nimikkeiden lisäys voidaan tehdä puoliautomaattisesti. 


\section{\label{sub:Phone-fooni-aanne}Phone\index{Phone} \--- fooni\index{fooni},
äänne\index{äänne}}


\subsection*{Määritelmä ja käyttötarkoitus}

Puheäänne eli fooni on tietyntyyppisen artikulaatioliikkeen abstraktio.
Yleensä äänteiden luokittelussa käytetään jotakin yleisesti tunnettua
transkriptiojärjestelmää, esimerkiksi kansainvälistä foneettista aakkostoa
(\emph{International Phonetic Alphabet} eli \emph{IPA}\index{IPA}),
joka määrittelee, minkälaiset artikulatoriset piirteet ovat tärkeitä
ja voivat esiintyä maailman kielissä ja kuinka näitä tulisi merkitä.
Äänteiden segmentointi ja foneettisen transkription tekeminen vaatii
runsaasti harjoittelua ja perehtymistä artikulaatiofonetiikkaan.

Äänteitä voidaan luokitella ja kuvata käyttötarkoituksesta riippuen
eri tarkkuuksilla. Äänteiden nimikointi perustuu ensisijaisesti havaintoon,
mutta akustisia kuvauksia on aina syytä käyttää apuna erityisesti
äännerajojen paikantamisessa.


\subsection*{Paikantaminen ja rajaaminen}

Tunnistetaan ensin sekä kuulonvaraisesti että akustisten kuvausten
perusteella äänne ja sen naapuriäänteet. \char`\"{}Zoomaa\char`\"{}
äänen visualisointia niin, että ruudulla on näkyvissä vain 3\--10
äänteen mittainen pätkä ja aaltomuotokuvaajan pienemmätkin \char`\"{}ripellykset\char`\"{}
erottuvat selvästi. Kuuntele eri mittaisia pätkiä näkyvissä olevalta
alueelta, jotta löydät äänteet paremmin. Äänne pitää aina tunnistaa
kuuntelemalla sitä kontekstissaan. Jos segmenttiä kuuntelee yksinään,
sen tarkkaa laatua ei useinkaan voi havaita oikein, ja segmentin alussa
ja lopussa voi kuulua häiritseviä naksahduksia, jolleivät segmenttirajat
ole tarkasti amplitudin nollakohdissa.

Tämän jälkeen asetetaan alku- ja loppurajat äänteen tyypin mukaisesti
(ks. esimerkit liitteessä \ref{cha:Aanteiden-segmentointiesimerkkeja}). 

Jos äänneyksiköitä tuntuu löytyvän odotetusta poikkeava lukumäärä,
on parasta uskoa havaintoaan ja valita näille yksiköille parhaiten
sopivat symbolit. On huonompi ratkaisu sijoittaa äänteiden rajat mielivaltaiselta
tuntuviin paikkoihin ja käyttää niille huonosti sopivia symboleita.

Mikäli äänne tuntuu olevan esimerkiksi vain yhden äänihuuliperiodin
mittainen tai erittäin lyhytkestoinen (esim. alle 10 ms), sitä ei
normaalitapauksessa kannata rajata erillisenä äänteenä vaan jommankumman
naapurinsa osana.

Mikäli vokaaliäänne on selvästi diftongi (tavunsisäinen vokaalijono),
rajataan sen alku- ja loppuosa erillisinä äänteinä. Huomaa kuitenkin,
että joskus fonologisessa mielessä odottamasi diftongi saatetaan tuottaa
monoftongina \-- älä silloin pakota segmenttiä kahteen osaan. Samat
neuvot koskevat tavurajan ylittäviä vokaaliyhtymiä.

Pitkiä foneemeja edustavat äänteet rajataan vain yhtenä äännesegmenttinä.
Esim. pitkä /k:/-konsonantti rajataan samalla tavalla kuin lyhyt /k/,
sillä äännekerroksessa näillä ei välttämättä ole selvää foneettista
eroa. (Huom: Vain yksi {[}k{]} segmentoidaan myös, vaikka löytäisit
aaltomuotokuvasta pitkähkön {[}k{]}-äänteen keskeltä useita laukeaman
näköisiä ''sykkyröitä''! On hyvin tavallista, että {[}k{]}-klusiilin
laukeama on epämääräinen, sillä kielen selkä on pinta-alaltaan suuri
ja sen liikuttelu artikuloidessa on luonnostaan vähemmän tarkkaa kuin
esimerkiksi kielen kärjen.)


\paragraph*{Tee rajaus seuraavien periaatteiden mukaisesti:}

\begin{enumerate}
\item Sijoita raja auditiivisin perustein kohtaan, jossa rajan vasemmalla
puolella olevaa osiota kuunnellessa rajaa seuraava äänne ei vielä
erotu kuulohavainnon perusteella ja rajan oikealla puolella olevaa
osiota kuunnellessa et erota mikä edellinen äänne on.
\item Tarkenna auditiivisin perustein tekemääsi rajausta siirtämällä rajaa
akustisin perustein löytyneeseen muutoskohtaan, jos tämä on tarpeen
eikä aiheuta kovin suurta muutosta rajan paikkaan.
\item Kun rajan paikka on suunnilleen löytynyt, noudata lisäksi seuraavia
sääntöjä aina, kun se on tarkoituksenmukaista (ts. kun raja ei edelliseen
kohtaan nähden siirry kohtuuttomasti):

\begin{enumerate}
\item Jos äänne on soinnillinen, sijoita raja äänihuuliperiodin alkuun.
Soinnillisuuden tunnistat siitä, että aaltomuodossa näkyy lähes samanlaisina
toistuvia kuvioita
\item Sijoita raja äänisignaalin nollakohtaan, ts. kohtaan, jossa aaltomuotokäyrä
ylittää vaakasuoran nollarajan.
\item Sijoita raja kohtaan, jossa aaltomuotokäyrä nousee ylöspäin.
\item Sijoita raja jonkin oheisen esimerkin mukaisesti.
\end{enumerate}
\end{enumerate}
Esimerkkejä eri äänteiden välisten rajojen sijoittamisesta on liitteessä
\ref{cha:Aanteiden-segmentointiesimerkkeja}.


\subsection*{Riippuvuudet muista yksiköistä}

Äännesegmentti liittyy suoraan signaaliin tai kaikkiin signaaleihin,
joissa äänne esiintyy samalla hetkellä saman puhujan tuottamana. Mikäli
puhunnos-, tavu- ja sanekerrokset ovat ennestään olemassa, tulisi
puhunnosten, tavujen ja saneiden alku- ja loppurajat soveltuvin osin
kohdistaa vastaavien äännerajojen kanssa. Huomaa kuitenkin, että usein
esiintyy myös äänteitä, jotka ylittävät tavu- tai sanarajan ja joita
ei siksi voida perustellusti sitoa vain yhteen tavu- tai saneyksikköön
(esim. suomen kielen geminaatta tai sanojen rajalla esiintyvä vokaaliäänne,
johon edellinen sana loppuu ja jolla seuraava sana saumattomasti alkaa).


\subsection*{Kuvauksen valinta}

Ensisijaisesti kuulonvaraisin, mutta osittain akustisin kriteerein
valitaan kyseistä äännettä kuvaava symboli ja tarkkeet kansainvälisen
foneettisen aakkoston (IPA, \citealp{IPAHandbook}) käyttämien foneettisten
piirteiden mukaisesti. 

Sama äänne voidaan kuvata foneettisesti joko ASCII-muotoisena (Worldbet-
ja X-SAMPA-aakkostot) tai mahdollisesti IPA-kirjasimella, mikäli käytettävä
annotointiohjelma sen sallii. ASCII-muotoisia aakkostoja tulisi suosia,
koska ne ovat koneluettavia ja koska niiden siirto järjestelmästä
toiseen aiheuttaa vähiten muunnosongelmia. Jos annotaatioista halutaan
myöhemmin luoda esitysgrafiikkaa, ASCII-muodossa kuvatut äänteet voidaan
muuntaa IPA-kirjasimelle. Worldbet-aakkoston merkit on kuvattu liitteessä
\ref{sec:Worldbet-symbolit}.

Pyri löytämään äännettä parhaiten kuvaava foneettinen perussymboli.
Lisää tämän jälkeen tarvittavat tarkemerkit. Jokaiselle äännesegmentille
saa antaa vain yhden foneettisen perussymbolin tarkkeineen. Jos tunnet
tarvitsevasi useamman perussymbolin, rajaa jokaiselle oma segmenttinsä.

Foneettisen transkription pitäisi kuvata mahdollisimman tarkasti äänteestä
syntyvää kuulohavaintoa. Pyri siis välttämään tietoista tai tiedostamatonta
tukeutumista esimerkiksi foneemiseen kuvaukseen. Kun mietit, mikä
transkriptio ts. nimike äänteelle sopisi, ajattele ääntöväylän asentoa
ja sitä, mihin suuntiin artikulaatioelimet ovat matkalla. Tämä voi
helpottaa epäselvien äänteiden nimikointia.


\section{\label{sec:VoiceQuality-aanenlaatu}VoiceQuality\index{VoiceQuality}
\--- äänenlaatu\index{äänenlaatu}}


\subsection*{Määritelmä ja käyttötarkoitus}

Äänenlaatukerrokseen merkitään puhujan äänenlaadun muutokset, esim.
kuiskaus/ soinnittomuus, narina tai henkäyssointi. Modaaliääntä (\char`\"{}tavallista
äänenlaatua\char`\"{}) ei tarvitse merkitä erikseen --- jos äänenlaatukerroksessa
ei ole tietyllä ajanhetkellä merkintää, se tarkoittaa, että puhe on
normaalisti soinnillista tai soinnitonta sen mukaan, mikä äänne (sll/ston)
foonitasolle on ko. ajanhetken kohdalle merkitty (ks. kuva \ref{fig:aanenlaatu_1}).

%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.9]{/home/lennes/annotation_guide/jpgfigs/VQ_1.jpg}\end{center}


\caption{\label{fig:aanenlaatu_1}Kuvassa alimpana näkyy nimikointikerros,
johon on merkitty äänenlaatu. Kysymysmerkki \textbf{?} tarkoittaa
narisevaa ääntä, \textbf{Hv} henkäyssointia ja \textbf{0} soinnitonta
äänenlaatua eli kuiskausta. Näytteen alussa olevat soinnilliset osat
on tuotettu tavallisella ns. modaalifonaatiolla. Puhunnoksen lopussa
esiintyvä soinnittomuus on suomessa ja monissa muissakin kielissä
tavallinen ilmiö. Näytteessä on äännetty sanat \emph{minkäänlaisia
perusteita} lauseessa \emph{siihen taas poliisi ei nähnyt minkäänlaisia
perusteita}. Narinaääni alkaa sanan \emph{minkäänlaisia} loppupuoliskolla
ja puhujan ääni muuttuu soinnittomaksi \emph{perusteita}-sanan {[}s{]}-äänteestä
alkaen.}
\end{figure}


Äänenlaatuilmiöiden luokittelu on vaikeaa, sillä äänenlaatua kuvaavat,
usein impressionistiset termit ymmärretään eri tavoin. Tutkimuksissa
onkin todettu, että ihmiset kykenevät tunnistamaan melko johdonmukaisesti
lähinnä jonkinlaisen narinaäänen \cite{Gerratt01}. Siksi tässäkään
oppaassa ei ole valmiiksi määritelty kovin monia äänenlaatutyyppejä.
Oikeastaan äänenlaadun tarkka tutkiminen vaatisikin tarkkoja fysiologisia
ja akustisia mittauksia, joita annotoija ei käytännössä voi soveltaa
jo tallennettuun puhesignaaliin.


\subsection*{Äänenlaatuyksiköiden riippuvuudet muista yksiköistä}

Äänenlaatu ei välttämättä ole riippuvainen mistään muusta yksiköstä
vaan äänenlaatu voi ainakin teoriassa muuttua hyvinkin hienojakoisesti
vaikkapa keskellä äänneyksikköä. Tästä syystä eri äänenlaatukerrokset
voidaan periaatteessa nimikoida ilman muita annotaatiokerroksia. Käytännössä
äänenlaadun annotointi on kuitenkin helpompaa, jos aineistosta on
tarjolla vaikkapa puhunnoskerros litteraatteineen.


\subsection{\label{sub:Whisper-kuiskaus}Whisper\index{Whisper} \--- kuiskaus\index{kuiskaus}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Kuiskausääni on useiden äänteiden yli jatkuvaa soinnitonta puhetta,
jossa ei ole nähtävissä yksittäisiä äänihuuliperiodeja. Yksikköä voidaan
kuitenkin käyttää myös, jos vain yksi äänne on soinniton (esim. puhunnoksenloppuinen
vokaali), mikäli soinnittomuutta ei haluta tai voida kuvata soinnittomuuden
tarkemerkillä äännekerroksen (\ref{sub:Phone-fooni-aanne}) vastaavassa
yksikössä.


\subsubsection*{Paikantaminen ja rajaaminen}

Kuiskaukseksi tai soinnittomalla äänenlaadulla tuotetuksi merkitään
sellainen puheen osa, jossa yksi tai useampi äänne on odotusten vastaisesti
soinniton. Kuiskaus voi alkaa tai päättyä myös keskellä äännettä.
Esimerkiksi vokaalin alkuosa voi olla soinnillinen ja loppuosa soinniton.
Tämä on yleistä etenkin puhunnoksen lopussa esiintyvillä vokaaleilla.


\subsubsection*{Kuvauksen valinta}

Puh-editorissa kuiskausyksikölle ei merkitä erillistä kuvausta. Jos
nimikoidaan esimerkiksi Praat-ohjelmalla, tulisi kuiskattu jakso merkitä
soinnittomuuden merkillä \emph{0}.


\subsection{\label{sub:BreathyVoice-henkayssointi}BreathyVoice\index{BreathyVoice}
\--- henkäyssointi\index{henkäyssointi}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Henkäyssoinnillinen äänenlaatu. Osittain tai heikosti soinnillinen,
puoliksi kuiskaava äänenlaatu, jossa on mukana hälyä. 


\subsubsection*{Paikantaminen ja rajaaminen}

Henkäyssointia esiintyy usein esim. soinnittomien frikatiiviäänteiden
vieressä, puhunnosten lopussa ja aivan narinaäänen vieressä. Puhe
kuulostaa h-väritteiseltä, muttei ole kuitenkaan täydellistä kuiskausta
vaan sisältää heikkoa sointia. Spektrogrammissa voidaan mahdollisesti
erottaa jonkinlaista hälyä, puheen kokonaisenergia on vähäisempi ja
aaltomuodosta katsottuna myös amplitudi on usein ympäristöä pienempi.


\subsubsection*{Kuvauksen valinta}

Puh-editorissa henkäyssointiyksikölle ei merkitä erillistä kuvausta.
Jos nimikoidaan esimerkiksi Praat-ohjelmalla, tulisi henkäyssoinnillinen
jakso merkitä henkäyssoinnin Worldbet-merkillä \emph{Hv}.


\subsection{\label{sub:CreakyVoice-narinaaani}CreakyVoice\index{CreakyVoice}
\--- narinaääni\index{narinaääni}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Nariseva äänenlaatu. Puhujan tuottamaa sointia, jonka äänihuuliperiodit
ovat normaalia pitempiä ja/tai epäsäännöllisiä. Narinaa esiintyy usein
erilaisten prosodisten rajakohtien yhteydessä, ja joillakin puhujilla
myös laajemmin. On olemassa erilaisia narisevia äänenlaatuja, mutta
tämä yksikkö kuvaa niitä yhteisesti.


\subsubsection*{Paikantaminen ja rajaaminen}

Aaltomuodossa soinnillisten äänteiden aikana näkyvät periodit ovat
epäsäännöllisiä ja/tai normaalia pitempiä. Joskus narinan aaltomuodossa
erottuu kahden hieman erilaisen periodin vuorottelua (tätä kutsutaan
diplofoniaksi).


\subsubsection*{Kuvauksen valinta}

Puh-editorissa narinayksikölle ei merkitä erillistä kuvausta. Jos
nimikoidaan esimerkiksi Praat-ohjelmalla, tulisi nariseva jakso merkitä
narinan/glottalisaation Worldbet-merkillä \emph{?}.

Jos halutaan erottaa useampia narinatyyppejä, tästä yksiköstä on mahdollista
Puh-editorilla periyttää aliyksikkö, jolle sitten määritellään uusia
ominaisuuksia (esim. ominaisuus creakType, jolla on joukko haluttuja
arvoja, esim. 1 \-- määrittelemätön, 2 \-- puristeinen ääni, 3 \--
diplofonia, 4 \-- ''vantaalaisnarina'' tms.)


\subsection{\label{sub:FalsettoVoice-falsettiaani}FalsettoVoice\index{FalsettoVoice}
\--- falsettiääni\index{falsettiääni}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Korkea äänentuoton rekisteri. Falsettiääntä voi esiintyä vaikkapa
referoinnin yhteydessä, esim. kun miespuhuja matkii naisen puhetta.


\subsubsection*{Paikantaminen ja rajaaminen}

Falsetti voidaan erottaa kuulonvaraisesti ja usein huomattavasti tavanomaista
korkeamman perustaajuuden (eri ohjelmissa F0- eli Pitch-käyrä) avulla.
Pelkkään perustaajuuskäyrään ei kannata luottaa, sillä joissakin tapauksissa
perustaajuusanalyysi voi tuottaa käyrän, joka näyttää arvoja oktaavia
korkeammalta kuin pitäisi (tähän voivat vaikuttaa esim. epähuomiossa
naispuhujan puheelle säädetyt perustaajuusanalyysin asetukset, vaikka
puhujana olisi mies).


\subsubsection*{Kuvauksen valinta}

Puh-editorissa falsettiyksikölle ei merkitä erillistä kuvausta. Jos
nimikoidaan esimerkiksi Praat-ohjelmalla, tulisi falsetissa tuotettu
puheen jakso merkitä merkillä \emph{F}.


\chapter{\label{cha:Lingvistiset-yksikot}Lingvistiset yksiköt}


\section{\label{sub:Phoneme-foneemi}Phoneme\index{Phoneme} \--- foneemi\index{foneemi}}


\subsection*{Määritelmä ja käyttötarkoitus}

Teoreettinen kielen perusyksikkö, joka voi muuttaa sanan merkityksen.
Foneemi on eri asia kuin äänne. \emph{Foneemiyksikköä käytetään yleensä
vain automaattisin menetelmin tuotetussa puheen annotaatiossa}, jolloin
karkea ''foneemijono'' määritetään käsin tehdyn ortografisen litteraation
pohjalta ja tämän jälkeen ''pakotetaan'' segmentointiohjelmistolla
näiden foneemien rajat äänisignaaliin.


\subsection*{Paikantaminen ja rajaaminen}

Koska foneemi on oikeastaan lingvistinen abstraktio eikä foneemeja
esiinny puheessa sellaisenaan, ei foneemien nimikointi varsinaisesta
puhesignaalista ole relevanttia. Foneemisegmenttejä tuotetaan yleensä
vain automaattisilla menetelmillä, minkä jälkeen annotaatio on tarkistettava
käsin ja muunnettava realistisemmaksi äännekerroksen annotaatioksi. 

Sen sijaan jo annotoidun sanakerroksen (ks. \ref{sub:Word-Sana})
yksiköille voidaan periaatteessa määrittää näiden sisältämät teoreettiset
foneemit. Tällöin foneemikuvaus on kuitenkin sananmuotojen ominaisuus,
eikä näin kuvatuilla foneemiyksiköillä ole ajallista alku- ja loppupistettä.


\subsection*{Riippuvuudet muista yksiköistä}

Automaattisesti luotava foneemipohjainen ''esisegmentointi'' voidaan
yleensä tehdä vain jonkinlaisen ortografisen litteraatin perusteella.
Varsinaista rakenteellista annotaatiota automaattinen segmentointi
ei kuitenkaan edellytä.

Mikäli annotoidaan fonologisessa mielessä teoreettisia foneemiyksiköitä,
tämä voidaan tehdä vasta kun sananmuodot on annotoitu.


\subsection*{Kuvauksen valinta}

Foneemiyksikön nimike on sitä ensisijaisesti vastaavan äänteen ts.
allofonin Worldbet- tai IPA-muotoinen kuvaus (ks liite \ref{sec:Worldbet-symbolit}).


\section{\label{sub:Word-Sana}Word\index{Word} \--- sana\index{Sana}}


\subsection*{Määritelmä ja käyttötarkoitus}

Puheen yksikkö, jolla on itsenäinen merkitys ja joka voi esiintyä
myös yksinään. Sanayksiköllä tarkoitetaan tässä itse asiassa kimppua
yhteen saneeseen liittyviä piirteitä. Saneeseen liittyy ensisijaisesti
sen lähes ortografinen litteraatti (ts. sama asu kuin foneettisen
puhunnoksen kuvauksessa), mutta yksiköstä voidaan annotaatiossa mainita
myös esimerkiksi fonologinen kuvaus, perusmuoto, morfologisia piirteitä,
vastaava sananmuoto kirjoitetussa kielessä jne. Puh-editorissa nämä
piirteet on kuitenkin määriteltävä erikseen.


\subsection*{Paikantaminen ja rajaaminen}

Sanakerros on suositeltavaa nimikoida vasta foonikerroksen jälkeen
ja mieluiten tavukerroksen annotoinnin yhteydessä. Puh-editorilla
sanakerroksen pohja voidaan generoida myös jo annotoidusta puhunnoskerroksesta,
mikäli tämä on jo olemassa. Tällöin muodostuu ns. kelluvia\index{kelluva yksikkö}
(\emph{floating}\index{floating unit}, ks. s. \ref{Kelluva-yksikko})
sanayksiköitä, joita ei ole kohdistettu oikeisiin aikaväleihin, vaan
jaettu tasaisesti kyseisen puhunnoksen ajalle.

Sanakerroksen rajan ei tarvitse välttämättä aina osua yksiin äännetason
rajan kanssa, mutta jokaisen sanarajan tulee osua yksiin jonkin tavurajan
kanssa, mikäli tavutaso on annotoitu.


\subsubsection{Geminaatta (kaksoiskonsonantti) sanarajalla}

Jos suomenkielisessä puheessa sanarajalla esiintyy geminaatta (kaksoiskonsonantti),
joka on selvästi seurausta alku- tai loppukahdennuksesta, koko konsonanttisegmentti
merkitään kuuluvaksi vain yhteen sanaan. Jos suomenkielisessä puheessa
sanarajalla esiintyy geminaatta (kaksoiskonsonantti), joka ei välttämättä
johdu em. kahdennuksesta, sanaraja merkitään joko keskelle konsonanttiäännettä
tai mahdollisuuksien mukaan jollakin akustisella kriteerillä perusteltuun
kohtaan konsonanttisegmentin sisällä.


\subsubsection{Pitkä vokaali sanarajalla}

Jos suomenkielisessä puheessa sanarajalla esiintyy pitkä vokaaliäänne
siten, että edellinen sana päättyy samaan vokaaliin jolla seuraava
alkaa: Etsi ensin akustisia vihjeitä sanarajasta vokaalisegmentin
keskeltä. Toisinaan sopivan sanarajakohdan voi löytää perustaajuusmuutosten
tai äänenlaatumuutosten perusteella. Rajalla voi olla esim. narinaa,
lievä puristussupistuma tai peräti glottaaliklusiili. Jos rajakohdan
paikkeilla on narinainen \char`\"{}kuoppa\char`\"{}, merkitse raja
pisimmän äänihuuliperiodin jälkeen, juuri ennen kuin perustaajuus
alkaa jälleen nousta. Tällainen rajakohta heijastuu usein myös vokaalin
laatuun. Jos sanojen rajalla on glottaaliklusiili, glottaaliklusiilin
sulkeumavaihe kuuluu edelliseen sanaan ja sen jälkeinen \char`\"{}laukeama\char`\"{}
seuraavaan sanaan. Jos glottaaliklusiili on erittäin pitkä ja sanarajalla
tuntuu olevan esim. epäröintiä, älä merkitse glottaaliklusiilin sulkeumaa
kumpaankaan sanaan kuuluvaksi, vaan jätä se kokonaan sanojen ulkopuolelle.
Huom. Glottaaliklusiilin sulkeuma kuuluu kuitenkin puhunnokseen, sillä
se on selvästi puhujan tuottama artikulaatio! Jos mitään akustisia
vihjeitä ei löydy, merkitse sanaraja keskelle vokaalisegmenttiä.


\subsubsection{Puhunnoksenloppuiset/-alkuiset saneet}

Jos puhunnos päättyy soinnittomaan vaiheeseen ja viimeisen sanan lopussa
on {[}h{]}-mainen äänne, tämä merkitään kuuluvaksi puhunnokseen, muttei
viimeiseen saneeseen. Siihen saakka kun {[}h{]}-äänne on selvästi
viimeisen saneen viimeisen vokaalin värinen (\char`\"{}soinniton vokaali\char`\"{}),
se kuuluu myös saneeseen. Tällaisessa tapauksessa äänne segmentoidaan
myös osaksi puhunnoksen viimeistä vokaalisegmenttiä, mutta segmentin
soinniton osa merkitään äänenlaatutasolle soinnittomaksi.


\subsection*{Riippuvuudet muista yksiköistä}

Puhunnos, fooniyksiköt ja tavut, mikäli ne ovat olemassa.


\subsection*{Kuvauksen valinta}

Merkitään ainakin saneen lähes ortografinen litteraatti (ts. sama
asu kuin foneettisen puhunnoksen kuvauksessa); mahdollisesti myös
muita piirteitä. Sanarajat ylittäviä suomen ortografiassa näkymättömiä
assimilaatioita (esim. \emph{poja}\emph{\underbar{m}} \emph{pallo})
ei tarvitse merkitä, sillä ne voidaan todeta äännekerroksen annotaatiosta
ja/tai tuottaa sääntöpohjaisesti. Keskeneräiseksi jääneen sanan loppuun
merkitään tavuviiva \emph{-}.

Jollet käytä annotaatiossa Puh-editoria, merkitse kaikki sanayksikköön
liittyvät piirteet omiin kerroksiinsa. Esimerkiksi Praat-ohjelmalla
rajataan saneet yhteen IntervalTier-tyyppiseen kerrokseen ja kirjoitetaan
näiden nimikkeiksi saneen litteraatti. Sen jälkeen luodaan PointTier-tyyppinen
kerros esimerkiksi sanan perusmuodolle, ja lisätään tähän kerrokseen
yksi ankkuri (point) jokaisen saneen keskivaiheille. Ankkureiden nimikkeiksi
annetaan sitten ko. saneen perusmuoto ortografisessa asussaan.

Sanalle ei ole määritelty valmiiksi esimerkiksi ominaisuutta 'sanaluokka',
sillä ominaisuudet periytyvät kaikille yksikön aliyksiköille ja eri
tutkijoiden käsitykset sanaluokkien määrästä ja merkityksestä vaihtelevat
(esim. \citealp{ISK} vs. erilaisten automaattisten morfologisten
analyysityökalujen käyttämät luokitukset). Mikäli sanaluokan annotointi
on tarpeen, kannattaa luoda Puh-editorissa sanayksikölle uusi aliyksikkö,
jolle määritellään sanaluokka-ominaisuus ja tälle puolestaan lista
haluttuja luokkanimikkeitä.


\section{\label{sub:Syllable-tavu}Syllable\index{Syllable} \--- tavu\index{tavu}}


\subsection*{Määritelmä ja käyttötarkoitus}

Tavu on sanan fonotaktisen järjestymisen yksikkö. Tavu sisältää aina
vokaalin tai poikkeustapauksessa syllabisen konsonantin. Suomen oikeinkirjoituksessa
sana voidaan katkaista tavurajan kohdalta.

Tavun ja tavurajojen määrittäminen nojaa usein huomattavasti annotoijan
intuitioon. Näin on etenkin kirjoittamattoman puheen kohdalla: tavutus
riippuu siitä, mihin kirjoitetun kielen muotoon annotoija kulloinkin
haluaa nojata.


\subsection*{Paikantaminen ja rajaaminen}

Tavurajojen tulisi noudattaa mahdollisimman pitkälle vastaavia äännerajoja.
Poikkeuksia ovat esim. geminaatat ja muut tavu- tai sanarajan ylittävät
äänteet. Näissä tapauksissa tavuraja merkitään 

\begin{enumerate}
\item kohtaan, jossa äänteen keskellä tapahtuu jokin akustis-foneettinen
muutos, tai
\item silmämääräisesti äänteen puoliväliin noudattaen äänteiden rajaussääntöjä.
\end{enumerate}
Tavutason rajan ei tarvitse aina osua yksiin äännetason rajan kanssa,
mutta sanarajojen tulee osua yksiin tavurajojen kanssa.


\subsection*{Riippuvuudet muista yksiköistä}

Tavukerros on suositeltavaa annotoida äännekerroksen nimikoinnin jälkeen
ja mieluiten sanakerroksen annotoinnin yhteydessä. 


\subsection*{Kuvauksen valinta}

Tavun ortografinen kuvaus. Tavurajat ylittäviä suomen ortografiassa
näkymättömiä assimilaatioita (esim. \emph{ke}\emph{\underbar{N}}\emph{.gän})
ei tarvitse merkitä, sillä ne voidaan todeta äännekerroksen annotaatiosta
tai tuottaa sääntöpohjaisesti. Keskeneräiseksi jääneen tavun loppuun
merkitään tavuviiva \emph{-}.


\section{\label{sub:Morpheme-morfeemi}Morpheme\index{Morpheme} \--- morfeemi\index{morfeemi}}


\subsection*{Määritelmä ja käyttötarkoitus}

Kielen pienin yksikkö, jolla on merkitys tai kieliopillinen tehtävä.
Koska morfeemien luokittelu ja merkintätavat vaihtelevat eri tutkijoilla
ja eri kielissä, ei morfeemiyksikölle ole valmiiksi määritelty tiettyä
kuvaustapaa. Suomesta on eroteltu kuudenlaisia morfeemeja: \emph{sanavartalot}\index{sanavartalo}\index{vartalo, sana-},
\emph{johtimet}\index{johdin}, \emph{tunnukset}\index{tunnus}, \emph{päätteet}\index{pääte},
\emph{omistusliitteet\index{omistusliite}} ja \emph{liitepartikkelit}\index{liitepartikkeli}
(\citealp[s. 25--26]{Laaksonen98}, ks. myös \citealp[s. 89--95]{Karlsson98}).
Sanojen jakaminen morfeemeihin ja morfeemien tai morfien erottaminen
toisistaan eivät ole aina aivan yksinkertaisia toimenpiteitä. Kieleen
on myös kiteytynyt ns. morfeemiyhdistelmiä\index{morfeemiyhdistelmä},
joiden jakaminen osiin ei auta muodon merkityksen ymmärtämistä. Isossa
suomen kieliopissa näitä kutsutaankin nipputunnuksiksi\index{nipputunnus}
\citep[s. 89]{ISK}. Nimikoijan kannattaa miettiä, olisiko niitä varten
hyödyllistä periyttää oma aliyksikkö.


\subsection*{Paikantaminen ja rajaaminen}

Morfeemit kannattaa nimikoida vasta sen jälkeen, kun sanat on nimikoitu,
koska morfeemit toteutuvat sanoina tai niitä pienempinä yksiköinä.
Morfeemi voi ilmetä vain yhtenä äänteenä (kuten esim. monikon tunnus
sanassa koulu+i+ssa), joten voi olla käytännöllisintä nimikoida morfeemit
vasta äännekerroksen jälkeen. Mikäli sana sisältää morfeemin, jolle
ei löydy selkeää vastinetta puhesignaalissa, merkitään kyseisen morfeemin
tila (\emph{status}, ks. s. \ref{yksikon-tila}) Puh-editorissa \emph{kelluvaksi}
(\emph{floating}, s. \ref{Kelluva-yksikko}), jolloin yksikön alku-
ja loppuaikaa ei tulkita absoluuttisina.


\subsection*{Riippuvuudet muista yksiköistä}

Morfeemiyksiköiden rajat on syytä kohdistaa ainakin vastaavien sana-
ja foneemirajojen sekä soveltuvin osin äännerajojen kanssa.


\subsection*{Kuvauksen valinta}

Morfeemiyksiköiden nimikkeiksi voi kirjoittaa vapaata tekstiä.

Mikäli aikoo käyttää morfeemien nimikointiin jotakin tiettyä luokittelu-
ja kuvaustapaa, kannattaa morfeemiyksikölle periyttää Puh-editorilla
aliyksikkö, jolle määritellään ominaisuuksina esim. minkälaisia nimikkeitä
yksiköille saa antaa, kuvataanko vaikkapa samaan yksikköön liittyvä
morfi (morfeemin yksittäisen esiintymän tai reaalistuman muoto) ja
morfeemi (abstrakti muoto) erikseen ja minkätyyppisiä morfeemiluokkia
on olemassa. Mikäli jotkin morfeemityypit muodostavat suljetun luokan,
ne kannattaa luetella kyseisen ominaisuuden vaihtoehtoisina arvoina,
joista annotoitaessa valitaan paras. Jos käytetään jotakin automaattista
menetelmää morfologisen analyysin tuottamiseen, voidaan morfeemiyksikön
nimikkeiksi määritellä kyseisen analyysialgoritmin tuntemat morfologiset
kategoriat.


\section{\label{sec:Clause-lause}Clause\index{Clause} \--- lause}


\subsection*{Määritelmä ja käyttötarkoitus}

Lause on rakenteellinen kokonaisuus, joka sisältää finiittiverbin.


\subsection*{Paikantaminen ja rajaaminen}

Lause paikannetaan finiittiverbin avulla. Lause voi muodostua pelkästä
finiittiverbistä (esim. \emph{sataa}); verbin lisäksi lauseen ytimeen
kuuluvat verbin argumentit (subjekti, objekti, adverbiaalitäydennys).
\citep[s. 827]{ISK}

Lause voi olla yksinkertainen tai kompleksinen. Yhdyslauseet nimikoidaan
erillisiksi lauseiksi. Rinnasteisten yhdyslauseiden annotoiminen on
yleensä vaivatonta. Yhdyslause voi kuitenkin muodostua myös niin,
että lause voi olla toisen lauseen osa. Sisäkkäiset lauseet voi Puh-editorissa
nimikoida samaan kerrokseen. Praatissa puolestaan pitää luoda useampi
nimikointikerros.


\subsection*{Riippuvuudet muista yksiköistä}

Lauseiden rajat tulisi soveltuvin osin kohdistaa vastaavien sana-,
tavu- ja äännerajojen kanssa, mikäli nämä ovat ennestään olemassa.
Niissä aineistoissa, joissa virkkeiden nimikointi on relevanttia,
tulee lauserajat kohdistaa myös vastaavien virkekerroksen yksiköiden
(\emph{Sentence}, ks. \ref{sec:Sentence-virke}) kanssa.


\subsection*{Kuvauksen valinta}

Lauseen kuvaukseksi kirjoitetaan sen ortografinen litteraatti. Keskeneräiseksi
jääneen lauseen viimeisen sanan loppuun merkitään tavuviiva \emph{-}.

Lauseesta voi periyttää muita yksiköitä esim. syntaktisten (eksistentiaali-,
omistus-, tila-, ilmiö-, kvanttori-, tulos-, tunnekausatiivi- ja genetiivialkuiset
lauseet) tai modaalisten (väite-, kysymys-, käsky- huudahduslause)
lausetyyppien nimikointiin (käsitteistä ks. esim. \citealp{ISK},
ss. 845\--862). Myös lauseen erikoistapauksia, kuten esim. lohko-
ja limittäisrakennetta sekä ellipsiä, varten on mahdollista luoda
aliyksikkö. Puh-editorilla annotoitaessa eri lausetyypit on hyvä määritellä
annotointiyksikön eri piirteiksi. Siinä tapauksessa niiden täytyy
olla täydennysjakaumassa keskenään; piirteiden käyttö ei mahdollista
yhden lauseen nimikointia moneksi eri lausetyypiksi (esim. sekä kysymys-
että huudahduslauseeksi).


\section{\label{sec:Sentence-virke}Sentence\index{Sentence} \--- virke\index{virke}}


\subsection*{Määritelmä ja käyttötarkoitus}

Virke on tekstin ortografinen rakenneyksikkö \citep[s. 827]{ISK}.
Virkkeitä nimikoidaan ainoastaan, mikäli on kyseessä ääneen luettu
teksti, jonka virkerakenne on tunnettu.


\subsection*{Paikantaminen ja rajaaminen}

Virkkeitä tulisi annotoida vain, jos annotoijalla on käytettävissään
teksti, johon ääneenluenta perustuu. Siinä tapauksessa yksiköiden
rajaaminen perustuu ortografiaan. Ääneen luetun puheen virkerakenteen
hahmottamisessa auttaa myös intonaatio: virkkeen sävelkulku noudattaa
usein deklinaatiomallia, ja virkkeen alun voi tunnistaa sävelkorkeuden
noususta. Tätä havainnollistaa kuva \ref{cap:kaksi-virketta}, jonka
virkeyksiköt on rajattu Kielipankin tv-uutislähetyksistä koostuvasta
aineistosta.

\begin{landscape}%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.6]{/home/lennes/annotation_guide/jpgfigs/1DB-225586_kaksi_virketta.jpg}\end{center}


\caption{\label{cap:kaksi-virketta}Kuvassa on annotoitu kaksi uutisankkurin
eräässä tv-uutislähetyksessä lukemaa virkettä. Perustaajuuskäyrä ja
spektrogrammi havainnollistavat sitä, miten intonaatio nousee virkkeen
alussa ja laskee loppua kohden. Näyte on Kielipankin tallenteesta
1DB-225586 (\protect\url{http://www.csc.fi/kielipankki/puhe/recordings/1DB-225586/}).}
\end{figure}
\end{landscape}


\subsection*{Riippuvuudet muista yksiköistä}

Virkerajat tulee soveltuvin osin kohdistaa vastaavien lause-, sana-,
tavu- ja äännerajojen kanssa, mikäli nämä on jo nimikoitu.


\subsection*{Kuvauksen valinta}

Ortografinen litteraatti. Keskeneräiseksi jääneen virkkeen viimeisen
sanan loppuun merkitään tavuviiva \emph{-}.


\chapter{\label{cha:Prosodiset-yksikot}Prosodiset yksiköt}

Prosodisilla yksiköillä kuvataan puheen prosodiikkaa eli tonaalisia,
dynaamisia ja temporaalisia piirteitä.

Painotuksen kuvausta varten on luotu yksikkö nimeltä prominenssi.
Painotukselle ei ole olemassa yleisesti hyväksyttyä määritelmää, ja
millä tahansa määritelmällä painollisuuden annotointi on hyvin subjektiivista.
Maailman kielissä erotellaan usein sanapaino tai leksikaalinen paino
(tietylle sanalle luonteenomainen, mahdollisesti sanan merkitystä
erottava painon sijoittumispaikka; suomessa varsinaista sanapainoa
ei ole, mutta paino sijoittuu potentiaalisesti sanan ensimmäiselle
tavulle) ja toisaalta lausepaino (pitemmässä puheen pätkässä tai lauseessa
se sana tai tavu, jota painotetaan).


\section{\label{sub:Prominence-prominenssi}Prominence\index{Prominence}
\--- prominenssi\index{prominenssi}}


\subsection*{Määritelmä ja käyttötarkoitus}

Jokin puheen yksikkö, joka erottuu ympäristöstään jollakin tavalla
korosteisena eli prominenttina. Prominenssiyksikköä tai siitä Puh-editorilla
periytettyjä aliyksiköitä voidaan käyttää mm. ns. lausepainon merkitsemiseen.


\subsection*{Paikantaminen ja rajaaminen}

Rajataan auditiivisin perustein. Koska prominenssi on kuulohavaintoon
perustuva käsite, akustisia analyyseja (esim. perustaajuus- ja intensiteettikäyrää)
ei välttämättä tarvitse annotointivaiheessa käyttää, mutta niiden
avulla voidaan saada vahvistusta havaitulle prominenssivaikutelmalle
(ks. esim. kuva \ref{cap:Kaksi-prominenssia}). Mikäli akustisten
kuvausten käyttäminen prominenssin annotoinnissa halutaan metodisista
syistä kokonaan kieltää (esim. halutaan koemielessä kerätä useiden
annotoijien subjektiiviset kuulonvaraiset arviot saman puhenäytteen
prominenteista kohdista), kannattaa prominenssiyksiköstä periyttää
uusi aliyksikkö, jonka määritelmään kielto merkitään.

\begin{landscape}%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.6]{/home/lennes/annotation_guide/jpgfigs/1DB-222809-2_prominenssia.jpg}\end{center}


\caption{\label{cap:Kaksi-prominenssia}Kuvassa on lausuma \emph{mutta tämmösenä
nimityksenä niin se on kyllä pohjosmaista juurta meillä}, jonka kaksi
sanaa (\emph{nimityksenä} ja \emph{pohjosmaista}) on merkitty prominenteiksi,
ts. annotoijan mielestä ne ovat erottuneet korosteisina tai painollisina
ympäristöönsä nähden. Kuva havainnollistaa hyvin sen, miten sekä perustaajuus
(sininen/tumma käyrä) että intensiteetti (keltainen/vaalea käyrä)
ovat yhteydessä kuulonvaraisesti havaittuun prominenssiin. Näyte on
Kielipankin tallenteesta 1DB-222809-2 (\protect\url{http://www.csc.fi/kielipankki/puhe/recordings/1DB-222809-2/}).}
\end{figure}
\end{landscape}


\subsection*{Riippuvuudet muista yksiköistä}

Mikäli prominenssin vaikutusalaksi katsotaan tietyntyyppinen yksikkö
(esim. tavu, sana tms.), pitää vastaavan annotaatiokerroksen olla
olemassa.

Prominentiksi voidaan kuitenkin merkitä myös mikä tahansa puheen jakso.
Kun annotaatiokerroksia tulee jälkeenpäin lisää, prominenssin vaikutusalan
voidaan silloin ajatella koskevan kaikkia kyseisellä ajanjaksolla
esiintyviä muita yksiköitä.


\subsection*{Kuvauksen valinta}

Ei määritelty erillistä kuvausta, mutta nimikkeeksi voi kirjoittaa
vapaata tekstiä. Prominenssiyksikölle voi halutessaan antaa nimikkeeksi
esimerkiksi kuvauksen prominenssin tai painollisuuden asteesta. Mikäli
käytetään tiettyä sovittua asteikkoa, voidaan Puh-editorissa periyttää
prominenssiyksikölle aliyksikkö, jolle erikseen määrätään esim. ominaisuus
\linebreak degreeOfProminence ja tälle lista haluttuja arvoja. Samoin
toimitaan, jos halutaan määritellä erilaisia prominenssityyppejä esim.
funktion tai vaikutusalan mukaan.


\subsection{\label{sub:Stress-sanapaino}Stress\index{Stress} \--- sanapaino\index{sanapaino}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Sanapaino eli sanan (leksikaalisesti) painollisin osa. \emph{Stress}-yksikkö
on \emph{Prominence}-yksikön aliyksikkö.


\subsubsection*{Paikantaminen ja rajaaminen}

Sanapainolliseksi voidaan merkitä jokin sanaa pienempi yksikkö tai
puheen jakso, yleensä tavu. Sanapainoyksikköä ei saa rajata niin,
että se ulottuu saman puhujan kahden sanayksikön alueelle.


\subsubsection*{Riippuvuudet muista yksiköistä}

Sanapainon merkintä vaatii ainakin olemassaolevan sanakerroksen ja
yleensä myös jonkin sanaa pienemmän yksikön, esimerkiksi tavun annotaatiokerroksen. 


\subsubsection*{Kuvauksen valinta}

Ei määritelty erillistä kuvausta, mutta nimikkeeksi voi kirjoittaa
vapaata tekstiä. Stress-yksikölle voi halutessaan antaa nimikkeeksi
esimerkiksi kuvauksen painollisuuden asteesta (esim. pääpaino 1, sivupaino
2). Mikäli käytetään tiettyä sovittua asteikkoa, voidaan Puh-editorissa
periyttää Stress-yksikölle aliyksikkö, jolle erikseen määrätään esim.
ominaisuus degreeOfStress ja annetaan tälle lista haluttuja arvoja.


\section{\label{sub:IntonationPattern-intonaatiokuvio}IntonationPattern\index{IntonationPattern}
\--- intonaatiokuvio\index{intonaatiokuvio}}


\subsection*{Määritelmä ja käyttötarkoitus}

Puheen intonaatiota tai melodiaa kuvaava yksikkö, jota voi käyttää
esim. tyyliteltyjen intonaatiokuvioiden nimikointiin (ks. esim. \citealp{Ogden}).
Huomaa, että lausuman loppuintonaatio nimikoidaan lausuman (\ref{sub:ProsodicUtterance-lausuma})
piirteenä eikä intonaatiokuvioyksiköllä.


\subsection*{Paikantaminen ja rajaaminen}

Rajataan auditiivisen havainnon perusteella. Apuna voi käyttää myös
esim. perustaajuuskäyrää.


\subsection*{Riippuvuudet muista yksiköistä}

Intonaatiokuvion kuvaus voidaan antaa mitä tahansa puheen olemassaolevaa
annotaatioyksikköä vastaavalle ajanjaksolle.


\subsection*{Kuvauksen valinta}

Vapaa tekstikuvaus. Mikäli tiedossa on jokin intonaatiokuvioiden luokittelujärjestelmä
(esim. fonologinen intonaation transkriptiojärjestelmä kuten \emph{ToBI},
tai rajattu joukko tyyliteltyjä intonaatiokuvioita), kannattaa Puh-editorilla
periyttää intonaatiokuviolle uusi aliyksikkö, jolle määritellään yhtenä
ominaisuutena lista sallittuja intonaatiotyyppejä.


\section{\label{sec:ChangeInTone-aanensavy}ChangeInTone\index{ChangeInTone}
\--- äänensävyn\index{äänensävy} muutos}


\subsection*{Määritelmä ja käyttötarkoitus}

Havaittu äänensävyn muutos. Esiintyy esim. referoinnin tai ironian
yhteydessä. Voidaan joskus kuvata myös muiden prosodisten muuttujien
avulla (esim. normaalia korkeampaa, hitaampaa ja kovaäänisempää puhetta).
Ilmiö tarvitsee kuitenkin oman nimikointikerroksensa, koska kuulohavainto
ei aina ole prosodisesti jäsennettävissä. Huomaa, että esimerkiksi
hymyillen lausutulle puheelle on oma nimikointikerroksensa (\ref{sub:Smile-hymyily}).


\subsection*{Paikantaminen ja rajaaminen}

Rajataan kuulohavainnon perusteella. Usein äänen sävyn muunnoksen
alkaminen on selvemmin havaittavissa kuin sen loppuminen \citep[s. 965]{ISK}.
Käytännössä äänensävy-yksikölle on kuitenkin aina merkittävä jokin
tarkka alkamis- ja loppumishetki. Tarvittaessa yksikköön voi liittää
kommentin (\ref{yksikon-kommentti}), josta äänensävymuutoksen epämääräinen
loppumisaika käy ilmi.


\subsection*{Riippuvuudet muista yksiköistä}

Äänensävyn muutos voi esiintyä missä kerroksessa tahansa. Vaikutusalueena
saattaa olla sana, lausuma, kokonainen vuoro, jopa useampi vuoro (vrt.
esim. \citealp{Haakana}). Äänensävy-yksikön rajat voidaan haluttaessa
kohdistaa jonkin muun annotaatioyksikön rajojen kanssa, mikäli halutaan
korostaa, että äänensävy on muuttunut juuri kyseisen yksikön ajaksi.


\subsection*{Kuvauksen valinta}

Nimikkeeksi voi kirjoittaa vapaamuotoisen kuvauksen. Mikäli halutaan
käyttää jotakin tiettyä luokittelujärjestelmää, kannattaa Puh-editorilla
periyttää äänensävy-yksikölle uusi aliyksikkö, jonka yhdelle ominaisuudelle
määritellään lista sallittuja arvoja. Puh-editorissa äänensävyn muutosta
voi halutessaan kuvailla tarkemmin annotointiyksikön kommenttikentässä
(\ref{yksikon-kommentti}).


\section{\label{sec:ChangeInPitch-savelkorkeus}ChangeInPitch\index{ChangeInPitch}
\--- sävelkorkeuden\index{sävelkorkeus} muutos}


\subsection*{Määritelmä ja käyttötarkoitus}

Tilapäinen puheen sävelkorkeuden muutos, esim. ympäristöään korkeammalta
tai matalammalta lausuttu puhe.


\subsection*{Paikantaminen ja rajaaminen}

Rajataan pääasiassa kuulohavainnon perusteella. Myös perustaajuuskäyrästä
voi olla apua.


\subsection*{Riippuvuudet muista yksiköistä}

Yksikön vaikutusalue vaihtelee: sävelkorkeus voi muuttua kesken sanan
yhden tavun tai pidemmän jakson, kuten vuoron tai lausuman ajaksi.
Haluttaessa sävelkorkeusyksikön rajat voidaan kohdistaa jonkin muun
annotaatioyksikön rajojen kanssa, mikäli halutaan korostaa, että sävelkorkeus
on muuttunut juuri kyseisen yksikön ajaksi.


\subsection*{Kuvauksen valinta}

Puh-editorissa on mahdollista käyttää hyväksi yksikön piirrettä \emph{directionOfPitchChange},
jonka avulla voi nimikoida sävelkorkeuden muutoksen suunnan. Kyseisen
piirteen arvoksi voi merkitä \emph{lower} (ympäristöään matalammalta
lausuttu puhe) tai \emph{higher} (ympäristöään korkeammalta lausuttu
puhe). Jos nimikointiin käyttää esim. Praatia, voi IntervalTier-yksikön
nimikkeeksi merkitä tiedon sävelkorkeusmuutoksen tyypistä yksikön
aikana. Tarvittaessa voi käyttää esim. lyhenteitä \emph{L} = \emph{lower}
ja \emph{H} = \emph{higher}.


\section{\label{sec:ChangeInLoudness-voimakkuus}ChangeInLoudness\index{ChangeInLoudness}
\--- voimakkuuden\index{voimakkuus} muutos}


\subsection*{Määritelmä ja käyttötarkoitus}

Auditiivisesti havaittu puheen voimakkuuden muutos, esim. huutaminen
tai hyvin hiljainen puhe. Huomaa, että kuiskaus on erillinen annotointiyksikkönsä.


\subsection*{Paikantaminen ja rajaaminen}

Rajataan auditiivisin kriteerein, mutta esim. intensiteettikäyrästä
tai aaltomuodosta voi olla hyötyä. Periaatteessa puheen voimakkuuden
vaihtelua voi esiintyä monilla kielen eri tasoilla. Sanojen, tavujen
ja äänteiden voimakkuuseroja annotoitaessa kannattaa miettiä myös
prominenssiyksikön käyttöä.


\subsection*{Riippuvuudet muista yksiköistä}

Haluttaessa voimakkuusmuutosyksikön rajat voidaan kohdistaa jonkin
muun annotaatioyksikön rajojen kanssa, mikäli halutaan korostaa, että
voimakkuus on muuttunut juuri kyseisen yksikön ajaksi.


\subsection*{Kuvauksen valinta}

Puh-editorissa on mahdollista käyttää hyväksi yksikön piirrettä \linebreak
\emph{directionOfLoudnessChange}, jonka avulla voi kuvata puheen voimakkuuden
muutoksen suunnan. Voit merkitä kyseisen piirteen arvoksi \emph{softer}
(ympäristöään hiljaisemmin lausuttu puhe) tai \emph{louder} (ympäristöään
äänekkäämmin lausuttu puhe). Praatissa merkitse IntervalTier-yksikön
nimikkeeksi tieto voimakkuusmuutoksen tyypistä yksikön aikana. Tarvittaessa
voit käyttää esim. lyhenteitä \emph{-}, \emph{softer} ja \emph{+},
\emph{louder}.


\section{\label{sec:ChangeInTempo-=3D-puhenopeus}ChangeInTempo\index{ChangeInTempo}\index{tempo}
\--- puhenopeuden\index{puhenopeus}\index{nopeus} muutos}


\subsection*{Määritelmä ja käyttötarkoitus}

Auditiivisesti havaittu puhenopeuden muutos (esim. ympäristöään hitaampi
tai nopeampi puhe) tai yksittäisen äänteen pidennys tai lyhennys.


\subsection*{Paikantaminen ja rajaaminen}

Yksiköllä puhenopeuden muutos voidaan kuvata periaatteessa kaikille
kielen eri tasoille ulottuvia tempon muutoksia. Mikäli muutos koskee
yhtä sanaa, rajataan aineistosta yhden sanan mittainen annotointiyksikkö.
Jos koko lausuma on ympäristöään nopeammin tai hitaammin lausuttu,
on yksikön vaikutusalana koko lausuma. Yksikön avulla voidaan kuvata
myös yksittäisten äänteiden pidennykset ja lyhennykset: jos yksikkö
ulottuu yhteen äänteeseen, se on piirteestä riippuen joko lyhentynyt
tai pidentynyt; jos vaikutusala on laajempi, on kyseessä puheen nopeutuminen
tai hidastuminen.


\subsection*{Riippuvuudet muista yksiköistä}

Haluttaessa puhenopeusyksikön rajat voidaan kohdistaa minkä tahansa
muun annotaatioyksikön rajojen kanssa, mikäli halutaan korostaa, että
puhenopeus on muuttunut juuri kyseisen yksikön ajaksi.


\subsection*{Kuvauksen valinta}

Mikäli käytät Puh-editoria, voit kuvata puhenopeuden muutoksen suunnan
piirteen \linebreak \emph{directionOfTempoChange} avulla. Voit merkitä
kyseisen piirteen arvoksi \emph{slower} (ympäristöään hitaammin lausuttu
puhe) tai \emph{faster} (ympäristöään nopeammin lausuttu puhe). Jos
käytät esim. Praatia, merkitse IntervalTier-yksikön nimikkeeksi tieto
siitä, onko kyse puheen nopeutumisesta vai hidastumisesta yksikön
aikana. Tarvittaessa voit käyttää esim. lyhenteitä \emph{-}, \emph{slower}
ja \emph{+}, \emph{faster}.


\chapter{\label{cha:Vuorovaikutusyksikot}Vuorovaikutusyksiköt}


\section{\label{sub:Turn-vuoro}Turn\index{Turn} \--- vuoro\index{vuoro}}


\subsection*{Määritelmä ja käyttötarkoitus}

Yhden puhujan yhden tai useamman peräkkäisen lausuman muodostama kokonaisuus,
jonka aikana toiset puhujat eivät onnistuneesti keskeytä. Lausumien
lisäksi vuoron rakenneyksiköinä voivat periaatteessa toimia eleet
(\ref{sub:Gesture-ele}) ja ilmeet (\ref{sec:Mimic-ilme}) sekä paralingvistiset
yksiköt (\ref{cha:Paralingvistiset-yksikot}, esim. pään nyökkäys
tai nauru). Puhujanvaihdokset osoittavat vuoron alkua ja loppua. Vuoron
sisällä voi olla taukoja%
\footnote{Lisätietoa keskustelun vuorottelujäsennyksestä ja vuoron rakenteesta
\citealp{ISK}, ss. 955\--1000; \citep{Hakulinen97}.%
} (\ref{sub:Pause-tauko}).

%
\begin{figure}[h]
\begin{center}\includegraphics[%
  scale=0.6]{/home/lennes/annotation_guide/jpgfigs/1DB-220197_yksi_sana_lausuma_vuoro.jpg}\end{center}


\caption{\label{cap:sana-per-vuoro}Yksi ainoa sana voi muodostaa kokonaisen
lausuman ja vuoron. Näyte on Kielipankin tallenteesta 1DB-220197}

(\url{http://www.csc.fi/kielipankki/puhe/recordings/1DB-220197/}).
\end{figure}


\subsection*{Paikantaminen ja rajaaminen}

Vuoron nimikointia varten tulisi luoda kullekin puhujalle oma annotointikerros,
koska puheenvuorot menevät ainakin arkikeskustelussa yleensä osin
päällekkäin. Näin myös päällekkäispuhunnat saadaan näkyviin ilman
erillistä annotointikerrosta. 

\label{puhujien-maara-ja-vuorokerrokset}Jos vuorojen nimikointiin
käytetään Puh-editoria ja puhujia on monta, voidaan haluttaessa käyttää
vähemmän vuorokerroksia, jolloin nimikoidaan esimerkiksi kahden tai
kolmen puhujan vuoroyksiköt samaan annotaatiokerrokseen. Tällöin kussakin
vuoroyksikössä esiintyvä puhuja täytyy merkitä erikseen yksikön ominaisuuden
\emph{soundSource} (äänilähde) avulla (ks. \ref{yksikon-aanilahde}).
Mikäli nimikointiin käytetään Puh-editorin sijaan Praatia tai jotakin
muuta ohjelmaa, on kunkin puhujan vuoroille aina tehtävä oma \emph{Turn}-annotaatiokerros.

Puhujien minimipalautteet eli vastauspartikkelit merkitään omiksi
vuoroikseen. Jos minimipalaute tuotetaan kokonaan päällekkäispuhunnan
aikana, toisen puhujan vuoro ei (välttämättä) jakaudu kahtia. 

Annotoija päättää tapauskohtaisesti, esiintyvätkö tauot vuorojen välillä
vai ovatko ne vuoronsisäisiä. Yleistäen ja yksinkertaistaen voitaneen
sanoa, että mikäli vuoro on syntaktisesti ja/tai prosodisesti kesken,
se voi sietää jopa yli sekunnin mittaisia taukoja. Jos selkeitä keskeneräisyyden
osoittimia ei ole, yli puolen sekunnin tauot vuoron sisällä ovat harvinaisia.
Kuvassa \ref{cap:vuoronsisaiset-tauot} on vuoro, joka koostuu kahdesta
lausumasta. Jälkimmäinen niistä sisältää kaksi yli puolen sekunnin
mittaista taukoa, jotka ovat vuoronsisäisiä. Tulkintaa puoltavat sekä
syntaksi että prosodia. Kuvassa \ref{cap:vuorot-ja-tauot} on kuvan
\ref{cap:vuoronsisaiset-tauot} vuoro ja osa sitä seuraavasta vuorosta.
Vuorot ovat eri puhujien tuottamia. Ensimmäisen vuoron toisen lausuman
jälkeinen tauko on rajattu molempien vuorojen ulkopuolelle. Nimikoinnissa
on käytetty rajaamiskriteereinä jälleen sekä prosodiaa että syntaksia:
lausuma ja vuoro ovat syntaktisesti ja prosodisesti loppuun saatettuja,
eikä tauon näin ollen oleteta kuuluvan kumpaankaan vuoroon.

\begin{landscape}%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.8]{/home/lennes/annotation_guide/jpgfigs/1DB-222809-1_vuoro_ja_tauot.jpg}\end{center}


\caption{\label{cap:vuoronsisaiset-tauot}Vuoron sisällä voi esiintyä taukoja.
Ylempään annotaatiokerrokseen on merkitty vuoro, joka koostuu kahdesta
lausumasta (\emph{selvä / lähdetään sitten näihin päivän agendalla
oleviin asioihin}). Alempaan kerrokseen on rajattu sanayksiköt (\emph{Word}).
Jälkimmäinen lausuma sisältää kaksi yli puolen sekunnin mittaista
taukoa. Ne ovat vuoronsisäisiä. Tulkintaa puoltavat sekä syntaksi
että prosodia. Näyte on Kielipankin tallenteesta 1DB-222809-1}

(\url{http://www.csc.fi/kielipankki/puhe/recordings/1DB-222809-1/}).
\end{figure}
\end{landscape}

\begin{landscape}%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.6]{/home/lennes/annotation_guide/jpgfigs/1DB-222809-1_vuorot_ja_tauot.jpg}\end{center}


\caption{\label{cap:vuorot-ja-tauot}Taukoja vuoron sisällä ja vuorojen välissä.
Näyte on Kielipankin tallenteesta 1DB-222809-1}

(\url{http://www.csc.fi/kielipankki/puhe/recordings/1DB-222809-1/}).
\end{figure}
\end{landscape}

Vuorot rajautuvat puhujanvaihdosten kautta. Tätä havainnollistaa kuva
\ref{cap:3puhujan-vuorottelu}, johon on nimikoitu kahden ensimmäisen
minuutin vuorot yhdestä Ylen Aamu-tv:n haastattelusta. Vuorojen välillä
ei tarvitse olla taukoa vaan vuorot voivat liittyä saumattomasti toisiinsa.

\begin{landscape}%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.6]{/home/lennes/annotation_guide/jpgfigs/1DB-222809-1_vuorottelu.jpg}\end{center}


\caption{\label{cap:3puhujan-vuorottelu}Kolmen puhujan vuorottelua. Vuorot
rajautuvat puhujanvaihdosten kautta. Näyte on Kielipankin tallenteesta
1DB-222809-1}

(\url{http://www.csc.fi/kielipankki/puhe/recordings/1DB-222809-1/}).
\end{figure}
\end{landscape}


\subsection*{Riippuvuudet muista yksiköistä}

Koska aineiston nimikointi kannattaa aloittaa laajimmasta yksiköstä,
olisi vuorot hyvä nimikoida ensimmäisenä. Mikäli lausumat, sanat,
tavut ja/tai äänteet on rajattu omiin kerroksiinsa ennen vuoroja,
kohdistetaan vuorojen rajat näiden kanssa soveltuvin osin. 


\subsection*{Kuvauksen valinta}

Ortografinen litteraatti.


\section{\label{sub:ProsodicUtterance-lausuma}ProsodicUtterance\index{ProsodicUtterance}
\--- lausuma\index{lausuma}}


\subsection*{Määritelmä ja käyttötarkoitus}

Vuoron rakenneyksikkö, joka muodostaa syntaktisen, pragmaattisen ja/tai
prosodisen kokonaisuuden (ks. esim. kuva \ref{cap:Kaksi-lausumaa}).
Lausumaa ei voi tyhjentävästi rakenteellisin kriteerein määritellä.
Yksi lausuma voi koostua pelkästä dialogipartikkelista, mutta toisaalta
se voi olla usean lauseen mittainen. %
\footnote{Ks. \citealp{ISK} , ss. 957\--958; \citealp{Hakulinen97}.%
}

%
\begin{figure}[h]
\begin{center}\includegraphics[%
  scale=0.6]{/home/lennes/annotation_guide/jpgfigs/1DB-220197_kaksi_lausumaa.jpg}\end{center}


\caption{\label{cap:Kaksi-lausumaa}Kuvassa on kaksi saman puhujan peräkkäistä
lausumaa. Ne voidaan erotella kahdeksi lausumaksi prosodisin kriteerein:
lausumien välissä on lyhyt tauko ja lausumat ovat prosodisia kokonaisuuksia.
Toisaalta ne voidaan erottaa kahdeksi eri lausumaksi myös pragmatiikan
avulla: ensimmäinen lausuma osoittaa puhujan ymmärtäneen, mistä edellisessä
vuorossa oli kyse; toinen puolestaan pyytää edelliseen vuoroon tarkennusta.
Näyte on Kielipankin tallenteesta 1DB-220197}

(\url{http://www.csc.fi/kielipankki/puhe/recordings/1DB-220197/}).
\end{figure}


\subsection*{Paikantaminen ja rajaaminen}

Vuorot kannattaa nimikoida ennen lausumia. Vuoro voi sisältää yhden
tai useamman lausuman eli vuoron rakenneyksikön. Ison suomen kieliopin
mukaan \char`\"{}jokainen syntaktisen kokonaisuuden loppu on periaatteessa
mahdollinen puhujanvaihdoskohta\char`\"{} \citep[s. 960]{ISK}. Näin
ollen jokainen syntaktisen kokonaisuuden loppu on myös todennäköinen
lausuman raja.

Usein lausuma on myös prosodinen kokonaisuus. Moniyksikköisissä vuoroissa
puhuja saattaa kuitenkin jättää lausumarajan prosodisesti merkitsemättä
voidakseen pitää vuoroa pidempään. Hän voi esim. rynnätä vaihdoskohdan
yli \citep[s. 38]{Hakulinen97}, mistä on esimerkki kuvassa \ref{cap:ryntays}.
Moniyksikköiset vuorot ovat tavallisia etenkin kertomuksissa ja selostuksissa
\citep[s. 962]{ISK}. Narinaääni (ks. \ref{sub:CreakyVoice-narinaaani})
voi \--- etenkin suomenkielisessä puheessa \--- olla merkkinä mahdollisesta
puhujanvaihdoskohdasta ja näin ollen myös lausuman rajasta (ks. esim.
\citealp{Ogden01}, \citealp{Ogden}).

\begin{landscape}%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.6]{/home/lennes/annotation_guide/jpgfigs/1DB-222809-2_rynt.jpg}\end{center}


\caption{\label{cap:ryntays}Kuvassa on kolme lausumaa. Kaksi lausumaa voi
esiintyä saumattomasti peräkkäin esimerkiksi tällaisessa tapauksessa,
jossa puhuja ''ryntää'' ensimmäisestä lausumasta toiseen säilyttääkseen
vuoron itsellään. Ryntäys vaikuttaa lausumien rajan molemmilla puolilla
esiintyviin prosodisiin piirteisiin. Tässä puhuja nostaa ryntäyskohdassa
hetkeksi äänensä sävelkorkeutta, mikä erottuu myös kapeakaistaisessa
spektrogrammissa vaakasuuntaisten raitojen harventumisena. Näyte on
Kielipankin tallenteesta 1DB-222809-2}

(\url{http://www.csc.fi/kielipankki/puhe/recordings/1DB-222809-2/}).
\end{figure}
\end{landscape}


\subsection*{Riippuvuudet muista yksiköistä}

Lausuman rajat tulee kohdistaa vuorojen (\ref{sub:Turn-vuoro}) rajojen
kanssa sekä sana-, tavu- ja äännerajojen kanssa, mikäli nämä on jo
annotoitu.


\subsection*{Kuvauksen valinta}

Ortografinen litteraatti. Lausumalla on myös piirre \textbf{finalIntonation},
jolla voidaan haluttaessa kuvata lausuman lopussa havaittu sävelkulku.
Vaihtoehtoja on kolme: intonaatio joko laskee (\emph{falling}), pysyy
tasaisena (\emph{level}) tai nousee (\emph{rising}) lausuman lopussa.
Jos käytät esim. Praatia, merkitse PointTier-tyyppiseen finalIntonation-annotaatiokerrokseen
yksi piste (point) suunnilleen keskelle lausumaa ja pisteen nimikkeeksi
loppuintonaation tyyppi. Tarvittaessa voit käyttää lyhenteitä, esim.
\emph{\textbackslash{}}, \emph{falling}; \emph{-}, \emph{level}; \emph{/},
\emph{rising}.


\section{\label{sub:Pause-tauko}Pause\index{Pause} \--- tauko\index{tauko}}


\subsection*{Määritelmä ja käyttötarkoitus}

Signaalin jakso, jonka aikana ei esiinny määrättyä toimintaa. Annotoijan
on itse päätettävä, mitkä annotointiyksiköt eivät voi sisältyä taukoon,
sillä tämä määrittely riippuu taukoyksiköiden käyttötarkoituksesta
(halutaanko tutkia puhujien vuorovaikutusta vai mitata taustakohinan
määrää).

Yksinkertaisimmillaan tauko on puhunnosten (\emph{PhoneticUtterance},
\ref{sub:PhoneticUtterance-puhunnos}) ulkopuolelle jäävä alue. Esimerkiksi
paralingvistisiä piirteitä voidaan myös jättää taukojen ulkopuolelle.
Joskus on tarpeen rajata puhujakohtaiset tauot, mutta usein tauko
tarkoittaa jonkinlaista katkosta koko keskustelussa. Haluttaessa voidaan
määritellä tiukasti, että tauko on täysin äänetön kohta puhesignaalissa,
jolloin mikään muu ääntä kuvaava yksikkö ei voi taukoon sisältyä (akustinen
tai hiljaisuuden määritelmä). Tauon sisällä voidaan vaihtoehtoisesti
sallia hälyääniä (\emph{Noise}, \ref{sub:Noise-haly}). 


\subsection*{Paikantaminen ja rajaaminen}

Puheesta annotoidaan ensin kaikki taukoihin kuulumattomat yksiköt
(esimerkiksi puhunnokset, \ref{sub:PhoneticUtterance-puhunnos}),
minkä jälkeen taukoyksiköt voidaan rajata täysin automaattisesti.
Mikäli tauoille ei ole olemassa mitään erillistä jäsentelyä, niitä
ei siis tarvitse annotoida käsin.


\subsection*{Riippuvuudet muista yksiköistä}

Tauot rajautuvat kaikkien niiden yksiköiden perusteella, joita ei
katsota taukoon kuuluviksi.


\subsection*{Kuvauksen valinta}

Tauolle ei ole määritelty erillistä kuvaustapaa, mutta tauon nimikkeeksi
voi antaa mitä tahansa tekstiä. Käyttäjä voi halutessaan määritellä
erilaisia taukotyyppejä ja annotoida nämä taukojen piirteiksi. 

Kun taukoon kuulumattomat yksiköt on määritelty eksplisiittisesti,
kannattaa \emph{Pause}-yksikölle periyttää aliyksikkö, jonka määritelmässä
kielletyt tai sallitut yksiköt luetellaan.


\chapter{\label{cha:Paralingvistiset-yksikot}Paralingvistiset yksiköt}

Paralingvistiseen annotaatiokerrokseen merkitään sellaisia puheen
piirteitä, jotka eivät ole varsinaisesti lingvistisiä vaan kuvastavat
puhujan fyysistä tai emotionaalista tilaa: esim. hymyily, nauru, yskiminen,
haukottelu. Kaikille piirteille, jotka voivat esiintyä päällekkäin,
on luotava oma annotaatiokerros.


\section{Riippuvuudet muista yksiköistä}

Paralingvistiset yksiköt eivät yleensä ole riippuvaisia mistään muusta
annotaatioyksiköstä, joskin tietyt paralingvistiset yksiköt voivat
olla fysiologisista syistä toisensa poissulkevia (esim. aivastuksen
aikana ei hengitetä sisään vaan yleensä juuri ennen aivastusta; jne.).
Paralingvistisiä yksiköitä voidaan siis periaatteessa annotoida myös
ilman mitään muita olemassaolevia annotaatioyksiköitä.


\section{Fysiologista tilaa ilmaisevat}


\subsection{\label{sub:Breathing-hengitys}Breathing\index{Breathing} \---
hengitys\index{hengitys}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Jakso, jonka aikana puhuja hengittää.

Tallenteesta havaitut puhujan sisään- ja uloshengitykset merkitään
omaan annotaatiokerrokseensa (Breathing), sillä sisään- ja uloshengityksiä
voi esiintyä päällekkäin monen muun puheen ilmiön kanssa. Suomenkieliselle
epämuodolliselle puheelle tyypillisiä ovat esimerkiksi lyhyet ingressiivisen
puheen jaksot (ingressiivistä puhetta tuotetaan sisäänhengityksen
aikana). 


\subsubsection*{Paikantaminen ja rajaaminen}

Läheskään kaikki sisäänhengitykset eivät erotu äänisignaalissa eivätkä
siis ole annotoitavissa (ilman fysiologista lisäinformaatiota). Hengityksestä
kuuluvan äänen alku ja loppu eivät myöskään ole tarkkarajaisia. Sisäänhengitykset
kannattaa kuitenkin merkitä, sillä niiden ajallisella sijoittumisella
voi olla paljon merkitystä esim. äänenlaadun muutosten ja intonaation
kannalta.


\subsubsection*{Kuvauksen valinta}

Hengitysten nimikevaihtoehdot ovat sisäänhengitys (\emph{in}) ja uloshengitys
(\emph{out}). Normaalisti puhuja hengittää puheen aikana ulospäin,
mutta tätä ei tarvitse käsin annotoida. Nk. ingressiivisen, sisäänhengitetyn
puheen kohdalle merkitään sisäänhengitys. Puhunnosten ulkopuolella
esiintyvän selvän uloshengitysäänen voi merkitä erikseen. Jos tietty
uloshengitys on ymmärrettävissä esimerkiksi huokaukseksi, sen voi
lisäksi tai vaihtoehtoisesti merkitä huokauskerrokseen huokausmerkinnällä.


\subsection{\label{sub:Sigh-huokaus}Sigh\index{Sigh} \--- huokaus\index{huokaus}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Huokauksesta syntyvä ääni.


\subsubsection*{Paikantaminen ja rajaaminen}

Kuulonvaraisesti ja akustisia kuvauksia ja/tai videokuvaa tarkastelemalla.


\subsubsection*{Kuvauksen valinta}

Huokausyksiköille ei Puh-editorissa merkitä erillistä kuvausta. Praatissa
huokauksia kuvaavaan annotaatiokerrokseen merkitään huokausjakson
kohdalle merkintä \emph{.sigh}. Mikäli halutaan määritellä huokauksen
tyyppejä, on Puh-editorilla periytettävä huokausyksikölle aliyksikkö,
jonka yhdelle ominaisuudelle määritellään lista sallittuja huokaustyyppejä
tai vapaa tekstinimike.


\subsection{\label{sub:Yawn-haukotus}Yawn\index{Yawn} \--- haukotus\index{haukotus}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Haukotuksesta syntyvä ääni


\subsubsection*{Paikantaminen ja rajaaminen}

Kuulonvaraisesti ja akustisia kuvauksia ja/tai videokuvaa tarkastelemalla.


\subsubsection*{Kuvauksen valinta}

Haukotusyksiköille ei Puh-editorissa merkitä erillistä kuvausta. Praatissa
haukotuksia kuvaavaan annotaatiokerrokseen merkitään haukottelun kohdalle
merkintä .\emph{yawn}.


\subsection{\label{sub:Sniff-niiskautus}Sniff\index{Sniff} \--- niiskautus\index{niiskutus}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Nenän niiskautuksesta syntyvä ääni.


\subsubsection*{Paikantaminen ja rajaaminen}

Kuulonvaraisesti ja akustisia kuvauksia tarkastelemalla.


\subsubsection*{Kuvauksen valinta}

Niiskutusyksiköille ei Puh-editorissa merkitä erillistä kuvausta.
Praatissa niiskutuksia kuvaavaan annotaatiokerrokseen merkitään niiskutuksen
kohdalle merkintä .\emph{sniff}.


\subsection{\label{sub:ClearThroat-rykaisy}ClearThroat\index{ClearThroat} \---
rykäisy\index{rykäisy}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Rykäisystä syntyvä ääni.


\subsubsection*{Paikantaminen ja rajaaminen}

Kuulonvaraisesti ja akustisia kuvauksia tarkastelemalla.


\subsubsection*{Kuvauksen valinta}

Rykäisy-yksiköille ei Puh-editorissa merkitä erillistä kuvausta. Praatissa
rykäisyjä kuvaavaan annotaatiokerrokseen merkitään rykäisyn kohdalle
Worldbet-merkintä .\emph{ct}. 


\subsection{\label{sub:Cough-yskiminen}Cough\index{Cough} \--- yskiminen\index{yskiminen}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Yskimisestä syntyvä ääni.


\subsubsection*{Paikantaminen ja rajaaminen}

Kuulonvaraisesti ja akustisia kuvauksia ja/tai videokuvaa tarkastelemalla.


\subsubsection*{Kuvauksen valinta}

Cough-yksiköille ei Puh-editorissa merkitä erillistä kuvausta. Praatissa
yskimistä kuvaavaan annotaatiokerrokseen merkitään yskimisen kohdalle
Worldbet-merkintä .\emph{cough}. 


\subsection{\label{sub:Sneeze-=3D-aivastus}Sneeze\index{Sneeze} \--- aivastus\index{aivastus}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Aivastuksesta syntyvä ääni


\subsubsection*{Paikantaminen ja rajaaminen}

Kuulonvaraisesti ja akustisia kuvauksia ja/tai videokuvaa tarkastelemalla.


\subsubsection*{Kuvauksen valinta}

Aivastusyksiköille ei Puh-editorissa merkitä erillistä kuvausta. Praatissa
aivastuksia kuvaavaan annotaatiokerrokseen merkitään aivastuksen kohdalle
Worldbet-merkintä .\emph{sneeze}.


\subsection{\label{sub:Swallow-nielaisu}Swallow\index{Swallow} \--- nielaisu\index{nielaisu}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Nielaisusta syntyvä ääni.


\subsubsection*{Paikantaminen ja rajaaminen}

Kuulonvaraisesti ja akustisia kuvauksia ja/tai videokuvaa tarkastelemalla.


\subsubsection*{Kuvauksen valinta}

Nielaisuyksiköille ei Puh-editorissa merkitä erillistä kuvausta. Praatissa
nielaisuja kuvaavaan annotaatiokerrokseen merkitään yskimisen kohdalle
merkintä .\emph{swallow}.


\section{Tunnetilaa ilmaisevat}


\subsection{\label{sub:Laughter-nauru}Laughter\index{Laughter} \--- nauru\index{nauru}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Nauru tai naurunsekaisesti lausuttu puheen jakso.


\subsubsection*{Paikantaminen ja rajaaminen}

Kuulonvaraisesti ja äänisignaalin perusteella määritetään naurulle
ominaisten peräkkäisten hengityksen pyrskähdysten alku ja loppu. Yksittäisiä
pyrskähdyksiä ei tarvitse merkitä erikseen.


\subsubsection*{Kuvauksen valinta}

Nauruyksiköille ei Puh-editorissa merkitä erillistä kuvausta. Praatissa
naurua kuvaavaan annotaatiokerrokseen merkitään naurujakson kohdalle
Worldbet-merkintä \emph{.laugh}. Mikäli halutaan määritellä naurutyyppejä,
on Puh-editorilla periytettävä nauruyksikölle aliyksikkö, jonka yhdelle
ominaisuudelle määritellään lista sallittuja naurutyyppejä tai vapaa
tekstinimike. 


\subsection{\label{sub:Smile-hymyily}Smile\index{Smile} \--- hymyily\index{hymyily}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Hymyillen lausuttu puheen jakso.


\subsubsection*{Paikantaminen ja rajaaminen}

Etsitään lähinnä kuulonvaraisesti hymyilyn alku ja loppu. Mikäli tallenteeseen
liittyy videoaineistoa, saadaan nimikoiduksi myös sellaiset kohdat,
joissa hymyilevä henkilö ei tuota puhetta tai muita ääniä.


\subsubsection*{Kuvauksen valinta}

Hymyily-yksiköille ei voi Puh-editorissa antaa erillistä kuvausta.
Praatissa hymyilyä kuvaavaan annotaatiokerrokseen merkitään hymyillen
lausutun jakson kohdalle Worldbet-merkintä \emph{.smile}. Mikäli halutaan
määritellä hymyilyn tyyppejä, on Puh-editorilla periytettävä hymyily-yksikölle
aliyksikkö, jonka yhdelle ominaisuudelle määritellään lista sallittuja
hymyilyn tyyppejä tai vapaa tekstinimike. 


\subsection{\label{sub:Weep-itku}Weep\index{Weep} \--- itku\index{itku}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Itku tai itkunsekaisesti lausuttu puheen jakso.


\subsubsection*{Paikantaminen ja rajaaminen}

Kuulonvaraisesti.


\subsubsection*{Kuvauksen valinta}

Itkuyksiköille ei Puh-editorissa merkitä erillistä kuvausta. Praatissa
itkua kuvaavaan annotaatiokerrokseen merkitään itkujakson kohdalle
merkintä \emph{.weep}. Mikäli halutaan määritellä itkun tyyppejä (esim.
pienen vauvan itkun luokitus), on Puh-editorilla periytettävä itkuyksikölle
aliyksikkö, jonka yhdelle ominaisuudelle määritellään lista sallittuja
itkun tyyppejä tai vapaa tekstinimike.


\subsection{\label{sub:Sob-nyyhkytys}Sob\index{Sob} \--- nyyhkytys\index{nyyhkytys}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Nyyhkytyksestä syntyvä ääni


\subsubsection*{Paikantaminen ja rajaaminen}

Kuulonvaraisesti.


\subsubsection*{Kuvauksen valinta}

Nyyhkytysyksiköille ei voi Puh-editorissa antaa erillistä kuvausta.
Praatissa nyyhkytystä kuvaavaan annotaatiokerrokseen merkitään nyyhkyttäen
tuotetun jakson kohdalle merkintä \emph{.sob}. Mikäli halutaan määritellä
nyyhkytyksen tyyppejä, on Puh-editorilla periytettävä nyyhkytysyksikölle
aliyksikkö, jonka yhdelle ominaisuudelle määritellään lista sallittuja
nyyhkytyksen tyyppejä tai vapaa tekstinimike.Vapaa tekstikuvaus.


\section{Muut}


\subsection{\label{sub:TongueClick-kielen-naksahdus}TongueClick\index{TongueClick}
\--- kielen naksahdus\index{kielen naksahdus}\index{maiskautus, kielen}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Kielen naksahdus tai maiskautus. Usein tahattomia, mutta esiintyvät
toisinaan vuorojen tai puhunnosten alun merkkeinä. Huom. tätä yksikköä
ei käytetä joissakin kielissä esiintyvien maiskausäänteiden kuvaukseen.


\subsubsection*{Paikantaminen ja rajaaminen}

Kuulonvaraisesti kielen naksahdukset tai maiskahdukset on helppo todeta,
mutta niiden tarkka paikantaminen on toisinaan mahdotonta ilman akustisten
kuvausten tarkastelua. Kielen naksaukset erottuvat yleensä aaltomuodossa
ja/tai spektrogrammissa hyvin lyhyinä purskeina, joiden energia on
painottunut enimmäkseen korkeille taajuuksille (samoille kohdille
kuin esim. {[}s{]}- tai {[}t{]}-äänteissä). Myös k-maisempia naksahduksia
esiintyy. Joskus puhunnosten alussa esiintyy tahallisia maiskautuksia,
joissa huulia ja kieltä maiskautetaan yhdessä. Tällöin voidaan samaan
kohtaan annotoida sekä TongueClick- että Lipsmack-yksikkö.


\subsubsection*{Kuvauksen valinta}

TongueClick-yksiköille ei Puh-editorissa merkitä erillistä kuvausta.
Praatissa TongueClick- annotaatiokerrokseen merkitään kielen naksauksen
kohdalle Worldbet-merkintä \emph{.tc}. 


\subsection{\label{sub:Lipsmack-huulten-maiskautus}Lipsmack\index{Lipsmack}
\--- huulten maiskautus\index{maiskautus, huulten}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Huulten maiskautuksesta syntyvä ääni. Huom. Tätä yksikköä ei käytetä
\emph{maiskausäänteiden} kuvaukseen.


\subsubsection*{Paikantaminen ja rajaaminen}

Kuulonvaraisesti huulten maiskahdukset on helppo todeta. Huulten maiskautukset
erottuvat yleensä aaltomuodossa ja/tai spektrogrammissa hyvin lyhyinä,
kielen naksahduksia vaimeampina purskeina. Joskus puhunnosten alussa
esiintyy tahallisia maiskautuksia, joissa huulia ja kieltä maiskautetaan
yhdessä. Tällöin voidaan samaan kohtaan annotoida sekä TongueClick-
että Lipsmack-yksikkö.


\subsubsection*{Kuvauksen valinta}

Lipsmack-yksiköille ei Puh-editorissa merkitä erillistä kuvausta.
Praatissa \linebreak Lipsmack-annotaatiokerrokseen merkitään maiskautuksen
kohdalle Worldbet-merkintä \emph{.ls}. 


\chapter{\label{cha:Ulkopuoliset-aanet}Ulkopuoliset äänet}


\section{\label{sub:Noise-haly}Noise\index{Noise} \--- häly\index{häly}}


\subsection*{Määritelmä ja käyttötarkoitus}

Häly-yksikkö kattaa äänet, jotka eivät ole puhujien tuottamia. Hälykerrokseen
merkitään kaikki puheen ulkopuoliset, ei-paralingvistiset eli ekstralingvistiset
äänet. Hälykerroksia voi olla useita: esim. kellon tikitysäänet, ohi
kulkevien autojen äänet, oven narahdukset, kahvikuppien kilahdukset
jne. Kaikille äänille, jotka voivat esiintyä päällekkäin, on luotava
oma annotaatiokerros. Uusia häly-yksiköitä voi periyttää \emph{Noise}-yksiköstä.


\subsection*{Paikantaminen ja rajaaminen}

Kuulonvaraisesti ja akustisia kuvauksia ja/tai videokuvaa tarkastelemalla.


\subsection*{Kuvauksen valinta}

Vapaa tekstikuvaus.


\chapter{\label{cha:Kineettiset-yksikot}Kineettiset yksiköt}


\section{\label{sec:Kineettisten-yksikoiden-annotointi}Kineettisten yksiköiden
annotointi}

Kineettisten annotointiyksiköiden avulla voi nimikoida puhujien eleitä,
ilmeitä ja kehon asentoja. Kaikkien kineettisten yksiköiden annotointi
vaatii, että käytettävissä on tallenteeseen liittyvä videosignaali.
Liikkeitä ja ilmeitä voi annotoida suoraan videolta esimerkiksi \emph{Anvil}-ohjelmalla
tai hyvin karkeasti \emph{SoundForge}-ohjelmalla. Puh-editorissa tai
Praatissa ei toistaiseksi saa videokuvaa näkyviin, mutta annotoinnit
voi näissäkin ohjelmissa yhdistää vastaaviin ajallisiin kohtiin äänisignaalia,
vaikka käyttäisi videon selailuun jotakin toista ohjelmaa (esim. \emph{Windows
Media Player} tms.). Äänisignaaliin linkitetyt liikeannotoinnit antavat
tutkijalle joka tapauksessa hyödyllistä tietoa siitä, mihin kohtaan
puhetta tietyt liikkeet ajoittuvat.

Liikkeiden annotointia varten olisi hyvä luoda jokaiselle puhujalle
oma nimikointikerros kutakin annotointiyksikköä varten. Yleensä liikkeet
eivät ole riippuvaisia muista yksiköistä vaan ne voidaan annotoida
erillään. 

Alla kuvattujen kineettisten yksiköiden kuvaustapaa ei ole tarkasti
määritelty, vaan ilmeille, eleille ja asennoille voidaan antaa nimikkeiksi
vapaata tekstiä. Tarvittaessa yksiköille voidaan periyttää aliyksiköitä,
joiden ominaisuuksilla voi olla haluttu joukko vaihtoehtoisia arvoja.
Liikkeiden annotoinnissa on syytä keskittyä videosignaalin perusteella
määrittämään konkreettisesti, \emph{mikä liikkuu, milloin ja minne.}


\subsubsection{\label{sub:Kineettisten-yksikoiden-funktio}Kineettisten yksiköiden
funktionaalinen annotaatio}

Mikäli liikkeistä, asennoista ja ilmeistä halutaan tehdä funktionaalisia
kuvauksia\index{funktio, kineettiset yksik\"ot}, on huomattava, että
liikkeet voivat esiintyä ajallisesti eri paikassa kuin kielellinen
ilmaus, johon ne mahdollisesti liittyvät. Funktioiden määrittäminen
on myös erittäin subjektiivinen toimenpide verrattuna esimerkiksi
tietyn eleen yksinkertaiseen ajalliseen rajaamiseen videolta. Funktionaaliset
ominaisuudet kannattaakin pitää erillään kineettisistä yksiköistä
ja määritellä funktioille ehkä kokonaan omia yksiköitä, sillä tietty
funktio voi ainakin teoriassa koskea muitakin yksiköitä kuin kineettisiä.%
\footnote{Esim. Paul Ekman \citep{Ekman99} esittelee kineettisille yksiköille
viisiosaisen taksonomian. Hän jakaa liikkeet 

\begin{enumerate}
\item \emph{symboleihin} (emblems) , joilla hän tarkoittaa kulttuurisidonnaisia
ja sosiaalisesti opittuja käsien, pään ja kasvojen liikkeitä
\item \emph{kuvittajiin} (illustrators), jotka etupäässä kuvittavat ja havainnollistavat
puhetta
\item \emph{muokkaajiin} (manipulators/adapters), jotka ovat osin tiedostamattomia
liikkeitä, joissa yksi kehon osa \char`\"{}manipuloi\char`\"{} toista
\item \emph{säätelijöihin} (regulators), jotka ylläpitävät ja säätelevät
vuorovaikutusta; antavat ikään kuin toimintaohjeita sekä kuulijalle
että puhujalle 
\item \emph{tunteenosoituksiin} (emotional expressions), joita hän pitää
nimenomaan tahattomina. \end{enumerate}
%
}


\section{\label{sub:Gesture-ele}Gesture\index{Gesture} \--- ele\index{ele}}


\subsection*{Määritelmä ja käyttötarkoitus}

Puheeseen liittyvä raajojen liike, erityisesti käsien ja pään liikkeet.
Eleiden annotaatiosta ei ole vielä olemassa yhtenäisiä suosituksia
saati standardeja. Eri tutkijat kuvaavat eleitä hyvin vaihtelevin
tavoin, joten \emph{Gesture}-yksikölle ei ole määrätty mitään tiettyä
kuvaustapaa. 

ISLEn ehdotuksen \citep{ISLEmultimodal02} mukaan voitaisiin esimerkiksi
annotoida

\begin{itemize}
\item pään eleet: rotaatio, kulma eteen/taakse, sivuttaiskulma
\item käsien eleet: funktio (\char`\"{}osoittaminen\char`\"{}, \char`\"{}ei\char`\"{},
\char`\"{}takaisin\char`\"{})
\item modifioijat: esim. viittaus projisoitavaan kuvaan, raaka morfologinen
muoto (esim. \char`\"{}ympyrä yhdellä kädellä\char`\"{}), alku- ja
loppukoordinaatit.
\end{itemize}
Henkilön jokaisen raajan liikkeitä kannattaa kuvata eri annotaatiokerroksissa,
sillä esimerkiksi vasen ja oikea käsi voivat periaatteessa liikkua
itsenäisesti. Tarvittavat uudet annotaatioyksiköt voidaan periyttää
Gesture-yksiköstä Puh-editorilla. Ilmeille (\ref{sec:Mimic-ilme}),
katseille (\ref{sub:Gaze-katse}) sekä vartalon asennolle ja liikkeille
(\ref{sub:Posture-asento}) on kuitenkin jo olemassa omat annotaatioyksikkönsä.

Lisätietoa eleistä esim. Ekman ja Friesen\citep{Ekman72}.


\subsection*{Kuvauksen valinta}

Vapaa tekstikuvaus. Tarvittaessa eleyksiköstä voidaan Puh-editorilla
periyttää aliyksiköitä, joilla kuvataan eri raajojen eleitä ja näiden
erilaisia ominaisuuksia.


\section{\label{sec:Mimic-ilme}Mimic\index{Mimic} \--- ilme\index{ilme}}


\subsection*{Määritelmä ja käyttötarkoitus}

Kasvojen ja silmien liikkeet. Ilmeitä voi jaotella monin tavoin. Koska
eri tutkijoiden näkemykset ilmeiden luokittelusta vaihtelevat, ei
Mimic-yksikölle ole tässä määritelty tarkkaa kuvaustapaa.%
\footnote{Esimerkiksi Peräkylä ja Ruusuvuori \citep{Perakyla04} luokittelevat
ilmeet seuraavasti: suupielien nosto (kaksi astetta), suupielien lasku,
suun avaaminen, kulmakarvojen kohotus, huulien yhteen puristaminen
ja kulmien kurtistus. Funktionaalisemmin ilmeet voidaan jaotella esim.
kolmia: iloa, mielipahaa tai muuta negatiivista tunnetta ja yllättyneisyyttä
ilmaiseviin. Funktionaalisia ominaisuuksia ei kuitenkaan annotaatiossa
suositella yhdistettäväksi suoraan kineettisiin yksiköihin (ks. perustelut
kohdasta \ref{sub:Kineettisten-yksikoiden-funktio}).

Lisätietoa ilmeiden luokittelusta ja kuvaamisesta löytyy mm. teoksista
Ekman \citep{Ekman92}, Ekman ja Friesen \citep{Ekman92b} ja Fridlund
\citep{Fridlund94}.%
} Myös silmien sulkeminen ja avaaminen (lukuun ottamatta normaalia
räpyttelyä) annotoidaan tarvittaessa Mimic-yksiköstä periytetyllä
aliyksiköllä.


\subsection*{Paikantaminen ja rajaaminen}

Jokaiselle keskustelijalle luodaan oma nimikointikerros, johon ilmeet
merkitään.


\subsection*{Kuvauksen valinta}

Vapaa tekstikuvaus.


\subsection{\label{sub:Gaze-katse}Gaze\index{Gaze} \--- katse\index{katse}}


\subsubsection*{Määritelmä ja käyttötarkoitus}

Katseen suunta. Katseiden nimikointi on tärkeää esim. monenkeskisissä
kasvokkaiskeskusteluissa. Katseilla on merkitystä etenkin keskustelun
vuorojen jakautumisen kannalta. 


\subsubsection*{Paikantaminen ja rajaaminen}

Jokaiselle keskustelijalle olisi hyvä luoda oma nimikointikerros.
Siihen merkitään katseen kohdistuminen ja sen siirtyminen johonkin
tai jostakin. Tärkeää on, että nimikoinnista selviävät eri keskustelijoiden
katsekontaktit tai niiden puute \citep[s. 26--29]{Seppanen97}.


\subsubsection*{Kuvauksen valinta}

Katseyksiköille voi antaa kuvaukseksi vapaata tekstiä. Katseita annotoitaessa
kannattaa merkitä ainakin katseen kohde (keneen tai mihin henkilö
katsoo yksikön kuvaamalla ajanjaksolla). Tällöin tulee implisiittisesti
merkittyä myös, että näiden yksiköiden välillä kyseisen henkilön katseen
suunta muuttuu. Mikäli kahden puhujan \emph{Gaze}-annotaatiokerroksissa
on samanaikaisesti yksikkö, jonka kohde on toinen puhujista, vallitsee
näiden henkilöiden välillä silloin molemminpuolinen katsekontakti,
eikä katsekontakteja näin tarvitse merkitä mihinkään erilliseen annotaatiokerrokseen.
Tarvittaessa Gaze-kerrokseen voidaan merkitä erillisiksi yksiköiksi
ajanjaksot, jolloin henkilö kohdistaa tai tarkentaa katsettaan. Tällöinkin
kuvauksessa tulee mainita, mihin katsetta kohdistetaan.


\section{\label{sub:Posture-asento}Posture\index{Posture} \--- asento\index{asento}}


\subsection*{Määritelmä ja käyttötarkoitus}

Kehon asento. Mikäli pään ja raajojen asentojen kuvaaminen ei luontevasti
onnistu muiden annotaatioyksiköiden avulla, siihen voi käyttää myös
tätä yksikköä.


\subsection*{Paikantaminen ja rajaaminen}

Rajataan videosignaalin avulla.


\subsection*{Kuvauksen valinta}

Asentoyksiköille voi antaa kuvaukseksi vapaata tekstiä, jolla voi
kuvata henkilön kehon asentoa kyseisellä ajanjaksolla. Tarkempaa luokittelua
ja kuvausta varten kannattaa \linebreak Posture-yksiköstä periyttää
Puh-editorilla aliyksiköitä, joille on määritelty haluttuja ominaisuuksia.

Yksikön avulla voi kuvata keskustelijoiden kehon asentoa esimerkiksi
sekä vertikaalisen että horisontaalisen akselin suhteen (suorassa/pystyssä,
eteen- tai taaksepäin kallellaan, jommallekummalle sivulle kiertyneenä).
Kehon asentoja voi nimikoida myös suhteessa muihin keskustelijoihin
(kohti - poispäin). 


\chapter{\label{cha:Apuyksikot}Apuyksiköt}

Seuraavat annotointiyksiköt ovat hyvin yleisluontoisia. Niille ei
ole haluttu määritellä mitään tiettyä vaikutus- tai toteutumisalaa,
vaan niiden määritelmät on tarkoituksellisesti jätetty väljiksi, jotta
annotoijat voivat periyttää niistä tarvitsemiaan aliyksiköitä ongelmitta
ja jotta niiden avulla voi nimikoida monentasoisia kielen ilmiöitä.


\section{\label{sub:Topic-topiikki}Topic\index{Topic} \--- topiikki\index{topiikki}}


\subsection*{Määritelmä ja käyttötarkoitus}

Apuyksikkö, jonka avulla voi kuvata puheenaihetta tai topiikkia. Topiikkien
nimikoinnista voi olla hyötyä, jos esimerkiksi hyvin pitkästä äänitallenteesta
halutaan nopeasti löytää jotain tiettyä aihetta käsittelevä kohta.
Topiikkiyksikköä voidaan hyödyntää myös, jos nimikoitavaan tallenteeseen
on koottu peräkkäin useita erilaisia näytteitä. Ne voidaan helposti
rajata topiikin avulla.


\subsection*{Kuvauksen valinta}

Vapaa tekstikuvaus.


\section{\label{sub:Sequence-sekvenssi}Sequence\index{Sequence} \--- sekvenssi\index{sekvenssi}}


\subsection*{Määritelmä ja käyttötarkoitus}

Sekvenssi on apuyksikkö, jota voidaan käyttää toisiinsa kiinteästi
liittyvien vuorojen nimikointiin. Yksikkö on tarkoitettu esimerkiksi
vierusparien ja kolmannen position vuorojen tai muiden vuoroa laajempien
toimintajaksojen nimikointiin.


\subsection*{Riippuvuudet muista yksiköistä}

Kohdistetaan vuoro- ja lausumayksiköiden rajojen kanssa, mikäli nämä
ovat ennestään olemassa.


\subsection*{Kuvauksen valinta}

Vapaa tekstikuvaus.


\section{\label{sub:SpeechFunction-puhefunktio}SpeechFunction\index{SpeechFunction}
\--- puhetoiminto\index{puhefunktio}}


\subsection*{Määritelmä ja käyttötarkoitus}

Puhetoiminto on apuyksikkö, jota voidaan käyttää yksinkertaisten,
prototyyppisten puhetoimintojen nimikointiin.%
\footnote{Puhetoimintoja on luokiteltu ainakin USIX Interact -projektissa

(\url{http://www.mlab.uiah.fi/interact/index.htm}).

Turun puhekielen tutkimusprojektissa puhefunktioita on nimetty lähes
kolmekymmentä (ks. \citealp[s. 85]{Suojanen85}).%
}Yksikön tarkempi määrittely on annotoijan vastuulla.


\subsection*{Kuvauksen valinta}

Vapaa tekstikuvaus.


\section{\label{sub:Hesitation-eparointi}Hesitation\index{Hesitation} \---
epäröinti\index{epäröinti}}


\subsection*{Määritelmä ja käyttötarkoitus}

Epäröinniksi voidaan nimikoida mm. epäröinti- tai empimisääntely (esim.
äännökset \emph{mm}, \emph{ee}, \emph{öö}) sekä erilaiset suunnitteluilmaukset
(esim. \emph{tuota}, \emph{niinku}) tai itsekorjauksessa käytetyt
partikkelit (ks. \citep[ss. 821--822]{ISK}). Empimisääntelyllä voidaan
viivyttää varsinaisen sisällön esiinpanemista keskustelussa, ja yleensä
se liittyy puheen suunnitteluun, korjaukseen ja sanahakuun.


\subsection*{Riippuvuudet muista yksiköistä}

Epäröinti- eli empimisäänteet nimikoidaan yleensä lausumien tai puhunnosten
yhteydessä ja tarkennetaan esimerkiksi äännekerroksen annotaation
yhteydessä.


\subsection*{Kuvauksen valinta}

Erillistä luokittelua epäröinti- tai empimisäänteille ei ole, vaan
kuvaukseksi käy mikä tahansa teksti. Tarvittaessa epäröintiäänne voidaan
merkitä yksikön nimekkeeksi tai periyttää Puh-editorissa \textbf{Hesitation}-yksiköstä
aliyksikkö, jolla on halutut ominaisuudet ja määrätyt vaihtoehdot
piirrearvoiksi.


\section{\label{sec:Chunk-jakso}Chunk\index{Chunk} \--- jakso\index{jakso}}


\subsection*{Määritelmä ja käyttötarkoitus}

Apuyksikkö, jonka avulla voidaan määritellä sellaisia uusia yksiköitä,
joita ei voi periyttää mistään olemassaolevasta yksiköstä.


\subsection*{Kuvauksen valinta}

Vapaa tekstikuvaus.

\appendix

\part{Liitteet}


\chapter{\label{cha:Foneettiset-merkit}Foneettiset merkit}

Eniten käytetty foneettinen transkriptiojärjestelmä on \textbf{kansainvälinen
foneettinen aakkosto} (\emph{International Phonetic Alphabet} eli
IPA)\index{IPA}. IPA-merkkikartat selityksineen löytyvät Kansainvälisen
foneettisen yhdistyksen (\emph{International Phonetic Association})
verkkosivuilta \citep{IPAwebsite}.

Koska kaikissa laitteistoissa ei ole asennettuna foneettista kirjasinta
ja koska foneettisia symboleita pitäisi voida yksiselitteisesti käsitellä
ja siirtää tietokoneesta toiseen, tarvitaan IPA-merkeistä ASCII-versio.
ASCII-muotoisten transkriptioiden lukeminen on tottumattomalle hieman
epämukavampaa kuin IPA-kirjasinten. Eräs IPA-aakkoston ASCII-versio
on Worldbet \citep{Hieronymus93}. Muitakin foneettisten merkkien
ASCII-versioita on, esim. SAMPA (ja sen laajennus X-SAMPA; \citealp{Sampa})
jne.

Worldbetissä ns. perussymbolia merkitään yleensä yhdellä ASCII-merkillä,
toisinaan kahdella. Äänteen lisäartikulaatiot tai artikulaatiopiirteiden
muutokset merkitään tarkkeilla eli diakriiteillä kuten IPAssakin.
Jokainen tarke erotetaan perussymbolista (ja muista mahdollisista
tarkkeista) merkitsemällä sen eteen alaviiva '\_'. Kun alaviivan muistaa
merkitä jokaisen tarkkeen eteen, tarkkeet on helpompi erottaa toisistaan
myös annotaatioiden myöhemmässä automaattisessa käsittelyssä.

Esimerkiksi vokaalilaadun tarkka erottelu on hyvin vaikeaa ja subjektiivista.
Kannattaa myös muistaa, että kaksi annotoijaa ei juuri koskaan päädy
täysin samaan foneettiseen transkriptioon, ja päätös symbolin valinnasta
pitäisikin tehdä kohtalaisen nopeasti ja turhia miettimättä. Johdonmukainen
transkriptiotaito kehittyy vain harjoittelemalla.

Kuulonvaraisesti suunnilleen samaa äännelaatua voidaan usein kuvata
kahdella tai useammalla tavalla yhdistelemällä eri perussymboleja
ja tarkkeita. Näin on erityisesti vokaalien kohdalla. Kun pyritään
mahdollisimman foneettiseen annotaatioon, ei periaatteessa ole merkitystä
sillä, mikä perussymboli valitaan ja paljonko tarkkeita joudutaan
käyttämään, kunhan lopputuloksen kaikkien merkkien yhdistelmä suunnilleen
vastaa äänteen havaittua artikulatorista laatua. Sen sijaan foneemisessa
annotaatiossa joudutaan tekemään tulkinta siitä, mikä on ollut kyseistä
äännettä vastaava foneeminen muoto: tällöin on perusmerkiksi valittava
se symboli, joka lähinnä vastaa alkuperäistä foneemia. On huomattava,
että foneeminen annotaatio on siis riippuvainen annotoijan lingvistisestä
näkemyksestä. Toisaalta useimmat automaattiset segmentointityökalut
perustuvat foneemiseen annotaatioon, jossa esimerkiksi ortografisesta
litteraatiosta muutamalla säännöllä johdettu foneemijono ''pakotetaan''
sopimaan äänisignaaliin. Automaattinen segmentteri ei siis yleensä
sopeudu puheen foneettisiin erikoisuuksiin, jotka on siksi käsin tarkistettava.


\section{\label{sec:Worldbet-symbolit}Worldbet-symbolit}


\subsection{Vokaalimerkit}

%
\begin{figure}
\begin{center}\includegraphics[%
  width=17cm]{/home/lennes/annotation_guide/jpgfigs/vowels.jpg}\end{center}


\caption{Vokaalimerkit IPA-aakkoston (kunkin laatikon yläreuna) ja sitä vastaavan
ASCII-muotoisen Worldbet-aakkoston (alareuna) mukaan.}
\end{figure}


\subsection{Konsonanttimerkit}

\begin{landscape}%
\begin{figure}
\begin{center}\includegraphics[%
  width=21cm]{/home/lennes/annotation_guide/jpgfigs/consonants.jpg}\end{center}


\caption{Konsonanttimerkit IPA-aakkoston (kunkin ruudun vasen yläkulma) ja
sitä vastaavan ASCII-muotoisen Worldbet-aakkoston (oikea alakulma)
mukaan.}
\end{figure}
\end{landscape}


\subsection{Tarkkeet eli diakriitit}

%
\begin{figure}
\begin{center}\includegraphics[%
  width=13cm]{/home/lennes/annotation_guide/jpgfigs/diacritics.jpg}\end{center}


\caption{Tarkemerkit\index{tarkemerkki} eli diakriitit\index{diakriitti}
IPA-aakkoston (kunkin ruudun vasen yläkulma) ja sitä vastaavan ASCII-muotoisen
Worldbet-aakkoston (oikea alakulma) mukaan. Tarkemerkeillä kuvataan
tietyn äänteen lisäpiirteitä.}
\end{figure}


\chapter{\label{cha:Keskustelunanalyysin-litterointimerkit}Keskustelunanalyysin
litterointimerkit}


\section{Litteraatin muuntaminen monikerroksiseksi annotaatioksi}

Keskustelunanalyysin litterointikäytänteiden mukainen litteraatti
voidaan muuntaa esimerkiksi Praatilla tai Puh-editorilla monikerrokseksi
annotaatioksi, joka noudattaa tässä oppaassa kuvattuja annotaatioyksiköitä
ja -periaatteita. Kuvassa \ref{cap:KA-litteraattiesimerkki} on esimerkki
\linebreak keskustelunanalyyttisesta litteraatista. Taulukossa \ref{cap:KA-litterointimerkit}
on lueteltu yleisimpiä keskustelunanalyytikkojen käyttämiä litterointimerkintöjä
ja kuvattu, mihin tässä oppaassa kuvattuihin annotaatiokerroksiin
tai -piirteisiin kukin merkintätapa viittaa.%
\footnote{Esim. \emph{Isossa suomen kieliopissa} \citep[s. 12--13]{ISK} lausumanloppuinen
intonaatio jaetaan kolmia: laskevan intonaation merkkinä on piste
(.), tasaisen intonaation pilkku (,) ja nousevan kysymysmerkki (?). %
}

%
\begin{figure}
\begin{center}\includegraphics[%
  width=150mm,
  keepaspectratio]{/home/lennes/annotation_guide/jpgfigs/KA-litteraatti.jpg}\end{center}


\caption{\label{cap:KA-litteraattiesimerkki}. Esimerkki keskustelunanalyyttisesta
litteraatista. Näyte on Helsingin yliopiston suomen kielen laitoksen
keskustelunanalyysin arkistosta, signum 98.}
\end{figure}


%
\begin{table*}[p]

\caption{\label{cap:KA-litterointimerkit}Yleisimpiä keskustelunanalyyttisissa
tutkimuksissa käytettyjä litterointimerkkejä. Tämän merkistön on kehittänyt
Gail Jefferson ja merkit on otettu tähän Hakulisen teoksesta \citep{Hakulinen96}.
Taulukossa kuvataan, mihin annotaatiokerrokseen kutakin litterointimerkkiä
vastaava ilmiö tulisi annotoida.}

\begin{longtable}{|p{18mm}|p{8cm}||>{\raggedright}p{5cm}|}
\hline 
\textbf{Merkintä (ks.\citealp{Hakulinen96})}&
\textbf{Kuvaus}&
\textbf{Ehdotettu annotaatiokerros}\tabularnewline
\hline 
\texttt{.}&
laskeva intonaatio&
\emph{ProsodicUtterance}\tabularnewline
\hline 
&
(ei merkkiä) intonaatio tasainen&
\emph{ProsodicUtterance}\tabularnewline
\hline 
\texttt{,}&
intonaatio laskee hieman&
\emph{ProsodicUtterance}\tabularnewline
\hline 
\texttt{?}&
intonaatio nousee&
\emph{ProsodicUtterance}\tabularnewline
\hline 
&
seuraava sana lausuttu ympäristöä matalammalta&
\emph{ChangeInPitch: directionOfPitchChange=lower}\tabularnewline
\hline 
&
seuraava sana lausuttu ympäristöä korkeammalta&
\emph{ChangeInPitch: directionOfPitchChange=higher}\tabularnewline
\hline 
\texttt{\underbar{ä}}\texttt{lä}&
äänteen tai tavun painotus sanan sisällä&
\emph{Prominence}\tabularnewline
\hline 
\texttt{>joo<}&
nopeutettu jakso&
\emph{ChangeInTempo}\tabularnewline
\hline 
\texttt{<joo>}&
hidastettu jakso&
\emph{ChangeInTempo}\tabularnewline
\hline 
\texttt{°joo°}&
ympäristöä vaimeampaa puhetta&
\emph{ChangeInLoudness}\tabularnewline
\hline 
\texttt{JOO}&
kovaäänistä puhetta&
\emph{ChangeInLoudness}\tabularnewline
\hline 
\texttt{jo-}&
kesken jäänyt sana&
\emph{Word}, \emph{PhoneticUtterance}, \emph{ProsodicUtterance} \tabularnewline
\hline 
\texttt{jo::}&
venytetty äänne&
\emph{ChangeInTempo}\tabularnewline
\hline 
\texttt{j$^{\textrm{oo}}$}&
lyhentynyt äänne&
\emph{ChangeInTempo}\tabularnewline
\hline 
\texttt{\textbf{t}}\texttt{ule}&
voimakkaasti äännetty konsonantti&
\emph{ChangeInLoudness}\tabularnewline
\hline 
\texttt{.hhh}&
sisäänhengitys&
\emph{Breathing}\tabularnewline
\hline 
\texttt{hhh}&
uloshengitys&
\emph{Breathing}\tabularnewline
\hline 
\texttt{.joo}&
sana lausuttu sisäänhengittäen&
\emph{Breathing}\tabularnewline
\hline 
\texttt{\#joo\#}&
nariseva ääni&
\emph{CreakyVoice}\tabularnewline
\hline 
\texttt{@joo@}&
ääntä muunneltu, esim. referoinnissa&
\emph{ChangeInTone}\tabularnewline
\hline 
\texttt{\$joo\$, \textsterling{}joo\textsterling{}}&
nauruinen ääni&
\emph{Smile}\tabularnewline
\hline 
\texttt{jo(h)o}&
sana tuotettu nauraen&
\emph{Laughter}\tabularnewline
\hline 
\texttt{hehe}&
naurua&
\emph{Laughter}\tabularnewline
\hline 
\texttt{{[}}&
päällekkäispuhunnan alku&
implisiittinen (\emph{Turn})\tabularnewline
\newpage
\hline 
\texttt{{]}}&
päällekkäispuhunnan loppu&
implisiittinen (\emph{Turn})\tabularnewline
\hline 
\texttt{=}&
kaksi eri puhunnosta liittyy toisiinsa tauotta&
implisiittinen (\emph{Turn})\tabularnewline
\hline 
\texttt{(0.7)}&
tauko ja sen pituus&
\emph{Pause}\tabularnewline
\hline 
\texttt{(.)}&
mikrotauko (alle 0.2 sek)&
\emph{Pause}\tabularnewline
\hline 
\texttt{(jo)}&
epävarmasti kuultu jakso&
(nimike)\tabularnewline
\hline 
\texttt{(- -)}&
jakso, josta ei ole saatu selvää&
(- nimike -)\tabularnewline
\hline 
\texttt{(( ))}&
litteroijan kommentteja&
yksikön \emph{comment}-attribuutti\tabularnewline
\hline
\end{longtable}
\end{table*}


Kuvassa \ref{cap:CA-puh-editori} näkyy Puh-editorilla tehty nimikointi,
jossa kuvan \ref{cap:KA-litteraattiesimerkki} litteraatti on muunnettu
vastaaviksi annotaatiokerroksiksi. Kuvassa \ref{cap:CA-Praat} on
puolestaan Praat-ohjelman vastaava näkymä. Näiden nimikointien lähtökohdaksi
on otettu nimenomaan em. litteraatti. Tämän vuoksi keskustelusta on
nimikoitu vain ne kielen ilmiöt, jotka litteraatista käyvät ilmi (vuorot,
lausumat, lausumanloppuinen intonaatio, prominenssi, temponmuutokset
ja äänteiden pidennykset, narina, hengitys ja erilaiset paralingvistiset
ilmiöt). Nimikointikerroksia voisi Puh-editorissa ja Praatissa olla
enemmänkin (vrt. tämän oppaan osassa \ref{par:Annotaatioyksikot}
kuvatut annotointiyksiköt). Tarvittaessa eri kerrosten nimikointeja
voidaan tietenkin tarkastella myös yksittäin.

Joidenkin keskustelunanalyyttisissa litteraateissa käytettyjen yksiköiden
ajallisen vaikutusalan hahmottaminen voi Praatissa ja Puh-editorissa
olla hankalaa, kun aineiston annotointi aloitetaan litteraatin avulla.
Tämä johtuu siitä, että tutkittavasta aineistosta ei ole nimikoitu
sanoja eikä äänteitä, joiden rajojen kanssa esim. prominenssin tai
temponmuutoksen rajat voidaan tarpeen tullen kohdentaa. Alkuperäistä
äänimateriaalia kuuntelemalla rajauksia voidaan kuitenkin tarkentaa.

Toistaiseksi litteraatin siirtäminen ja erilaisten siihen merkittyjen
ilmiöiden erottaminen omiin annotaatiokerroksiinsa on tehtävä käsin.
Kehitteillä on automaattinen muunnostyökalu.

\begin{landscape}

%
\begin{figure}
\begin{center}\includegraphics[%
  width=200mm,
  keepaspectratio]{/home/lennes/annotation_guide/jpgfigs/CA-puh-editori.jpg}\end{center}


\caption{\label{cap:CA-puh-editori}Puh-editorilla tehty esimerkkinimikointi,
jossa keskustelunanalyysin käytänteiden mukainen keskustelunäytteen
litteraatti on muunnettu tämän oppaan mukaisiksi annotaatiokerroksiksi.}
\end{figure}


\end{landscape}

\begin{landscape}

%
\begin{figure}
\begin{center}\includegraphics[%
  width=200mm,
  keepaspectratio]{/home/lennes/annotation_guide/jpgfigs/CA-praat.jpg}\end{center}


\caption{\label{cap:CA-Praat}Praat-ohjelmalla tehty esimerkkinimikointi,
jossa keskustelunanalyysin käytänteiden mukainen keskustelunäytteen
litteraatti on muunnettu tämän oppaan mukaisiksi annotaatiokerroksiksi.}
\end{figure}


\end{landscape}


\chapter{\label{cha:Aanteiden-segmentointiesimerkkeja}Äänteiden segmentointiesimerkkejä}

Usein äänteiden välisen rajan paikka on jonkinasteinen kompromissi.
Tämän liitteen kuvissa on esimerkkejä siitä, kuinka kahden äänteen
välinen raja kannattaa yleensä sijoittaa.%
\footnote{Äänteiden segmentointikriteerejä on samaan tapaan kuvannut myös esim.
Martti Vainio \citep[ss. 83--93]{Vainio01}.%
} Esimerkeissä ja niiden selityksissä on käytetty Worldbet-aakkostoa
(ks. \ref{sec:Worldbet-symbolit}).


\section{Konsonantit}


\subsection{\label{sub:Klusiilit}Klusiilit}

Soinnittomat klusiilit on yleensä helppo tunnistaa lähes täysin hiljaisesta
vaiheesta, jota seuraa yleensä lyhyt hälypurske. Nämä erottuvat sekä
äänen aaltomuodossa että spektrogrammissa. 

Soinnillisissa klusiileissa äänen amplitudi heikkenee klusiilin ajaksi.
Hälypurske on toisinaan hankala löytää, ja sitä kannattaa yleensä
etsiä tarkasti äänen aaltomuodosta. Huomaa, että soinnittoman klusiilinkaan
alussa sointiääni ei pääty täsmällisesti vaan saattaa jatkua hieman
klusiilisegmentin puolelle. 

Klusiilin alku merkitään kohtaan, jossa edeltävän vokaalin tms. soinnillisen
äänteen formanttirakenne päättyy ja aaltomuoto muuttuu korkeiden taajuuksien
vaimenemisen vuoksi ''pyöristetyksi''. Klusiilin loppuraja on kuulonvaraisesti
määritettävä kohta heti laukeaman eli hälypurskeen jälkeen. Loppuraja
merkitään siihen, missä klusiilin tarkka artikulaatiopaikka ei enää
erotu; kuitenkin korkeintaan noin 2\--3 äänihuuliperiodin päähän
laukeamasta.

\emph{Jos soinniton klusiili esiintyy} \textbf{\emph{puhunnoksen alussa}}\emph{,
klusiilisegmentiksi rajataan ainoastaan laukeamavaihe} (ja mahdollisesti
sitä seuraava äänihuuliperiodi tai pari), sillä tässä tapauksessa
on mahdotonta päätellä, missä kohden puhujan klusiiliartikulaatio
on todella alkanut (ks. kuva \ref{fig:Aanneraja-BEGtita}).

Esimerkkejä {[}p{]}:stä kuvissa \ref{fig:Aanteet-puhum}, {[}t{]}:stä
kuvissa \ref{fig:Aanneraja-t-k}, \ref{fig:Aanneraja-sta-2lauk} ja
{[}k{]}:sta kuvissa \ref{fig:Aanneraja-t-k}, \ref{fig:Aanneraja-k-s},
\ref{fig:Aanneraja-N-k}. Esimerkkejä soinnillisesta {[}d{]}:stä on
kuvissa \ref{fig:Aanneraja-nidio} ja \ref{fig:Aanneraja-uude} ja
soinnillisesta {[}b{]}:stä kuvassa \ref{fig:Aanneraja-lebaN}.

%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_BEGtita.jpg}\end{center}


\caption{\label{fig:Aanneraja-BEGtita}Puhunnoksenalkuinen klusiili rajataan
alkavaksi laukeamahälyn alusta, sillä yleensä tässä tilanteessa ei
ole mitään keinoa todeta, missä kohtaa puhujan klusiiliartikulaatio
(eli klusiilin sulkeumavaihe) on todella alkanut. }
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_tk.jpg}\end{center}


\caption{\label{fig:Aanneraja-t-k}Äänneraja {[}t k{]} sanassa \emph{tutkimukselle}.}
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_asta.jpg}\end{center}


\caption{\label{fig:Aanneraja-sta-2lauk}Äänteet {[}@ s t \&{]} sanassa \emph{sijasta}.
Huomaa, että klusiilien (tässä {[}t{]}) laukeaman yhteydessä saattaa
toisinaan esiintyä useita artikulaatioliikkeen aiheuttamia hälypiikkejä
tai maiskahduksia. Kyseessä on kuitenkin vain yksi äännesegmentti.}
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_ks.jpg}\end{center}


\caption{\label{fig:Aanneraja-k-s}Äänneraja {[}k s{]} sanassa \emph{siksi}.}
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_nidio.jpg}\end{center}


\caption{\label{fig:Aanneraja-nidio}{[}d{]}-äänteen rajaaminen sanassa \emph{titaanidioksidin}.
Huolellisesti äännetyssä {[}d{]}:ssä sointi eli periodinen rakenne
jatkuu koko äännesegmentin ajan, ja äänteen loppuvaiheessa esiintyy
pieni hälypurske.}
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_muude.jpg}\end{center}


\caption{\label{fig:Aanneraja-uude}Vokaalienvälinen {[}d\_({]} sanassa \emph{koskemattomuuden}.
Vokaalien välissä esiintyy suomessa usein puhtaan {[}d{]}-klusiilin
sijaan napausäänne, jota merkitään Worldbet-tarkkeella {[}\_({]}.
Huomaa, että tämä äänne ei merkittävästi eroa yksitäryisestä {[}r\_({]}:stä.}
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_lebaN.jpg}\end{center}


\caption{\label{fig:Aanneraja-lebaN}{[}b{]}:n rajaaminen sanassa \emph{bangladeshille}.
Huolellisesti äännetyssä {[}b{]}:ssä sointi eli periodinen rakenne
jatkuu koko äännesegmentin ajan, ja äänteen loppuvaiheessa esiintyy
pieni hälypurske.}
\end{figure}


\subsection{\label{sub:Frikatiivit}Frikatiivit}

Frikatiiviäänteiden rajauksessa ensisijaisena kriteerinä käytetään
frikatiivihälyä, joka yleensä erottuu selvästi sekä aaltomuodossa
että spektrogrammissa. Lisäksi apuna käytetään kuuntelua \--- raja
merkitään siten, että esimerkiksi frikatiivin tarkka artikulaatiopaikka
ei kuulonvaraisesti erotu viereisessä äänteessä.

{[}s{]}-äänteessä frikaatiohäly näkyy selvästi tummana spektrogrammin
ylälaidassa (ks. kuvat \ref{fig:Aanneraja-u-s}, \ref{fig:Aanneraja-k-s},
\ref{fig:Aanneraja-sta-2lauk}). {[}z{]}:ssä mukana on lisäksi sointia
(myös suomessa {[}z{]} esiintyy usein vokaalien tai muiden soinnillisten
äänteiden välissä, ks. esim. kuva \ref{fig:Aanteet-yzy}). {[}f{]}:ssä
häly on vaimeampaa ja matalammilla taajuuksilla. 

{[}h{]}-frikatiivi on sikäli erikoinen äänne, ettei sillä suomessa
ole yhtä tiettyä artikulaatiopaikkaa, vaan {[}h{]}:n viereiset vokaalit
vaikuttavat voimakkaasti sen artikulaatioon ja väriin (ks. esim. kuvat
\ref{fig:Aanteet-thyv} ja\ref{fig:Aanteet-puhum}). {[}h{]} onkin
suomessa usein jonkinlainen ''soinniton vokaali'', ja vokaalien
välissä esiintyessään se erottuu naapureistaan lähinnä vain henkäyssoinnillisen
äänenlaatunsa perusteella. Kokonaan soinnillinen {[}h{]} merkitään
{[}hv{]}.

Huomaa, että suomen /v/ on tavallisesti pikemminkin approksimantti
{[}V{]} kuin ''tiukka frikatiivi'' {[}v{]}. Jos käytät merkintää
{[}v{]}, pitäisi äänteessä siis olla mukana jonkinlaista frikaatiohälyä.
Esimerkki kummastakin tapauksesta näkyy kuvassa \ref{fig:Aanteet-vauvaa}.

Frikatiivien kummallakin puolella esiintyy artikulatorisista syistä
usein soinnin heikentymistä (henkäyssointia) tai soinnittomuutta.
Tämän ilmiön vaikutusalue ei välttämättä kuulu frikatiivisegmentin
sisälle.

%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_us.jpg}\end{center}


\caption{\label{fig:Aanneraja-u-s}Äänneraja {[}u s{]} sanassa \emph{perusteita}.}
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_yzym.jpg}\end{center}


\caption{\label{fig:Aanteet-yzy}Äänteet {[}y z y{]} sanassa \emph{kysymysten}.
Vokaalien välissä esiintyy usein soinnillinen {[}z{]} soinnittoman
{[}s{]}:n sijasta. Aaltomuodossa näkyy silloin periodisuutta koko
konsonantin ajan, ja spektrogrammin alaosassa on vastaavasti tumma
kaistale. Ero on myös kuultavissa.}
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_thyv.jpg}\end{center}


\caption{\label{fig:Aanteet-thyv}Vain loppuosastaan soinnillinen {[}h{]}
sanassa \emph{hyvällä}. Edeltävä äänne on soinniton klusiili {[}t{]},
jonka laukeamahälyn jälkeen {[}h{]}:n alkuraja on sijoitettu.}
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_puhum.jpg}\end{center}


\caption{\label{fig:Aanteet-puhum}Äänteet {[}u hv u{]} sanassa \emph{puhumiseen}.
Vokaalien välissä esiintyy usein soinnillinen {[}hv{]} soinnittoman
{[}h{]}:n sijasta. Aaltomuodossa näkyy silloin periodisuutta koko
konsonantin ajan, ja spektrogrammin alaosassa on vastaavasti tumma
kaistale. Ero on myös kuultavissa.}
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_vauvaa.jpg}\end{center}


\caption{\label{fig:Aanteet-vauvaa}Frikatiivi {[}v{]}:n ja approksimantti
{[}V{]}:n esiintymät sanassa \emph{koeputkivauvaa}. Frikatiivin loppuvaiheessa
esiintyy hieman korkeataajuista hälyä, ja tämä äänne myös kuulostaa
''kireämmin'' äännetyltä kuin jälkimmäinen, vokaalimaisempi {[}V{]}.
Kumpikin äänne rajataan kuulonvaraisesti ja spektrogrammin sekä intensiteettikäyrän
perusteella. Äänteisiin liittyy intensiteetin selvä lasku.}
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_BEGvan.jpg}\end{center}


\caption{\label{fig:Aanteet-BEGvan}Puhunnoksen alussa frikatiivi {[}v{]}:n
taikka muiden soinnillisten äänteiden alku merkitään kohtaan, jossa
aaltomuodossa näkyvä ensimmäinen periodi alkaa ja jossa aaltomuotokäyrä
nousee ylöspäin ja ylittää nollakohdan.}
\end{figure}


\subsection{\label{sub:Likvidat}Likvidat}

Suomenkielisessä puheessa esiintyvät yleensä alveolaarinen {[}l{]}
tai velaarinen {[}L{]}. Likvidoiden rajaaminen on joskus hyvin vaikeaa,
sillä ne muistuttavat paljon vokaaleja eivätkä erotu spektrogrammissa
viereisestä vokaalista juuri muuten kuin formanttisiirtyminä. Likvidan
rajaaminen tapahtuukin kuulonvaraisesti ja spektrogrammissa näkyviä
formanttien liikkeitä tarkastelemalla. Esimerkkejä {[}l{]}-segmenteistä
on kuvissa \ref{fig:Aanneraja-ole}, \ref{fig:Aanneraja-n-l} ja \ref{fig:Aanneraja-elle}.

%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_oleell.jpg}\end{center}


\caption{\label{fig:Aanneraja-ole}Vokaalienvälinen {[}l{]} sanassa \emph{oleellisten}.
{[}l{]}:n rajat erottuvat lähinnä tutkimalla spektrogrammissa näkyvää
formanttirakennetta ja kuuntelemalla. Jälkimmäinen {[}l{]} on tässä
merkitty palataalistuneeksi, mikä johtuu seuraavasta {[}i{]}-vokaalista.}
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_VlV.jpg}\end{center}


\caption{\label{fig:Aanneraja-elle}Vokaalienvälinen {[}l{]} sanassa \emph{tutkimukselle}.
Huomaa, että äännekerrokseen ei merkitä konsonantin fonologista pituusastetta!
Tässä on teoriassa kyse pitkästä konsonantista eli geminaatasta, mutta
äännekerroksen annotaatiossa käytetään vain äänteen foneettista merkkiä.
Nimikoidun segmentin fyysinen kesto taas voidaan mitata, eikä sitä
tarvitse erikseen merkitä nimikkeeseen. Kuvasta näkyy, että kyseisen
sananmuodon kannalta fonologisesti lyhyt {[}s{]} on kuitenkin kestoltaan
suunnilleen yhtä pitkä kuin fonologisesti pitkä {[}l{]}.}
\end{figure}


\subsection{\label{sub:Nasaalit}Nasaalit}

Nasaalikonsonantit näkyvät spektrogrammissa vaimeampina soinnillisina
alueina, joiden formanttirakenne ei erotu selvästi. Nasaalisuus leviää
tyypillisesti viereisiin äännesegmentteihin, sillä nenäportin avaaminen
ja sulkeminen ovat artikulaatioliikkeinä suhteellisen hitaita. Nasaalikonsonantin
rajat merkitään kuitenkin siten, että konsonantti alkaa sillä hetkellä
kun puhujan suuhun muodostuu täydellinen sulkeuma ja päättyy, kun
sulkeuma avataan. Sulkeuman alku ja loppu erottuvat yleensä äänen
aaltomuodossa ja/tai spektrogrammissa. Sulkeuman aikana aaltomuoto
pehmenee tai ''pyöristyy'' korkeiden taajuuksien vaimenemisen vuoksi.

Nasaalikonsonantin artikulaatiopaikkaa on usein vaikea tunnistaa oikein
kuuntelemalla muutaman segmentin pätkää, joten on tärkeää kuunnella
myös koko sanaa ja muuta kontekstia.

Esimerkki {[}m{]}:stä kuvassa \ref{fig:Aanneraja-m-i}, {[}n{]}:stä
kuvassa \ref{fig:Aanneraja-n-l} sekä {[}N{]}:stä kuvassa\ref{fig:Aanneraja-N-k}.

%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_nl_wclicks.jpg}\end{center}


\caption{\label{fig:Aanneraja-n-l}Äänneraja {[}n l{]} sanassa \emph{minkäänlaisia}.
Konsonanttien keskellä erottuu sekä aaltomuodossa että spektrogrammissa
pari pientä hälypursketta, jotka ovat aiheutuneet kielen tahattomista
maiskahduksista artikulaatioliikkeen aikana. }
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_mi.jpg}\end{center}


\caption{\label{fig:Aanneraja-m-i}Äänneraja {[}m i{]} sanassa \emph{minkäänlaisia}.}
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_Nk.jpg}\end{center}


\caption{\label{fig:Aanneraja-N-k}Äänneraja {[}N k{]} sanassa \emph{minkäänlaisia}.}
\end{figure}


\subsection{\label{sub:Tremulantit}Tremulantit}

Suomessa esiintyy tremulanteista lähinnä {[}r{]}. Tremulantteihin
liittyy useita perättäisiä sulkeumia ja avaumia, jotka {[}r{]}:n tapauksessa
tuotetaan kielen kärjellä. Monimutkaiseen artikulaatioon liittyy kielen
asento, joka aiheuttaa äänteeseen ''r-mäisen'' eli retrofleksisen
vaikutelman. {[}r{]}-äänne merkitään alkavaksi siitä kohdasta, jossa
tämä retrofleksisyys alkaa, ja päättyväksi siihen kohtaan, jossa ''r-mäisyys''
suunnilleen päättyy. Rajaamisen apuna käytetään kuulohavainnon lisäksi
spektrogrammia, jossa näkyvät formanttirakenteen muutokset ja vaimentuminen
auttavat rajan määrityksessä (ks. esim. kuva \ref{fig:Aanneraja-arvoa}).
Varsinkin vokaalien välissä lyhyt /r/ esiintyy yleensä yksitäryisenä
ns. napausäänteenä {[}r\_({]} eikä monitäryisenä tremulanttina {[}r{]}
(ks. esim. kuva \ref{fig:Aanneraja-VrV}).

%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_arvoa.jpg}\end{center}


\caption{\label{fig:Aanneraja-arvoa}Äänteen {[}r{]} rajaus sanassa \emph{arvoa}.
Huomaa, että {[}r{]}:n sisällä on useita vaiheita: tässä tapauksessa
kaksi sulkeumaa. Kielen asennon muuttuminen retrofleksiseksi erottuu
formanttirakenteessa.}
\end{figure}


%
\begin{figure}[h]
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_r_btw_vowels.jpg}\end{center}


\caption{\label{fig:Aanneraja-VrV}Vokaalienvälinen {[}r\_({]} sanassa \emph{perusteita}.
Vokaalien välissä esiintyy usein monitäryisen tremulantin sijaan yksitäryinen
napausäänne, jota merkitään Worldbet-tarkkeella {[}\_({]}. Vastaava
äänne voi esiintyä myös vokaalienvälisen {[}d{]}:n tilalla, ks. kuva
\ref{fig:Aanneraja-uude}.}
\end{figure}


\subsection{\label{sub:Approksimantit-eli-puolivokaalit}Approksimantit eli puolivokaalit}

Approksimanteille (toiselta nimeltään puolivokaaleille) on tyypillistä
vokaalimainen artikulaatio, jonka aikana tapahtuva artikulaatioliike
on kuitenkin äänteen hallitseva ominaisuus. Suomenkielisessä puheessa
esiintyvät yleisimmin approksimantti {[}j{]} sekä labiodentaalinen
approksimantti {[}V{]}, jota on kuvattu kohdassa \ref{sub:Frikatiivit},
ja lateraaliapproksimantti {[}l{]}, jota on kuvattu kohdassa \ref{sub:Likvidat}.

Varsinaista hälyä tai laukeamavaihetta ei approksimantteihin kuulu.
Tämän vuoksi approksimanttien segmentointi tapahtuu spektrogrammin
formanttirakenteen ja mahdollisesti intensiteettikäyrän perusteella,
koska äänteen aikana luotava vähäinen kapeikko saattaa aiheuttaa äänisignaalissa
lievän intensiteetin laskun. Usein approksimantti on vastaavan vokaalin
kanssa akustisesti identtinen. Approksimantti kannattaakin yrittää
segmentoida silloin, kun se on oman kielitajun perusteella oletettavissa
(esim. \emph{ja}-sana kannattaa mieluummin segmentoida {[}j A{]} kuin
diftongina {[}i a{]}, vaikkei näillä olekaan artikulatorisesti juuri
mitään eroa). Esimerkki {[}j{]}-äänteestä on kuvassa \ref{fig:Aanneraja-sijas}.

%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_sijas.jpg}\end{center}


\caption{\label{fig:Aanneraja-sijas}Vokaalienvälinen approksimantti {[}j{]}
sanassa \emph{sijasta}. {[}j{]} erottuu viereisistä äänteistä lähinnä
formanttien jatkuvana liikkeenä.}
\end{figure}


\section{Vokaalit}


\subsection{\label{sub:Yksittaisvokaalien-segmentointi}Yksinäisvokaalit eli
monoftongit}

Puhunnoksenalkuinen vokaalisegmentti merkitään alkavaksi ensimmäisen
äänihuuliperiodin alusta. Spektrogrammissa nähdään formanttirakenteen
vähitellen ilmaantuvan samassa kohdassa. Puhunnoksenalkuisen vokaalin
edessä voi esiintyä myös \emph{glottaaliklusiili} tai sen heikompi
muoto, ns. \emph{puristussupistuma} tai \emph{kova aluke}. Selvästi
erottuva glottaaliklusiili merkitään omaksi äännesegmentikseen (ks.
kuva \ref{fig:Aanneraja-BEGasi}). 

Mikäli soinnin edellä tai tilalla on soinniton vaihe, josta vokaalin
laatu on kuultavissa (kuiskattu vokaali), merkitään alkuraja tämän
soinnittoman vaiheen alkuun. Frikatiivien, etenkin {[}s{]}:n vieressä
on myös tyypillistä, että vokaalin alussa tai lopussa on soinniton
tai heikosti soinnillinen vaihe, jossa konsonanttisegmentin varsinaista
frikaatiohälyä ei kuitenkaan kuulu. 

Vokaalin loppuraja merkitään kohtaan, jossa kyseiselle vokaalille
tyypillinen formanttirakenne päättyy tai muuttuu epäselväksi spektrogrammissa
(ks. etenkin ylemmät taajuudet, esim. formanttien F3, F4 ja F5 seutu),
sekä kuulonvaraisin perustein. Huomaa, että vokaalisegmentin päättyminen
ei välttämättä edellytä soinnin ts. periodisuuden päättymistä.

Vokaalin vieressä tai vokaalien välissä esiintyvä soinnillinen {[}hv{]}
on usein vaikea rajata. Se erottuu vokaalista siten, että kun {[}hv{]}-äänne
alkaa, nähdään aaltomuodossa amplitudin heikkenevän ja spektrogrammissa
etenkin ylempien taajuuksien formanttirakenteen muuttuvan epäsäännölliseksi.
Vastaavasti formanttirakenne selkiytyy ja amplitudi nousee {[}hv{]}:n
päättyessä. Esimerkki {[}hv{]}:n rajauksesta on kuvassa \ref{fig:Aanteet-puhum}.

%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_BEGasi.jpg}\end{center}


\caption{\label{fig:Aanneraja-BEGasi}Puhunnoksenalkuisen vokaalin edessä
saattaa esiintyä glottaaliklusiili {[}?{]}, joka rajataan omaksi segmentikseen.
}
\end{figure}


\subsection{\label{sub:Diftongien-segmentointi}Diftongien segmentointi}

Käytännössä \emph{diftongin} (kaksi peräkkäistä, laadullisesti erilaista
tavunsisäistä vokaalia) ja \emph{vokaaliyhtymän} (peräkkäiset vokaalit,
joiden välissä on tavuraja) välillä ei useinkaan ole selvää foneettista
eroa. Siksi myös diftongin osat on syytä segmentoida erikseen äännekerrokseen,
vaikka niiden erottaminen toisistaan onkin hankalaa. Vokaalien välinen
raja sijoitetaan niiden välisen auditiivisen ja akustisen muutoksen
keskikohtaan (ks. esim. \ref{fig:Aanneraja-loukk} ja \ref{fig:Aanteet-vauvaa}).
Akustisesti raja voidaan usein helpoiten paikallistaa spektrogrammissa
näkyvien formanttisiirtymien, erityisesti F2:n liikkeen puoliväliin.%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_miaeis.jpg}\end{center}


\caption{\label{fig:Aanneraja-miaeis}Vokaalijono {[}i @ e{]} sanassa \emph{helmiäistä}.
Vokaalijonon osat on rajattava pitkälti kuulonvaraisesti, ja tulos
on aina kompromissi. Koska sana esiintyy tässä puhunnoksen lopussa,
on puhujan äänenlaatu nariseva koko vokaalijonon ajan, mikä erottuu
esimerkiksi aaltomuodon epäsäännöllisinä periodeina.}
\end{figure}


%
\begin{figure}
\begin{center}\includegraphics[%
  scale=0.7]{jpgfigs/Phone_loukk.jpg}\end{center}


\caption{\label{fig:Aanneraja-loukk}Diftongi {[}o u{]} erottuu spektrogrammissa
formanttien jatkuvana liikkeenä. Siirtymä on kuitenkin suhteessa hitaampi
kuin approksimanteilla (ks. \ref{sub:Approksimantit-eli-puolivokaalit}).
Diftongin komponenttien (tässä {[}o{]} ja {[}u{]}) välinen raja on
usein pelkkä kompromissi. Raja sijoitetaan formanttien liikkeen puoliväliin
ja kuulonvaraisesti arvioimalla.}
\end{figure}


\bibliographystyle{amsplain}
\cleardoublepage\addcontentsline{toc}{chapter}{\bibname}\bibliography{/home/lennes/annotation_guide/annotation_guide}


\printindex{}
\end{document}