-
Notifications
You must be signed in to change notification settings - Fork 0
/
node11.html
executable file
·273 lines (243 loc) · 12.4 KB
/
node11.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//FI">
<!--Converted with jLaTeX2HTML 2002 (1.62) JA patch-1.4
patched version by: Kenshi Muto, Debian Project.
LaTeX2HTML 2002 (1.62),
original version by: Nikos Drakos, CBLU, University of Leeds
* revised and updated by: Marcus Hennecke, Ross Moore, Herb Swan
* with significant contributions from:
Jens Lippmann, Marek Rouchal, Martin Wilck and others -->
<HTML>
<HEAD>
<TITLE>2.2 Uuden annotaatioyksikön
määritteleminen</TITLE>
<META NAME="description" CONTENT="2.2 Uuden annotaatioyksikön
määritteleminen">
<META NAME="keywords" CONTENT="annotation_guide">
<META NAME="resource-type" CONTENT="document">
<META NAME="distribution" CONTENT="global">
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=utf-8">
<META NAME="Generator" CONTENT="jLaTeX2HTML v2002 JA patch-1.4">
<META HTTP-EQUIV="Content-Style-Type" CONTENT="text/css">
<LINK REL="STYLESHEET" HREF="annotation_guide.css">
<LINK REL="next" HREF="node12.html">
<LINK REL="previous" HREF="node10.html">
<LINK REL="up" HREF="node9.html">
<LINK REL="next" HREF="node12.html">
</HEAD>
<BODY >
<!--Navigation Panel-->
<A NAME="tex2html801"
HREF="node12.html">
<IMG WIDTH="37" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="next" SRC="next.png"></A>
<A NAME="tex2html795"
HREF="node9.html">
<IMG WIDTH="26" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="up" SRC="up.png"></A>
<A NAME="tex2html789"
HREF="node10.html">
<IMG WIDTH="63" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="previous" SRC="prev.png"></A>
<A NAME="tex2html797"
HREF="node1.html">
<IMG WIDTH="65" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="contents" SRC="contents.png"></A>
<A NAME="tex2html799"
HREF="node63.html">
<IMG WIDTH="43" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="index" SRC="index.png"></A>
<BR>
<!--End of Navigation Panel-->
<!--Table of Child-Links-->
<A NAME="CHILD_LINKS"><STRONG>Aliluvut</STRONG></A>
<UL>
<LI><A NAME="tex2html803"
HREF="node11.html#SECTION03121000000000000000">2.2.1 Milloin tarvitaan uusi annotaatiokerros?</A>
<LI><A NAME="tex2html804"
HREF="node11.html#SECTION03122000000000000000">2.2.2 Sama vai eri yksikkö?</A>
<LI><A NAME="tex2html805"
HREF="node11.html#SECTION03123000000000000000">2.2.3 Annotaatioyksikön piirteiden määritteleminen</A>
<UL>
<LI><A NAME="tex2html806"
HREF="node11.html#SECTION03123100000000000000">2.2.3.1 Kaikkien yksiköiden
yhteiset ominaisuudet</A>
</UL></UL>
<!--End of Table of Child-Links-->
<HR>
<H1><A NAME="SECTION03120000000000000000"></A><A NAME="sec:Uuden-annotaatioyksikon-maaritteleminen"></A>
<BR>
2.2 Uuden annotaatioyksikön
määritteleminen
</H1>
<P>
Perusannotaatioyksiköistä voidaan tarvittaessa <I>periyttää<A NAME="168"></A></I>
aliyksiköitä<A NAME="169"></A>, joilla on samat ominaisuudet kuin
emoyksiköllään, mutta sen lisäksi joitakin uusia ominaisuuksia. Tällöin
on huomattava, että <I>uusi aliyksikkö perii välttämättä kaikki
ne ominaisuudet ja piirteet, jotka sen emoyksiköllä on</I>, eikä aliyksikkö
siis saa olla ristiriidassa emoyksikön määritelmän kanssa.<A NAME="tex2html9"
HREF="#foot171"><SUP>2.2</SUP></A> Jotta uusien aliyksiköiden luominen olisi mahdollisimman joustavaa,
on useimpien tämän oppaan yksiköiden kuvauksen tarkka muoto jätetty
annotoijan päätettäväksi.
<P>
Kuvitellaan, että esimerkiksi annotaatioyksikölle <I>MyBasicUnit</I>
on määritelty ominaisuus <I>label</I> (nimike tai tekstikuvaus), jolle
on määritelty tietty joukko mahdollisia arvoja, esimerkiksi ''tyyppi1,
tyyppi2, tyyppi3''. Jos tälle yksikölle määritellään uusi aliyksikkö,
niin myös aliyksiköllä on välttämättä ominaisuus <I>label</I> joka
voi saada (ainakin) samat kolme arvoa. Aliyksikölle voidaan kyllä
lisätä uusia ominaisuuksia mutta ei poistaa perittyjä.
<P>
Sellaisia kokonaan uusia yksiköitä, jotka eivät voi olla minkään aikaisemmin
määritellyn varsinaisen annotaatioyksikön aliyksiköitä, voidaan periyttää
esimerkiksi apuyksiköstä <B>Chunk</B> (<A HREF="node53.html#sec:Chunk-jakso">14</A>),
jolla ei ole etukäteen annettuja ominaisuuksia ja jonka ''perilliset''
voivat siksi kuvata mitä tahansa tallenteen tapahtumaa tai piirrettä.
<P>
<H2><A NAME="SECTION03121000000000000000"></A><A NAME="sub:Milloin-tarvitaan-uusi"></A>
<BR>
2.2.1 Milloin tarvitaan uusi annotaatiokerros?
</H2>
<P>
<I>Periaatteena on, että kaikille sellaisille annotoitaville ilmiöille,
jotka voivat esiintyä tallenteessa päällekkäisinä, tulisi luoda erilliset
annotaatiokerrokset. </I>
<P>
Samassa annotaatiokerroksessa voidaan siis kuvata vain yhdentyyppisiä
taikka useammantyyppisiä mutta toisensa poissulkevia yksiköitä. Esimerkiksi
tietyn puhujan sisään- ja uloshengitykset (ks. <A HREF="node38.html#sub:Breathing-hengitys">7</A>)
kannattaa merkitä omaan kerrokseensa, koska puhuja pystyy periaatteessa
tuottamaan puhetta (ja tekemään kaikenlaista muutakin) sekä sisään-
että uloshengittäessään. Toisaalta sekä sisään- että uloshengitykset
voidaan taloudellisimmin kuvata samassa kerroksessa, koska puhuja
ei voi tehdä molempia yhtä aikaa.
<P>
<H2><A NAME="SECTION03122000000000000000"></A><A NAME="sub:Sama-vai-eri"></A>
<BR>
2.2.2 Sama vai eri yksikkö?
</H2>
<P>
Jos yksiköiden rajat eri annotaatiokerroksissa <I>poikkeuksetta
yhtenevät</I>, kyseessä on saman yksikön kaksi eri piirrettä. Tällöin
toisen annotaatiokerroksen rajaukset ovat redundantteja, ja turhan
lisätyön sekä virheiden välttämiseksi kannattaisi annotaatiokäsitteistöön
määritellä vain yksi yksikkö, jolla on kaksi piirrettä.
<P>
<H2><A NAME="SECTION03123000000000000000"></A><A NAME="sub:piirteiden-maarittely"></A>
<BR>
2.2.3 Annotaatioyksikön piirteiden määritteleminen
</H2>
<P>
Puh-editorissa annotaatioyksiköille voi lisätä haluttuja ominaisuuksia
tai piirteitä, joille voi tarvittaessa määritellä rajatun joukon sallittuja
arvoja. Puh-editorilla voi esimerkiksi lisätä jollekin yksikölle piirteen
''painoaste'' ja luetella tälle vaikkapa arvot ''0,1,2,3'', joilla
haluaa kuvata havaitun painollisuuden määrää. Jos joku jatkossa käyttää
samaa määritelmää, hän voi Puh-editorissa antaa ko. yksiköille ainoastaan
painoasteita nollasta kolmeen. Tämä helpottaa ja yhtenäistää kuvauksen
valintaa. Piirteille voitaisiin yhtä hyvin antaa muuntyyppisiäkin
arvoja, esim. ''painollinen, painoton''. Koska valittujen piirrearvojen
joukko on periaatteessa mielivaltainen ja riippuu käyttäjän tarpeista,
on useimpien piirteiden määrittely jätetty käyttäjien tehtäväksi.
<P>
<H3><A NAME="SECTION03123100000000000000"></A><A NAME="sub:yksikoiden-yhteiset-ominaisuudet"></A>
<BR>
2.2.3.1 Kaikkien yksiköiden
yhteiset ominaisuudet
</H3>
<P>
Kaikilla annotaatioyksiköillä on myös joukko valmiiksi esimääriteltyjä
piirteitä. Annotoija voi tarvittaessa määritellä kullekin yksikölle
erikseen <I><A NAME="yksikon-aanilahde"></A>äänilähteen<A NAME="185"></A></I>
(<I>soundSource</I><A NAME="187"></A>), mikäli esimerkiksi puhuja
vaihtuu keskellä annotaatiokerrosta. Myös kunkin yksikön <I><A NAME="yksikon-kieli"></A>kielen<A NAME="189"></A><A NAME="190"></A></I>
(<I>language</I><A NAME="192"></A>) voi määritellä erikseen, mikäli
halutaan osoittaa, etä puhuja käyttää kesken kaiken vieraskielisiä
sanoja. Äänilähteellä ja kielellä on oletusarvot, jotka on määritelty
kyseisen tallenteen metatiedoissa. Oletusten mukaisia piirrearvoja
ei siis tarvitse erikseen annotoida. Kuhunkin yksikköön voi lisätä
vapaamuotoisen <I><A NAME="yksikon-kommentti"></A>kommentin</I> (<I>comment</I><A NAME="195"></A>),
jossa voi vaikkapa kuvailla yksikön rajaamisessa esiintyneitä vaikeuksia
tai erikseen määrittelemättömiä lisäominaisuuksia. Yksikön <I><A NAME="yksikon-tila"></A>tilaa<A NAME="197"></A></I>
tai <I>työvaihetta<A NAME="198"></A></I> (<I>status</I><A NAME="200"></A>)
voi kuvata jollakin seuraavista piirteistä:
<P>
<BLOCKQUOTE>
0 ei määritelty
</BLOCKQUOTE>
<P>
<BLOCKQUOTE>1 virheellinen<A NAME="202"></A>
</BLOCKQUOTE>
<P>
<BLOCKQUOTE>2 tekeillä (kesken<A NAME="203"></A>)
</BLOCKQUOTE>
<P>
<BLOCKQUOTE>3 OK (valmis, hyväksytty<A NAME="204"></A><A NAME="205"></A>)
</BLOCKQUOTE>
<P>
<BLOCKQUOTE>4 kelluva (ei aikaan sidottu)<A NAME="206"></A>
</BLOCKQUOTE>
<B>Yksikön saa merkitä valmiiksi (status = 3) ainoastaan siinä
tapauksessa, että on itse tarkastanut ja hyväksynyt yksikön kaikkine
nimikkeineen ja todennut, että se noudattaa annotaatioyksikön määritelmässä
ja tässä oppaassa annettuja suosituksia.</B>
<P>
<I><A NAME="Kelluva-yksikko"></A>Kelluva yksikkö</I><A NAME="210"></A>
(<I>floating unit</I><A NAME="212"></A>; status = 4) tarkoittaa
sellaista annotaatioyksikköä, jonka halutaan olevan mukana annotaatiossa,
mutta jolle ei voida määrittää alkamis- ja päättymisaikaa. Kelluvina
yksiköinä voidaan kuvata esimerkiksi erilaisia abstrakteja lingvistisiä
yksiköitä, joille ei nähdä olevan suoraa vastinetta puhesignaalissa.
Samassa annotaatiokerroksessa olevilla kelluvilla yksiköillä on tietty
keskinäinen järjestys, muttei siis esimerkiksi ajallista kestoa.
<P>
Jokaisella yksiköllä on myös ominaisuudet <I>alkupiste</I> ja <I>loppupiste</I>
(vaikka nämä olisivatkin täsmälleen samassa aikapisteessä tai vaikka
yksikkö olisi kelluvassa tilassa). Alku ja loppu tallentuvat yksikön
piirteinä automaattisesti, kun yksikön rajoja siirretään jollakin
annotaatioeditoriohjelmalla. Lisäksi Puh-editori tallentaa jokaiselle
yksikölle automaattisesti <I>luontiajan</I> ja viimeisimmän <I>muokkausajankohdan</I>.
<P>
Mikäli käytät nimikointiin Praat-ohjelmaa, lue ohje piirteiden annotoinnista
Praatilla (<A HREF="node7.html#ite:piirteiden-annotointi-Praatilla">5</A>).
<P>
<BR><HR>
<DL>
<DT><A NAME="foot171">...</A><A
HREF="node11.html#tex2html9"><SUP>2.2</SUP></A></DT>
<DD>Tämä ehto on seurausta yksiköiden määritelmien tallennukseen käytettävästä
standardoidusta RDF-dokumenttiformaatista, joka mahdollistaa määritelmien
perusteella tapahtuvan koneellisen päättelyn. Esimerkiksi Puh-editori
voi RDF-muotoisten määritelmien perusteella valvoa, että annotoija
todella noudattaa määritelmässä mainittuja rajoituksia.
</DD>
</DL><HR>
<!--Navigation Panel-->
<A NAME="tex2html801"
HREF="node12.html">
<IMG WIDTH="37" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="next" SRC="next.png"></A>
<A NAME="tex2html795"
HREF="node9.html">
<IMG WIDTH="26" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="up" SRC="up.png"></A>
<A NAME="tex2html789"
HREF="node10.html">
<IMG WIDTH="63" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="previous" SRC="prev.png"></A>
<A NAME="tex2html797"
HREF="node1.html">
<IMG WIDTH="65" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="contents" SRC="contents.png"></A>
<A NAME="tex2html799"
HREF="node63.html">
<IMG WIDTH="43" HEIGHT="24" ALIGN="BOTTOM" BORDER="0" ALT="index" SRC="index.png"></A>
<BR>
<B> :</B> <A NAME="tex2html802"
HREF="node12.html">2.3 Suositeltava annotointijärjestys</A>
<B> :</B> <A NAME="tex2html796"
HREF="node9.html">2. Kuinka annotaatioyksiköitä käytetään?</A>
<B> :</B> <A NAME="tex2html790"
HREF="node10.html">2.1 Annotaatioyksiköiden käyttö</A>
  <B> <A NAME="tex2html798"
HREF="node1.html">Sisältö</A></B>
  <B> <A NAME="tex2html800"
HREF="node63.html">Hakemisto</A></B>
<!--End of Navigation Panel-->
<ADDRESS>
Mietta Lennes
2005-05-11
</ADDRESS>
</BODY>
</HTML>