Korpusi in odprta vprašanja 2.
Posted by sdutsj on 14 May, 2006
Tudi sama imam nekaj odprtih vprašanj, ki bi jih rada delila z vami.
Pri shranjevanju sem imela težave z akcenti, vendar mi jih je računalničar pomagal rešiti.
Tule je nasvet vsem tistim, ki boste imeli podobne težave: akcente ohranite pri shranjevanju v .txt datoteko, če pod Encoding izberete Unicode še preden dokument dokončno shranite.
Čez nekaj dni pa sem ugotovila še naslednje: če shraniš dokument kot Unicode, to ne zadošča, da bi ga prepoznal tudi Antconc, ki je bil pravzaprav moje ciljno orodje. Šarolta je imela briljanten napotek, ki me je pripeljal do spremenjene taktike: v Antoncu greš pod Global settings in nastaviš language encodings.
Malo sem se igrala in ugotovila, da je prava pot, da ohraniš francoske akcente naslednja: dokument shraniš kot UTF, potem pa nastaviš v Antconcu language encondings na UTF 16. Verjetno bo potrebno nekaj podobnega narediti tudi, če imate opravka z drugimi akcenti (npr. nemškimi).
Zdaj pa k naslednjemu vprašanju: s katerim vražjim korpusom naj primerjam svoja besedila. Ko bom to ugotovila, se bom lahko lotila vaj za drugi teden. Kje je šele 3 teden?
Mojca J
May 15th, 2006 at 3:30
Hvala ti, Mojca, ker si nam pokazala, da z malo igre in eksperimentiranja tudi takšne težave, kot jih imamo z akcenti, lahko rešimo.
Kar se ostalega tiče, ne skrbi. Sem prepričana, da bodo stvari stekle. Ta čas, ko čakaš na odgovor Veronisa, vzemi katero od besedil in ga poskušaj uporabiti z Vocabulary profilerjem in Hypertext writerjem. En odlomek. Da ugotoviš, kako ohraniti akcente tu. Poskusi zopet z UTFji. Nastavi jezik prvo v svojem brskalniku. Potem zapri brskalnik (za vsak primer) in ga ponovno odpri. Morebiti bo tako delovalo. Držim pesti.
May 15th, 2006 at 7:32
Pa sporoči, kako je šlo. Sem radovedna.