Korpus na voljo do konca tedna
Posted by sarolta on 16 May, 2006
Če koga zanima korpus znanstvenih besedil s področja turističnega marketinga, ga lahko do konca tedna najde v wikiju. Potem ga bom zbrisala, da naredim prostor za vaše izdelke. (Pozneje vam ga pošljem po mailu, če želite.)
Gre za zbirko znanstvenih besedil, ki so bila objavljena v eni sami publikaciji v obdobju devetih let. Gre za korpus, ki vsebuje 909.677 pojavnic in 21.823 različnic. Type/Token Ratio znaša 2,40. Avtorske pravice še niso urejene.
Prosim vas pa tole: če ga uporabite, sporočite mi, kako ste ga uporabili in kaj ste ugotovili. Hvala.
May 17th, 2006 at 6:06
Šarolta, hvala - se mi zdi strašno lepo, da si pripravljena deliti z nami orodje, v katerega si vložila toliko svojega dela in truda. Sem ravno razmišljala nekaj časa nazaj (ko sem še mislila, da bo tudi meni v doglednem času uspelo nagrebsti na kup en minikorpus v zvezi z računalništvom), kako lepo bi bilo, če bi bile vse znane, razpoložljive zbirke besedil zbrane na enem kupu - od teh velikih, splošnih korpusov do takšnih manjših, specializiranih. Obstaja kakšna taka spletna stran?
May 17th, 2006 at 7:17
Vsakomur, ki želi zvedeti kaj več o korpusih, ki so na voljo (plačljivo ali brezplačno), svetujem obisk spletne strani Davida Leeja http://devoted.to/corpora. Velja si vzeti čas in pobrskati po njegovih straneh in slediti povezavam. Morebiti konec tedna kaj več o brezplačnih korpusih. Za sedaj pa samo to, da bi bilo res lepo, če bi lahko izmenjevali svoje korpuse, oz. imeli podatke o tem, kdo razpolaga s čim, da lahko osebo kontaktiramo, če bi korpus potrebovali.
Ni ravno veliko korpusov na voljo ravno zato, ker so običajno avtorske pravice neurejene.
Ta korpus nisem čisto sama pripravila. Besedila sem zbrala jaz, spremenila jih tudi iz PDF v tekstovni format, očistila pa jih je moja študentka, ki z njihovo pomočjo piše diplomsko nalogo.
May 18th, 2006 at 9:42
Super stran! Hvala.