Delamo na obnovitvi aplikacije Unionpedia v trgovini Google Play
OdhodniDohodne
🌟Poenostavili smo našo zasnovo za boljšo navigacijo!
Instagram Facebook X LinkedIn

Besedilni korpus

Index Besedilni korpus

Besedilni korpusi (oz. v jezikoslovnem strokovnem jeziku tudi zgolj korpusi) so obsežne zbirke besedil v naravnem jeziku, zajete v določenem obdobju iz množičnih medijev (časopisnega in revijalnega tiska), knjižne produkcije, stripov, interneta, reklamnih besedil, navodil priloženih izdelkom široke potrošnje, prepisov parlamentarnih razprav ipd, shranjene v strukturirani obliki običajno na digitalnih medijih in s pomočjo jezikovnih tehnologij pogosto opremljene z označbami.

Kazalo

  1. 14 odnosi: Besedilo, FidaPLUS, Jezikoslovje, Jezikovne tehnologije, Lema, Nova beseda, Odprti kop, Prevodoslovje, Radiotelevizija Slovenija, Slovar, Slovenščina, Slovnica, Strojno prevajanje, Tisk.

  2. Korpusno jezikoslovje
  3. Računalniško jezikoslovje

Besedilo

Besedilo je po slovarja slovenskega knjižnega jezika z določenimi besedami izražena misel, vendar vsako besedno sporočilo še ni besedilo.

Poglej Besedilni korpus in Besedilo

FidaPLUS

FidaPLUS je bila referenčna zbirka vsakdanje javne rabe slovenščine v pisnih besedil v obdobju med 1990 do 2006, ki je vsebovala 621 milijonov besed, kar je visoka številka in primerljiva z velikostjo referenčnih korpusov ostalih narodov.

Poglej Besedilni korpus in FidaPLUS

Jezikoslovje

Jezikoslôvje ali lingvístika je znanstvena veda o naravnem človeškem jeziku.

Poglej Besedilni korpus in Jezikoslovje

Jezikovne tehnologije

Jezikovne tehnologije je ime za skupek tehnologij, ki so namenjena samodejnemu procesiranju naravnega jezika (na angleški Wikipediji, in v angleško govorečem svetu na sploh, se namesto izraza "jezikovne tehnologije" pogostje uporablja slednji izraz).

Poglej Besedilni korpus in Jezikovne tehnologije

Lema

V lingvistiki ima lema dve različni interpretaciji.

Poglej Besedilni korpus in Lema

Nova beseda

Nova beseda je besedilni korpus, ki ga vzdržujeta Inštitut za slovenski jezik Frana Ramovša ter ZRC SAZU - Laboratorij za korpus slovenskega jezika.

Poglej Besedilni korpus in Nova beseda

Odprti kop

Odprti kop je bila storitev, ki je uporabnikom omogočala iskanje po besedilih podnapisov oddaj, pripravljenih za potrebe gluhih in naglušnih gledalcev nekaterih oddaj na RTV Slovenija, in sicer tako, da program, iz katerega se je pozneje razvil spletni servis in podjetje Zemanta, sestavi spletno stran oddaje opremljeno z video povezavami in besedilom iz arhiva podnapisov.

Poglej Besedilni korpus in Odprti kop

Prevodoslovje

Prevodoslóvje je znanstvena veda, ki se ukvarja s pisnim ali govornim prenosom pomena besedila iz izvirnega jezika v ciljni jezik ob upoštevanju kultur, v kateri sta jezika vpeta.

Poglej Besedilni korpus in Prevodoslovje

Radiotelevizija Slovenija

Radiotelevizija Slovenija (skrajšano RTV Slovenija) je edina javna, neprofitna radiotelevizijska organizacija v Sloveniji.

Poglej Besedilni korpus in Radiotelevizija Slovenija

Slovar

Slovarji Slovár ali besednják je knjiga, v katerem so abecedno urejene in pojasnjene besede nekega jezika.

Poglej Besedilni korpus in Slovar

Slovenščina

Slovenščina je združeni naziv za uradni knjižni jezik Slovencev in skupno ime za narečja in govore, ki jih govorijo ali so jih nekoč govorili Slovenci.

Poglej Besedilni korpus in Slovenščina

Slovnica

Slovnica (tudi gramatika) je sistem jezikovnih sredstev in njihovih medsebojnih odnosov.

Poglej Besedilni korpus in Slovnica

Strojno prevajanje

Strojno prevajanje (ang. kratica MT) je postopek, pri katerem računalniški program analizira besedilo in brez posredovanja človeka proizvede ciljno besedilo.

Poglej Besedilni korpus in Strojno prevajanje

Tisk

Tiskarski stroj za tisk časopisov thumb Tísk oziroma tískanje je postopek v tiskarstvu, pri katerem gre za mehansko razmnoževanje slik in besedil.

Poglej Besedilni korpus in Tisk

Glej tudi

Korpusno jezikoslovje

Računalniško jezikoslovje

Prav tako znan kot Jezikovni korpus, Korpus (jezikoslovje).