Canvis

sense resum d'edició
Llínea 1: Llínea 1:  
Un '''corpus llingüístic''' és un conjunt, normalment molt ampli, d'eixemples reals d'us d'una llengua o d'una varietat llingüística. Estos eixemples que conté un corpus a sovint són texts, pero poden ser també mostres orals (normalment transcrites) o inclús  signades. En funció del format d'este conjunt d'eixemples, existixen corpus escrits, orals i de llengües de signes.
 
Un '''corpus llingüístic''' és un conjunt, normalment molt ampli, d'eixemples reals d'us d'una llengua o d'una varietat llingüística. Estos eixemples que conté un corpus a sovint són texts, pero poden ser també mostres orals (normalment transcrites) o inclús  signades. En funció del format d'este conjunt d'eixemples, existixen corpus escrits, orals i de llengües de signes.
Els corpus textuals són un dels principals recursos per a l'obtenció de senyes empíriques útils per a la disciplina de la llingüística. Es dir que, paralelament al desenroll de les tecnologies de la informació, els corpus electrònics s'han convertit en una ferramenta fonamental per a l'obtenció d'estes senyes, atesa la cantitat d'informació que es pot processar en un programari adequat. Alguns corpus, com ara el Bank of English, contenen fins a 300 millons de mots.
+
Els corpus textuals són un dels principals recursos per a l'obtenció de senyes empíriques útils per a la disciplina de la llingüística. Es dir que, paralelament al desenroll de les tecnologies de l'informació, els corpus electrònics s'han convertit en una ferramenta fonamental per a l'obtenció d'estes senyes, atesa la cantitat d'informació que es pot processar en un programa adequat. Alguns corpus, com ara el Bank of English, contenen fins a 300 millons de mots.
    
Els corpus de referència contenen un gran volum de senyes llingüístiques que permeten obtindre senyes representatives per analisar qualsevol aspecte d'una llengua.
 
Els corpus de referència contenen un gran volum de senyes llingüístiques que permeten obtindre senyes representatives per analisar qualsevol aspecte d'una llengua.
Llínea 11: Llínea 11:     
== Ferramentes informàtiques de processament de corpus llingüístics ==
 
== Ferramentes informàtiques de processament de corpus llingüístics ==
El programa AntConc és una ferramenta de [[programari lliure]] que funciona en [[Windows]] i [[Linux]]. Dispon d'una interfície bastant intuïtiva que en facilita l'us. Entre les seues funcions inclou:
+
El programa AntConc és una ferramenta de [[software lliure]] que funciona en [[Windows]] i [[Linux]]. Dispon d'una interfície bastant intuïtiva que en facilita l'us. Entre les seues funcions inclou:
    
- '''Llista de paraules''': El programa mostra totes les paraules dels archius de corpus carregats ordenades segons el criteri que triem (freqüència, alfabètic, alfabètic invers).
 
- '''Llista de paraules''': El programa mostra totes les paraules dels archius de corpus carregats ordenades segons el criteri que triem (freqüència, alfabètic, alfabètic invers).
Llínea 23: Llínea 23:  
- '''Colocacions''': Nos permet conéixer quina és la freqüència d'aparició de determinades paraules en atres.
 
- '''Colocacions''': Nos permet conéixer quina és la freqüència d'aparició de determinades paraules en atres.
   −
- '''Keyword list''': Nos permet conéixer la representativitat de les paraules d'un corpus respecte d'un atre [[Archiu:Programa_AntConc.png|thumb|302px|Programa AntConc processant la informació des d'un corpus]]
+
- '''Keyword list''': Nos permet conéixer la representativitat de les paraules d'un corpus respecte d'un atre [[Archiu:Programa_AntConc.png|thumb|302px|Programa AntConc processant l'informació des d'un corpus]]
    
==Aplicacions del corpus llingüístic==
 
==Aplicacions del corpus llingüístic==
Llínea 37: Llínea 37:  
* [[Traducció assistida]]
 
* [[Traducció assistida]]
 
* [[Traducció automàtica]]
 
* [[Traducció automàtica]]
 
+
 
 
[[Categoria:Llingüística]]
 
[[Categoria:Llingüística]]
 
[[Categoria:Traducció automàtica]]
 
[[Categoria:Traducció automàtica]]
154 942

edicions