Diferència entre les revisions de "Corpus llingüístic"
Sense resum d'edició |
Text reemplaça - 'la informació' a 'l'informació' |
||
| Llínea 1: | Llínea 1: | ||
Un '''corpus llingüístic''' és un conjunt, normalment molt ampli, d'eixemples reals d'us d'una llengua o d'una varietat llingüística. Estos eixemples que conté un corpus a sovint són texts, pero poden ser també mostres orals (normalment transcrites) o inclús signades. En funció del format d'este conjunt d'eixemples, existixen corpus escrits, orals i de llengües de signes. | Un '''corpus llingüístic''' és un conjunt, normalment molt ampli, d'eixemples reals d'us d'una llengua o d'una varietat llingüística. Estos eixemples que conté un corpus a sovint són texts, pero poden ser també mostres orals (normalment transcrites) o inclús signades. En funció del format d'este conjunt d'eixemples, existixen corpus escrits, orals i de llengües de signes. | ||
Els corpus textuals són un dels principals recursos per a l'obtenció de senyes empíriques útils per a la disciplina de la llingüística. Es dir que, paralelament al desenroll de les tecnologies de | Els corpus textuals són un dels principals recursos per a l'obtenció de senyes empíriques útils per a la disciplina de la llingüística. Es dir que, paralelament al desenroll de les tecnologies de l'informació, els corpus electrònics s'han convertit en una ferramenta fonamental per a l'obtenció d'estes senyes, atesa la cantitat d'informació que es pot processar en un programa adequat. Alguns corpus, com ara el Bank of English, contenen fins a 300 millons de mots. | ||
Els corpus de referència contenen un gran volum de senyes llingüístiques que permeten obtindre senyes representatives per analisar qualsevol aspecte d'una llengua. | Els corpus de referència contenen un gran volum de senyes llingüístiques que permeten obtindre senyes representatives per analisar qualsevol aspecte d'una llengua. | ||
| Llínea 23: | Llínea 23: | ||
- '''Colocacions''': Nos permet conéixer quina és la freqüència d'aparició de determinades paraules en atres. | - '''Colocacions''': Nos permet conéixer quina és la freqüència d'aparició de determinades paraules en atres. | ||
- '''Keyword list''': Nos permet conéixer la representativitat de les paraules d'un corpus respecte d'un atre [[Archiu:Programa_AntConc.png|thumb|302px|Programa AntConc processant | - '''Keyword list''': Nos permet conéixer la representativitat de les paraules d'un corpus respecte d'un atre [[Archiu:Programa_AntConc.png|thumb|302px|Programa AntConc processant l'informació des d'un corpus]] | ||
==Aplicacions del corpus llingüístic== | ==Aplicacions del corpus llingüístic== | ||