Considrations thoriques:
Les sciences sociales constituent une branche des sciences humaines qui prend comme objet d’tude l’homme et ses activits dans une collectivit.
Elles s’intressent une catgorie particulire des phnomnes humains qui peuvent tre des phnomnes sociaux ou des faits sociaux qui rsultent de la vie en socit et non une existence humaine solitaire.
De plus, elle prend en charge l’homme dans son milieu social, tel l’exemple des civilisations, dans lesquelles on trouve des notions qui prsentent aussi des traits originaux qui les distinguent l’intrieur d’une nation, d’une ville, d’un village…etc.
Les sciences sociales peuvent tre dfinies comme les sciences dont l’objet est constitu par l’tude des faits qui ont ceci en commun qu’ils constituent un environnement, un cadre, un milieu qui rsulte d’une activit humaine collective et qui conditionnent les activits humaines individuelles.
Les caractristiques originales des sciences sociales ont amen discuter la possibilit de procder leur tude comme on fait avec les sciences de la nature c'est--dire procder l’tude de la ralit sociale.
Typologie des sciences sociales:
Les principales sciences sociales: la sociologie, l’anthropologie, l’thologie, la psychologie sociale, la gographie, la dmographie, l’conomie politique, les sciences politiques.
La sociologie: c’est l’tude de la ralit sociale de l’tre humain.
Le motsociologieest l’invention d’Auguste Comte (1798-1850) qu’il substitue dans son cours de philosophie positive la notion de physique sociale.
L’anthropologie:
C’est la discipline qui dcrit les murs des diffrents peuples primitifs et archaques.Il faut de ce fait distinguer:
L’ethnographe: c’est celui qui travaille sur le matriel recueilli sur terrain.
L’ethnologue: est celui qui fait l’effort de l’laboration, de synthse qui peut tre gographique (des tribus d’une rgions) , historique( l’volution d’un groupement humain) ou systmatique(recherche sur une coutume).
L’anthropologue: est celui qui s’intresse l’tude de l’homme dans sa totalit.
Mthode ou mthodes?
La mthode dsigne la marche rationnelle de l’esprit pour arriver la connaissance ou la dmonstration de la vrit.
Dans la science, c’est l’ensemble des oprations intellectuelles permettant d’analyser, de comprendre et d’expliquer la ralit tudie.
Donc, la mthode c’est la dmarche logique indpendante du contenu particulier de la recherche.
Les mthodes de recherche en sciences humaines sont des procdures utilises en vue de dvelopper la connaissance scientifique des phnomnes humains.
Cette connaissance est caractrise par la rigueur de ses raisonnements et par la prcision des ses observations empiriques. La mthodologie joue un grand rle en sciences (dans les sciences humaines et les sciences dures ou pures) car elle est le fruit d’une longue tradition de recherche et dfinit la manire scientifique d’tudier les phnomnes.
Le doute et l’incertitude peuvent susciter des questions mais crent un malaise que le chercheur cherche surmonter par la croyance.
Gnralement, nous laborons des rponses que nous nous fournissons la tradition, notamment la religieuse, les personnes exprimentes que nous ou les experts dans un domaine donn. Quelque fois, nous rflchissons sur nos propres expriences pour en tirer des conclusions personnelles, d’autres fois, nous consultons des ouvrages savants comme les encyclopdies et nous considrons les conclusions des experts comme des vrits.
Cependant, ces processus sont souvent fautifs ou incomplets ou dfectueux et il se peut que les moyens que nous avons adopts pour trouver les rponses fussent inadquats.
Evidemment toutes les questions qui ne peuvent pas tre rsolues scientifiquement telles celles mtaphysiques comme l’au-del de l’existence de dieu ou celle de la nature du bien et des raisons de la souffrance humaine, qui ne sont pas sujettes un traitement scientifique en raison de leur nature. Par contre, certaines questions peuvent tre abordes avec la mthode scientifique, celle qui se distingue par le fait que ses rsultats sont reproductibles, fiables et souvent trs instructifs et trs solides et dont les exemples ne peuvent par tre limits:
Le dveloppement de l’informatique, la dcouverte de VIH l’origine du Sida…etc.
De plus d’un sicle, la mthode scientifique a t adopte par la plupart des chercheurs en sciences humaines et on dsormais de grandes dcouvertes en psychologie, histoire, en linguistique et dans toutes les autres branches des sciences humaines.


















COURS
Mthodologies des sciences sociales
On parle des techniques au lieu des mthodes pour dsigner les procds de recherche qui servent mettre en uvre concrtement et raliser les oprations correspondant aux diffrentes tapes de la mthode.
Ainsi, on trouve que la mthode scientifique comporte une phase importante qui est l’observation. Celle-ci relve de la mthode. En revanche, pour raliser cette observation, on pourra mettre en uvre des procds divers: entretien, sondage d’opinion, analyse des documents qui constituent autant de techniques. De manire abstraite, on dira que les techniques reprsentent des procds limits mettant en jeu des lments pratiques, concrets, adapts un but prcis et dfini, alors que la mthode est une dmarche intellectuelle gnrale coordonnant un ensemble des oprations techniques dans un but plus large, savoir connaitre et expliquer les phnomnes sociaux.
Les techniques apparaissent donc comme des outils de recherche mis en fonction d’une stratgie gnrale dfinie par la mthode.
En sciences sociales, il y a un nombre dtermin de techniques ou moyens d’investigation. On obtient des donnes par l’une ou l’autre de ces techniques, qui peuvent aussi tre regroupes en deux grandes classes selon le type de donne qu’elles produisent. Chacune de ces techniques de recherche libre soit des donnes primaires, soit des donnes secondaires.







Les techniques de recherche en sciences humaines et sociales:
1/ L’observation:
1- Observation fortuite
2- Observation scientifique.
2/L’enqute par entretien:
1- Entretien documentaire
2- Entretien d’opinion ou de personnalit
Selon les personnes interroges, on peut distinguer:
-Les entretiens d’anonymes
-Les entretiens d’individualit.
Selon la profondeur de l’entretien, nous avons:
-Les entretiens extensifs.
-Les entretiens intensifs.
Selon le nombre des personnes interroges, on distingue:
-Les entretiens uniques.
-Les entretiens multiples.
-Les entretiens rpts.
Selon le degr de libert de l’enquteur, on distingue:
-Les entretiens libres.
-Les entretiens directifs.
3/ La technique de sondage:
C’est la technique la plus frquente parmi d’autres auxquelles le chercheur fait recours dans une approche qualitative. Elle est une technique statistique permettant de dduire les proprits de toute une population partir de l’analyse d’un chantillon reprsentatif.
Cette technique a pour but de dcrire un tout en n’en connaissant qu’une partie. Le tout constitue ce qu’on appelle univers.Pour connaitre l’opinion de cet univers, on tudiera seulement l’opinion d’une partie rduite: l’chantillon et on explora les rsultats obtenus l’ensemble de l’univers de l’enqute.


Dans ce processus, il existe trois phases:
1- La dtermination de l’chantillon.
2- Le choix des questions qui seront poses aux interrogs.
3- La collecte des rponses aux questions et l’exploitation de ses rsultats.
L’chantillon est la partie de l’univers qui sera effectivement tudi et qui permettra par extrapolation de connaitre les caractristiques de la totalit de l’univers et pour que ce procd permette d’obtenir des rsultats valides, l’chantillon doit tre reprsentatif par rapport aux techniques de slection et de taille de l’chantillon.
Pour les techniques, il existe deux techniques:
A/ La technique de Quotas: dite parfois la technique rationnelle ou de choix raisonn parce qu’elle fait appel la raison.
La dtermination de l’chantillon dans ce procd comporte deux phases:
1- Dans un premier temps, on construit une sorte de modle rduit de l’univers de l’enqute: le plan d’enqute.
2- Dans un deuxime lieu et dans ce plan d’enqute on dtermine les quotas c'est--dire les catgories ou les caractristiques qui seront slectionnes pour dfinir l’chantillon, et ces caractres devront tre pertinents, autrement dit, ils devront tre la fois caractristiques de l’univers tudi et avoir une relation logique avec l’objectif de l’enqute.
De plus, il faut transposer dans l’chantillon les proportions de ces caractristiques qui existent dans l’univers global et pour le construire, il faut analyser les caractristiques communes l’univers partir des renseignements que l’on dispose sur celui-ci.
La dtermination des quotas consiste attribuer un contingent des personnes interroges dont les caractristiques sont dsignes par une feuille de quotas .
B/ La technique de probabilistes: dite hasardeuse.
Dans ces prcds, le choix des constituants de l’chantillon est un choix fait au hasard, c'est--dire chaque individu de la population a la chance de figurer dans l’chantillon, et on peut cet effet utiliser le tirage au sort de tout les lments de l’univers pour construire un chantillon.



LE QUESTIONNAIRE:
On considre souvent que la validit des rsultats d’un sondage d’opinion est plus dpendante de la qualit du questionnaire que celle de l’chantillonnage.
Le questionnaire est la liste des questions qui seront constitues aux sujets dsigns par l’chantillonnage. Il est labor avant le dbut de l’enqute et sera pos sous une forme identique tous les sujets.
Les questions sont videmment choisies en fonction de l’objet de l’enqute.
L’laboration d’un questionnaire peut obir trois proccupations:
1- La validit di questionnaire: il doit comporter un ensemble d’lments soigneusement rflchies et combins, tenant compte de la psychologie des personnes interroges.
2- La fidlit: dans le sens d’obtenir les mmes rponses sur le mme questionnaire, par les mmes personnes interroges, mais par des enquteurs diffrents.
3- IL doit tre opratoire: dans le sens d’tre conu de faon faciliter son application, le classement, l’interprtation, ainsi que l’exploitation de ses rponses obtenues.
Le nombre des questions ne doit pas tre trop lev, car cela risque de lasser les interrogs qui peuvent rpondre moins facilement et moins exactement aux dernires questions et pour un sondage, le chiffres des questions est de trentaine.
Toutefois, ce chiffre dpend de la nature du questionnaire;si les questions sont relativement faciles , on pourra les multiplier. Si elles sont difficiles et ncessitent un effort de rflexion, leur nombre devra tre rduit.
De mme, l’ordre dans lequel vont se succder les questions a lui aussi une influence sur la validit des rponses que l’on obtiendra; c’est ainsi que la question d’introduction doit tre une question simple favorisant l’entre en matire, en mettant en confiance le sujet interrog et en suscitant si possible son intrt (question d’actualit)et pour viter la monotonie et la fatigue du sujet, il faut alterner les types de questions(question ferme, question ouverte). Toutefois, il faut aussi calculer la place des questions dlicates, la question importante.
LES TYPES DE QUESTION
La classification des questions est faite selon deux critres:
1/ Selon le contenu, on distingue:
Les questions de fait:dans laquelle on demande au sujet de fournir des informations sur des faits concrets dont il a l’exprience ou dont il a connaissance.
Les questions d’action: dans laquelle on demande au sujet s’il accomplit tel ou tel acte.
Les questions d’opinion: demandent directement au sujet ce qu’il pense propos de tel ou tel phnomne, propos de tel ou tel problme.
2/ Selon la forme de question, on distingue:
Les questions ouvertes: la personne interroge est libre d’apporter ses rponses. Cette rponse permet l’interview de s’exprimer librement en apportant dans sa rponse toutes les prcisions et les nuances qu’il estime souhaitable.
Les questions fermes:
La personne interroge est ici enferme dans une alternative entre deux positions, s’exprimant souvent par oui ou par non et elles s’appellent des questions dichotomiques.
Des questions QCM ou QCU
Dans le premier cas, l’interrog peut choisir une ou plusieurs rponses; dans le second, il doit faire un choix unique.
L’enqute documentaireou l’analyse de contenu:
Dans cette technique, il n ya pas de contact immdiat entre l’observateur et la ralit.
C’est une observation qui s’effectue travers un mdiateur constitu par les documents et ce terme dsigne ici toute trace en rapport les activits des hommes vivants en socits et qui constituent directement une source d’information: article de presse, des photos, une banderole; se sont des sources documentaires o le chercheur peut aller puiser ses informations.
Ces documents sont tres nombreux dans les sciences sociales, on peut quelques catgories de ces documents:
Documents directs ( primaires): est ceux qui correspondent la dfinition donne, tout ce qui constituent une trace directe d’un phnomne social ( article de presse sur tel ou tel vnement)
Documents indirects(secondaires): sont constitus par les rsultats des recherches qui ont pu dj avoir t entreprises sur le phnomne.
Ex: l’tude d’un parti, tout ce qui a t dj crit propos de ce parti ou de phnomne politique.
Ce type de documentation a un trs grand intrt parce qu’il permet une premire approche du problme.
Encore, il permet d’viter de s’engager totalement dans l’inconnu, par contre il peut aider le chercheur dcouvrir des pistes suivre.
Documents directs crits:
Sont aujourd’hui nombreux, ils prennent plusieurs formes: documents publis, des archives…etc. ils correspondent tous documents imprims et font l’objet d’une diffusion. (Officiels, non officiels, presse)
Documents crits non directs:
Sont les documents iconographiques constitus par les images:
a/ Documents traditionnels: documents visuels constitus par des gravures, peintures, des sculptures…etc.
b/Documents iconographiques modernes: ceux qui rsultent du recours la photographie, au cinma, aux procds d’enregistrement vido.
c/ Document phontique: ceux relatifs la communication par des sons c'est--dire ils sont essentiellement constitus par des enregistrements sur disque ou sur bande magntique.
d/ Objets: tout lments matriel utilis par l’homme dans un but dtermin: objets de dfense et de guerre, les objets immobiliers, les objets de jeu et de divertissements…etc.
La technique d’enqute de terrain:
Les prcds d’observation sur terrain sont fonds sur le contact direct et immdiat du chercheur avec la ralit tudie.
C’est l’observateur qui pour observer le droulement d’une manifestation descend dans la rue pour voir ce qui se passe. Ce type d’observation fait essentiellement appel aux informations que le chercheur retire de l’usage de ses sens.
Ce procd fait l’objet d’applications concrtes. On distingue deux types d’hypothses diffrentes selon:
La situation initiale de l’observateur par rapport au phnomne qu’il tudie: c’est l’observation externe, dans laquelle la ralit est observe par des chercheurs qui n’appartiennent pas au mile tudi qui lui sont trangers, mais ils peuvent tre des spcialistes dans le domaine, ce qui permet de raliser l’observation scientifique.
Ce prcd assure des fortes garanties de validit d’objectivit du fait de distance existant entre le chercheur et le phnomne tudi.
L’observation interne: dans ce cas se sont les participants un phnomne ou les membres d’un groupe se transforment en sociologues et deviennent des observateurs du milieu auquel ils appartiennent.
Dans ce type d’observation dite participante, l’observation interne vient complter l’observation externe et les observs apparaissent comme des collaborateurs plus ou moins occasionnels de l’quipe de recherche et peuvent avoir une formation au dpart ce qui va susciter une certaine efficacit et validit des rsultats obtenus.






















COURS
La linguistique de corpus
Elle est la branche de la linguistique qui exploite les technologies informatiques pour sa recherche.la linguistique de corpus participe la cration de dictionnaires, de grammaires etc., elle facilite aussi l’analysation linguistique de divers phnomnes. Tous ces aptitudes la font indispensable dans le domaine des sciences humaines. Auparavant, les compilateurs rassemblaient manuellement des mots et des exemples de leur emploi et successivement ils les notaient, ce qui tait trs fatigant et prenait beaucoup de temps.
Histoire brve de la linguistique de corpus
L’histoire de ce domaine de la linguistique est lie surtout aux pays anglophones. Et mme si elle se dveloppe aussi dans d’autres pays prsent, le centre de la recherche reste toujours l-bas.
La linguistique de corpus travaillant avec les corpus sous la forme lectronique est ne dans la deuxime moiti du XXe sicle, plus prcisment dans les annes soixante, mais cela ne signifie pas encore qu’avant, les linguistes ne se soient intresss ni l’utilisation authentique de la langue ni aux citations – ces corpus non-lectroniques taient cependant connus sous les noms fichier, archives et ainsi de suitte. Comme exemple, on peut mentionner le Dictionary of English Language publi au dbut du XVIIe sicle sous la direction de Samuel Johnson, l’American Dictionary of the English Language de l’anne 1828, l’English Dialect Dictionary de J. Wright du tournant du VIIIe et du XIXe sicle, l’Oxford English Dictionary dont le dernier tome a paru en 1928. Dans la premire moiti du XXe sicle, c’est la pdagogie linguistique qui commence manipuler plus intensivement les corpus, par ex. le Teacher’s Wordbook of 30.000 Words d’E. L. Thorndike et I. Lorge. Des grammaires aussi s’appuient sur beaucoup de matriaux linguistiques et c’est pourquoi elles, ds la deuxime moiti du XXe sicle avant tout, profitent des collections de citations. Le corpus non-lectronique le plus remarquable destin ce but tait le Survey of English Usage Corpus dont le projet a t ouvert par Randolph Quirk en1959. Son tiquetage[1] a inspir des crateurs du Brown Corpus. Le SEU Corpus faisait aussi la base de la grammaire anglaise le Comprehensive Grammar of the English Language et dans la deuxime moiti des annes soixante-dix, il a t transform en forme lectronique et ainsi sa partie parle fait maintenant partie intgrante du London-Lund Corpus.[2]
La naissance de la linguistique de corpus comme on la connat aujourd’hui est attache au dveloppement rapide de technologies informatiques dans la deuxime moiti du XXe sicle. Grce ce fait, il tait rendu possible de passer du traitement manuel au traitement automatique, des fiches ont t au cours du temps remplaces par des corpus lectroniques. En 1961, Henry Kucera[3] et Nelson Francis se sont mis crer le Brown University Standard Corpus of Present-Day Edited American English, le Brown Corpus en abrg. Il s’agit de corpus de prose anglaise imprime aux tats-Unis pendant l’anne 1961 – ses auteurs taient les locuteurs natifs de l’anglais amricain.[4] C’tait le premier corpus lectronique form directement pour des objets linguistiques. Le projet a dur jusqu’ 1964 et il tait remarquable entre autres si nous prenons en considration l’indiffrence gnral de ce temps-l pour ce domaine de la linguistique et l’attitude ngative de Noam Chomsky, le personnage important de la linguistique amricaine. En plus, la structure de ce corpus est devenue pour longtemps le modle lequel les autres corpus s’efforaient de suivre. Un autre corpus marquant reprsente le Lancaster-Oslo/Bergen Corpus cr entre les annes 1970 et 1978. Son but tait de former une version britannique du Brown Corpus. L’Universit de Lancaster, l’University d’Oslo et le Norwegian Computing Centre for the Humanities de l’Universit de Bergen prenaient part sa naissance. Au dbut, il tait enregistr sur bande magntique, prsent, il est contenu sur disquettes, CD-Rom etc. En 1975, le Survey of Spoken English est ouvert sur l’initiative de Jan Svartvik l’Universit de Lund en Sude. Ce projet a converti une partie parle du Survey of English Usage Corpus, mentionne ci-dessus, sous forme lectronique et il a trait aussi des autres textes ce qui mne l’laboration du London-Lund Corpus, l’un de plus grands corpus de l’anglais parl de nos jours.[5]
Depuis la fin des annes soixante, les corpus spcialiss aussi prennent naissance. Parmi tous, on peut nommer par exemple l’American Heritage Intermediate Corpus, bas sur les livres qui taient lus le plus souvent par les jeunes amricains entre 7 et 15 ans d’ge en 1969. Environ une dizaine annes plus tard, la linguistique diachronique elle-mme a commenc utiliser des possibilits nouvelles dans le traitement de donnes linguistiques. Helsinki Corpus of English Texts: Diachronic Part est pour la plupart considr comme le premier corpus diachronique de l’anglais. Il a t construit entre les annes 1984 et 1991 et il contient des textes de l’an 750 1700.[6]
Division des corpus linguistiques
L’utilisation des corpus peut tre diverse et de ce fait il dcoule division selon diffrents aspects. Il est possible de juger des critres comme par exemple de l’tendue du corpus, son intervalle de temps, de la slection de textes qui deviendront sa partie composante, la langue ou les langues de ces textes.
L’une de divisions possibles est la division en corpus d’une langue, gnralement d’une langue nationale, et en corpus parallles. Cette problmatique est mentionne plus en dtail ci-dessous. Une autre distingue les corpus diachroniques d’avec des corpus synchroniques.

Corpus diachroniques et synchroniques
Dans le cas de ces deux types de corpus, c’est l’intervalle de temps de textes compris qui y reprsente un critre distinctif.

Corpus diachroniques
Les corpus diachroniques comportent les textes d’une priode de temps plus longue que les corpus synchroniques et ils sont ferms. L’Helsinki Corpus of English Texts: Diachronic and Dialectal, le Lampeter Corpus ou le Diakorp peuvent servir d’exemple de ce type-l.
Le premier nomm est le rsultat du projet qui a t commenc en 1984 sous la direction de Matti Rissanen et Ossi Ihalainen l’Universit d’Helsinki. Sa partie diachronique embrasse des textes crs entre les annes 750 et 1700.[7]
Le Lampeter Corpus of Early Modern English Tracts est la collection de textes divers publis entre les annes 1640 et 1740 lorsque augmente la production d’uvres imprimes et lorsqu’il arrive la standardisation de l’anglais britannique. Ce projet a t commenc en 1991 par Prof. Dr. Josef Schmied et Eva Hertel l’Universit de Bayreuth. Deux annes aprs, en 1993, il a t dplac avec ses crateurs Chemnitz. Depuis 1991, ils ont collabor ce projet avec l’Universit de Wales, Lampeter. Puis, l’Universit d’Helsinki et l’Universit de Lancaster se sont jointes aussi eux.[8]
Le Diakorp est un dernier exemple citer. Il s’agit du corpus diachronique qui fait partie du ČNK. Il est compos d’une slection de textes en vieux tchque de premiers actes conservs, donc du but du XIIIe sicle, jusqu’ l’anne 1989, ou jusqu’ 1944 en ce qui concerne les textes d’art. La premire partie acheve du Diakorp a t rendue accessible au public au mois de septembre 2005. Ce procs de l’accessibilisation continue jusqu’aujourd’hui.[9]

Corpus synchroniques
Au contraire, les corpus synchroniques ont pour leur but de ne comprendre qu’une relativement courte priode de temps, ils n’enregistrent pas donc l’volution de la langue et des changements en elle. Ils sont construits en considration de leur reprsentativit – alors il est veill la reprsentation quilibre des diffrents genres. Dans la majorit des cas, il s’agit de corpus de la langue actuelle (lors de la naissance du corpus concret).
Les corpus synchroniques sont par exemple le Brown Corpus, mentionn dans le chapitre prcdent, l’Australian Corpus of English (ACE), le Wellington Corpus of Written New Zealand English ou l’International Corpus of English (ICE). L’ACE tait cr dans les annes quatre-vingt l’Universit de Macquarie comme une analogie au Brown Corpus. Il contient les textes en anglais australien publis en 1986.[10] La formation du Wellington Corpus of Written New Zealand English remonte l’poque entre les annes 1986 et 1992. Les matriaux qu’il comprend, vient surtout des annes 1986 et 1987, mme si en fait ce corpus couvre la priode entre 1986 et 1990.[11] Le dernier corpus mentionn est l’ICE. Il se distingue des autres par son but primaire – il s’agit d’un rassemblement de matriaux pour des tudes comparatives de l’anglais de tout le monde, ses variantes diverses. Ce projet a commenc en 1989 et prsent, dix-huit quipes de chercheurs collaborent lui. Chaque ICE corpus se compose d’un million de mots de l’anglais parl et crit, publi aprs 1989.[12] Le ČNK contient aussi une partie synchronique – tant donn qu’ prsent, il est impossible de travailler en mme temps avec toutes ses composantes, celles-l se forment comme des corpus indpendants. On peut les classer en trois catgories fondamentales: les corpus crits (par ex. le SYN2005, le SYNEK, l’ORWELL), oraux (le Prask mluven korpus, le Brněnsk mluven korpus, l’ORAL2006) et parallles (le projet Intercorp). Des renseignements plus dtaills sur le ČNK et ses parties se trouvent ci-dessous.[13]
Quelques corpus synchroniques – ceux qui n’ont pas t crs avec un but spcifique - ne prfrent aucun domaine de la linguistique, aucune niveau de la langue ou appartenance de style et c’est pourquoi ils sont compts parmi les corpus gnraux. Un autre attribut de ce type de corpus est son quilibrage. Cela signifie qu’en formant le corpus, on prend en considration plusieurs aspects: diffrents types de genres littraires (le style journalistique y compris - les corpus gnraux travaillent avec la presse quotidienne etc.), mdias de transmission (la langue parle et crite) et des registres de langue de textes choisis (matriaux d’un caractre priv ou public, officiel).[14]
Cependant la plupart des corpus prennent leur naissance dans l’intention d’une recherche concrte. Ces corpus-l sont nomms les corpus spcialiss– ils sont orients sur un dveloppement du langage chez les enfants, des variantes rgionales de certes expressions et ainsi de suite. Parmi les corpus spcialiss franais, on peut mentionner par ex. Alice au pays des merveilles, Renault, Le Monde.






















[1] Dans ce travail, il est utilis le terme tiquetage pour exprimer que le corpus est muni d’tiquettes morpho-syntaxiques. Au contraire, le termebalisage y concerne par ex. des balises en document HTML et ainsi de suite.
[2] Cf. ulc, M. Op. cit., pp. 28 – 29.
[3] Jindřich Kučera, le linguiste d’origine tchque, n en 1925.
[4] Cf. Francis, W. N., Kucera, H. Brown Corpus Manual [en ligne]. [page consulte le 1er novembre 2008]. Disponible l’adresse: < http://khnt.aksis.uib.no/icame/manuals/brown/INDEX.HTM#bc2>.
[5] Cf. ulc, M. Op. cit., pp. 30 - 32.
[6] Ibid., p. 33.
[7] Cf. Kyt, M. Manual to the diachronic part of The Helsinki Corpus of English texts Coding Conventions and Lists of Source Texts. Helsinki 1996 [en ligne]. [page consulte le 28 octobre 2008]. Disponible l’adresse: <http://khnt.hit.uib.no/icame/manuals/HC/INDEX.HTM>.
[8] Cf. The Lampeter Corpus of Early Modern English Tracts [en ligne]. [page consulte le 29 octobre 2008]. Disponible l’adresse: <http://khnt.hit.uib.no/icame/manuals/LAMPETER/LAMPHOME.HTM>.
[9] Cf. Uveden do diachronn sloky ČNK [en ligne]. [page consulte le 28 octobre 2008]. Disponible l’adresse: <http://ucnk.ff.cuni.cz/diakorp.html>.
[10] Cf. Peters, P. Manual of information to accompany The Australian Corpus of English (ACE) Macquarie University [en ligne]. [page consulte le 2 novembre 2008]. Disponible l’adresse: <http://khnt.hit.uib.no/icame/manuals/ace/INDEX.HTM>.
[11] Cf. Bauer, L. Manual of information to accompany The Wellington Corpus of Written New Zealand English [en ligne]. [page consulte le 2 novembre 2008]. Disponible l’adresse: <http://khnt.hit.uib.no/icame/manuals/wellman/INDEX.HTM>.
[12] Cf. International Corpus of English [en ligne]. 2008 [page consulte le 2 novembre 2008]. Disponible l’adresse: <http://www.ucl.ac.uk/english-usage/ice/index.htm>.
[13] Cf. ČNK. Struktura ČNK [en ligne]. [page consulte le 3 novembre 2008]. Disponible l’adresse: <http://ucnk.ff.cuni.cz/struktura.html>.
[14] Cf. ulc, M. Op. cit., p. 12.