Hansard Collocation Database /
Base de données des collocations sur Hansard


septembre 2010-
EN CHANTIER UNDER CONSTRUCTION
Le système d'interrogation de la Base de données des collocations Hansard était une application Coldfusion, qui n'est plus disponible dans ce site. Une nouvelle version PHP est en voie de développement. The database software for the Hansard Collocation Database was written in Coldfusion, which is no longer available on this server. A new version in PHP is under construction.

.


Veuillez envoyer toute suggestion à / Please send any suggestions to
W. Winder: winder@interchange.ubc.ca
http://www.fhis.ubc.ca/winder


Source des données, voir:

Le site Web du Parlement du Canada : http://www.parl.gc.ca/

“Aligned Hansards of the 36th Parliament of Canada (Release 2001-1a)” par le Natural Language Group of the USC Information Sciences Institute, Ulrich Germann, éditeur (http://www.isi.edu/natural-language/download/hansard/).

 

 

Source of Data, see:

The Parliament of Canada Web Site: http://www.parl.gc.ca/

“Aligned Hansards of the 36th Parliament of Canada (Release 2001-1a)” by the Natural Language Group of the USC Information Sciences Institute, Ulrich Germann, editor (http://www.isi.edu/natural-language/download/hansard/).

Video introductions to the Canadian Hansard and to the Hansard Collocation Database.

Statistiques de la base de données
  • Français
    • Types: 66215
    • Occurrences: 9294250
  • Anglais
    • Types: 48044
    • Occurrences: 8132306
  • Total
    • Types: 114259
    • Occurrences: 17426556
    • mots non-indexés: inconnu

Database statistics
  • French
    • Types: 66215
    • Tokens: 9294250
  • English
    • Types: 48044
    • Tokens: 8132306
  • Total
    • Types: 114259
    • Tokens: 17426556
    • Words not indexed: unknown
Formes françaises non-indexées

ils, est, des, les,la, j, n, une, m, c, qu, t, m, l, s, d, de, un, être, et, à, il, avoir, ne, je, son, que, se, qui, ce, dans, en, du, elle, au, de, ce, le, pour, pas, que, vous, par, sur, faire, plus, dire, me, on, mon, lui, nous, comme, mais, pouvoir, avec, tout, y, aller, voir, en, bien, où, sans, tu, ou, leur, homme, si, deux, mari, moi, vouloir, te, femme, venir, quand, grand, celui, si, notre, devoir, là, jour, prendre, même, votre, tout, rien, petit, encore, aussi, quelque, dont, tout, mer, trouver, donner, temps, ça, peu, même, falloir, sous, parler, alors, main, chose, ton, mettre, vie, savoir, yeux, passer, autre, après, regarder, toujours, puis, jamais, cela, aimer, non, heure, croire, cent
English stopwords

s, a, about, all, an, and, are, as, at, be, been, but, by, call, can, come, could, day, did, do, down, each, find, first, for, from, get, go, had, has, have, he, her, him, his, how, i, if, in, into, is, it, like, long, look, made, make, many, may, more, my, no, not, now, number, of, oil, on, one, or, other, out, over, part, people, said, see, she, so, some, than, that, the, their, them, then, there, these, they, this, time, to, two, up, use, was, water, way, we, were, what, when, which, who, will, with, word, would, write, you, your
Remarques sur le système informatique

Ce système est lent (jusqu'à 10 seconds par interrogation). C'est un système en chantier; certaines fonctions ne sont pas disponibles et des mises à jours du système le rendront instable par moments. Si quelque chose ne marche pas, veuillez essayer de nouveau dans 24 heures.
System remarks

This system is at times slow (up to 10 seconds for each query). It is still under development; some features are not available and updates will sometimes leave the system (temporarily) less functional. If something doesn't work, please try again in 24 hours.
Caractères passe-partout
  • % (n'importe quelle chaîne de charactères),
  • _ (n'importe quel caractère),
  • [a..z] (n'importe quel caractère de l'ensemble),
  • [^a...z] (n'importe quel caractère qui ne fait pas partie de l'ensemble)
Wildcard expressions
  • % (any string),
  • _ (any single character),
  • [a..z] (any single character of the set),
  • [^a...z] (any single character that is not of that set)
Les fonctions
  • concordance monolingue (concordance KWIC dans une langue, avec un lien vers la concordance double),
  • concordance bilingue (concordance des deux langues alignée),
  • lexique (liste des mots et leur fréquence, avec un lien vers une concordance monolingue ou bilingue).
  • collocations monolingues (collocations dans la même langue que le patron de fouille).
  • collocations bilingues (collocations du patron de fouille de l'autre langue).
  • concordance KWIC bilingue:  concordances KWIC engendrées à partir des collocations bilingues (voir la fenêtre des collocations).
Functions
  • monolingual concordance (KWIC concordance of one language, with a link to the bilingual data),
  • bilingual concordance (aligned concordance of the two languages),
  • lexicon (list of words and their frequency with a link to the bi and monlingual concordances)
  • monolingual collocates (collocates in the same language as the word pattern).
  • bilingual collocates (collocates of the word pattern in the other language).
  • bilingual KWIC (aligned KWICs generated from bi-collocates).