Aide à la recherche
L'outil de recherche utilisé sur le site Droit francophone se nomme Phase3. Ce moteur de recherche, développé par l'équipe LexUM, est basé sur le moteur de balayage, Nutch, et le moteur de recherche, Lucene. Phase3 indexe l'ensemble des sites et des collections documentaires répertoriés sur le portail. Cet outil de recherche est toujours en cours de développement et tout commentaire pouvant contribuer à son amélioration est bienvenu.
L'utilisation de Phase3 sur le site Droit francophone est rendue possible via deux interfaces différentes. La première est l'interface simplifiée présente sur toutes les pages du site. Celle-ci offre peu d'options mais possède l'avantage d'être contextuelle. La deuxième est l'interface de recherche avancée, accessible par la barre permanente située dans le haut des pages. Cette dernière offre beaucoup plus de fonctionnalités.
- Interface simplifiée
- Interface avancée
- Interprétation des résultats de recherche
- Particularités de Phase3
- Opérateurs booléens (ET, OU, SAUF)
- Ordre d'évaluation des opérations dans une requête
1. Interface simplifiée
L'interface simplifiée est présente sur l'ensemble des pages d'index et des pages d'affichage du site Droit francophone. Celle-ci permet d'accéder rapidement à l'outil de recherche, peu importe l'endroit du site où vous vous trouvez. Bien que l'interface de recherche simplifiée offre peu d'options, elle offre tout de même la possibilité de limiter le champ de la recherche à la section affichée ou de l'étendre à tout le Web juridique francophone. Par défaut, pour la recherche simplifiée, le mode d’interprétation des termes de recherche est limité à "tous ces mots". Afin d’obtenir plus de choix quant aux modes d’interprétation des termes de recherche (ex. "un de ces mots", "cette phrase", "cette requête booléenne"), veuillez consulter l’interface de recherche avancée.
Recherche dans cette section
C'est la valeur par défaut. Lorsque celle-ci est sélectionnée, la recherche est limitée aux ressources et aux documents compris dans la section affichée. Lorsque la recherche est effectuée à partir d'une page d'index, la recherche est effectuée parmi les ressources et les documents de l'ensemble des sections étant hiérarchiquement inférieures à cet index.
Par exemple, à partir de la page d'index du Congo, une recherche effectuée "dans cette section" retournera uniquement des ressources et des documents associées au Congo.
Recherche sur tout le web juridique
Lorsque la valeur "sur tout le web juridique" est sélectionnée, la recherche est effectuée parmi toutes les ressources et les collections documentaires répertoriées sur le portail Droit francophone.
Par exemple, à partir de la page d'index du Congo, une recherche effectuée "sur tout le web juridique" retournera les ressources et les documents associés au Congo, mais aussi ceux associés à l'ensemble des États membres de l'Organisation internationale de la francophonie.
2. Interface avancée
L'interface avancée est présente uniquement sur la page de recherche avancée. Celle-ci permet, contrairement à l'interface simplifiée, de préciser les critères de recherche de différentes façons. L'interface de recherche avancée comprend trois sections principales : une section commune au portail de ressources et aux collections documentaires et une section spécifique à chacun d'entre eux. Par défaut, la recherche est effectuée dans tous les contenus, ce qui permet de spécifier n'importe lequel des critères communs. Les critères spécifiques quant à eux, peuvent être précisés uniquement pour le portail de ressources ou les collections documentaires alternativement.
La section commune permet de choisir le mode d'interprétation des termes de recherche, le nombre de résultats à afficher par page (15, 25 ou 50) ainsi que divers critères spécifiques au type de résultats attendu (État / zone, catégorie, pertinence, référence, date, collection).
Mode d'interprétation des termes de recherche
En ce qui concerne les modes d'interprétation disponibles, ceux-ci sont identiques à ceux décris plus haut dans le cadre de l'interface de recherche simplifiée ("tous ces mots", "un de ces mots", "cette phrase", "cette requête booléenne").
Tous ces mots
C'est le mode par défaut. Lorsque le mode "tous ces mots" est sélectionné, des opérateurs ET sont ajoutés entre chaque mot de la requête.
Par exemple, la requête droit congolais deviendra "droit" ET "congolais". Les ressources et les documents retournés seront ceux contenant les deux mots, indépendamment de leur emplacement.
Un de ces mots
Lorsque le mode "Un de ces mots" est sélectionné, des opérateurs OU sont ajoutés entre chaque mot de la requête.
Par exemple, la requête droit congolais deviendra "droit" OU "congolais". Les ressources et les documents retournés seront ceux contenant un ou l'autre des mots recherchés.
Cette phrase
Lorsque le mode "Cette phrase" est sélectionné, les mots entrés dans la zone de texte sont interprétés par Phase3 comme une expression exacte, une "phrase". En conséquence, Phase3 cherche les documents qui contiennent la séquence exacte de mots telle qu'inscrite dans la zone de texte, comme si ces mots étaient compris entre guillemets doubles anglais (" ").
Par exemple, la requête droit congolais deviendra "droit congolais". Les documents retournés seront ceux contenant l'expression exacte "droit congolais" et non ceux contenant des expressions du type "le ministre congolais n'avait pas le droit".
Cette requête booléenne
Sélectionner le mode "Cette requête booléenne" est une façon assez directe de questionner Phase3. Tous les opérateurs décrits plus bas doivent être utilisés conjointement avec le mode booléen.
Par défaut, l'interface de recherche simplifiée utilise le mode "tous ces mots" et cherche dans "dans cette section". Elle permet également d'accéder rapidement aux pages d'aide à la recherche et de recherche avancée.
Nombre de résultats à afficher par page
Il est possible de déterminer le nombre de résultats de recherche devant s'afficher sur chacune des pages. La sélection proposée est de quinze (15), vingt-cinq (25), ou cinquante (50) résultats par page de recherche.
Sélection du ou des État(s) / zone(s) concerné(s)
Un menu déroulant permet de sélectionner les États / zones auxquels les résultats de recherche doivent absolument être associés.
Sélection de la ou les catégorie(s) concernée(s)
Un menu déroulant permet de sélectionner les catégories auxquelles les résultats de recherche doivent absolument être associés.
Sélection de la pertinence des sites recherchés
Un menu déroulant permet de sélectionner le niveau de pertinence minimum auquel les résultats de recherche doivent répondre.
Sélection de la ou les collection(s) documentaire(s)
Un menu déroulant permet de sélectionner les collections documentaires auxquelles les résultats de recherche doivent absolument être associés.
3. Mode d'interprétation des résultats de recherche
Mode d'interprétation des résultats de recherche
1 - Extrait automatique de la ressource
Les résultats de la requête présentent une courte description du texte qui contient vos termes de recherche, où les termes de recherche seront mis en évidence en caractère gras.
2 - Types de documents retournés (HTML, PDF, DOC)
Les résultats de la requête peuvent être sous formes HTML, PDF, ou DOC. Lorsqu'il s'agit de ressources en format PDF ou DOC, le format sera spécifié entre crochets devant l'hyperlien.
3 - Occurrences
Suite à l'extrait des ressources, on retrouve entre crochets un lien vers une version du document où les occurrences de vos termes de recherche seront mises en évidence.
4 - Regroupement des domaines
Le moteur de recherche retourne un maximum de 2 résultats pour une même ressource, le deuxième résultat étant indenté par rapport au premier. Le lien entre crochets, sous le deuxième résultat, mène vers d'autres résultats dans le même domaine.
5 - Informations sur la ressource
L’icône permet d’accéder à des informations supplémentaires sur la ressource qui contient vos termes de recherche. Ces informations apparaissent dans un encadré gris.
6 - Description de la ressource
L’information supplémentaire sur la ressource constitue la description associée à cette ressource sur le portail Droit francophone. Elle contient notamment une courte description du contenu du site Web, les catégories auxquelles est associée la ressource, ainsi que la langue du site.
4. Particularités de Phase3
Casse des caractères (majuscules / minuscules)
Phase3 est insensible à la casse des caractères; l'utilisation de lettres majuscules ou minuscules dans la requête n'a aucune influence sur le résultat de la recherche.
Par exemple, en tapant Contrat, on obtient les ressources et les documents qui contiennent contrat, Contrat, ou CONTRAT.
Caractères spéciaux
La version de Phase3 qui se trouve sur ce site supporte la recherche des mots comportant des caractères avec signes diacritiques français (accents, cédille, tréma).
Le trait d'union (-) et l'apostrophe (') peuvent être inclus dans la requête, mais ils ont la même valeur pour Phase3 qu'un espace blanc dans une séquence de termes.
Mots ou caractères réservés à la syntaxe de recherche
Lorsqu'un mot ou un caractère réservé à la syntaxe de recherche (ET, OU, SAUF) se trouve dans la zone de texte, il est interprété comme un opérateur et n'est pas lui-même recherché. Il est à noter que ceux-ci doivent être en lettres majuscules et que vous devez être en mode booléen.
Par exemple, pour la requête "Loi relative à la prévention" ET "à la repression" le mot "et" est considéré comme un opérateur booléen. En conséquence, le moteur ne recherchera pas seulement les ressources qui contiennent l'expression "Loi relative à la prévention et à la repression", mais plutôt toutes celles qui contiennent l'expression "Loi relative à la prévention", ainsi que l'expression "à la repression".
Pour que Phase3 interprète les opérateurs comme des mots ordinaires, ceux-ci peuvent être placés entre guillemets doubles anglais (" "), soit seuls (p. ex. Loi relative à la prévention "ET" à la repression) ou avec d'autres termes (p. ex. "Loi relative à la prévention et à la repression"). Cette technique ne fonctionne toutefois pas avec les caractères génériques.
Le tableau suivant présente les mots ou caractères que Phase3 réserve à la syntaxe de requête et résume leur signification. Ils sont pour la plupart décrits en détail dans les sections suivantes.
Mots ou caractères réservés pour Phase3
| Opérateurs | Signification |
|---|---|
| ET, OU, SAUF | Opérateurs booléens |
| ( ) " " | Caractères permettant de regrouper des mots ou des caractères |
| . ; ^ | | Remplacés par des espaces |
| site: | Retourne les documents qui contiennent le mot de recherche sur le site spécifié |
Quelques exemples :
- taper O N U dans la zone de texte pour trouver O.N.U.;
- taper 7 3 76 pour trouver 7(3.76);
- taper Apotex Inc pour trouver Apotex Inc..
Mots non indexés
Certains mots ne sont pas indexés par Phase3 et ne peuvent en conséquence être recherchés. Les articles, les prépositions ou les pronoms sont considérés trop communs pour que leur indexation présente un intérêt significatif. Les mots réservés à la syntaxe de recherche font aussi partie de ces mots non indexés. Dans la présente version de Phase3, ces mots sont :
- adj, au, aux, avec, car, ce, ces, cet, cette, dans, de, des, du, en, es, est, et, etant, etc, eu, eux, il, ils, la, le, les, leur, lors, lui, ma, mais, me, mes, mon, ne, notre, on, ou, par, pas, pour, puis, puisque, quand, quant, que, quel, quelle, quelles, quels, qui, quoi, sa, sans, sauf, se, ses, si, son, sur, ta, te, tes, ton, tous, tout, tu, un, une, vos, votre, vous;
Recherche dans un domaine spécifique
Cette fonction permet d'inscrire, dans le champ de requête, un terme de recherche suivi de l'adresse URL d'un site répertorié sur le portail. Le moteur recherchera que les documents qui contiennent ce terme sur le site spécifié. Veuillez noter que l'URL peut être écrite avec ou sans le "http://".
Par exemple, la requête "contrat site:www.canlii.org" retournera tous les documents qui contiennent le mot "contrat" sur le site de l'Institut canadien d'information juridique (CanLII).
5. Opérateurs booléens (ET, OU, SAUF)
Note : Ces opérateurs doivent être en lettres majuscules et utilisés conjointement avec le mode booléen.
Rechercher tous les termes (ET)
L'opérateur ET placé entre deux termes, commande au moteur de rechercher les documents qui contiennent à la fois ces deux termes. On obtient les mêmes résultats en utilisant le mode "Tous ces mots".
Par exemple, la requête contrat ET onéreux retournera tous les documents qui contiennent à la fois le mot contrat et le mot onéreux.
Rechercher l'un ou l'autre terme (OU)
L'opérateur OU placé entre deux termes commande au moteur de rechercher les documents qui contiennent l'un ou l'autre de ces termes, ou les deux à la fois. On obtient les mêmes résultats en utilisant le mode "Un de ces mots".
Par exemple, la requête contrat OU onéreux retournera tous les documents qui contiennent le mot contrat, tous ceux qui contiennent le mot onéreux, ainsi que tous ceux qui contiennent à la fois le mot contrat et le mot onéreux.
Exclure un terme de la recherche (SAUF)
L'opérateur SAUF placé devant un terme commande au moteur d'exclure de la recherche les documents contenant ce terme.
Par exemple, la requête contrat SAUF onéreux retournera tous les documents qui contiennent le mot contrat mais sans contenir le mot onéreux.
6. Ordre d'évaluation des opérations dans une requête
Par défaut, Phase3 évalue les opérations de recherche dans l'ordre suivant :
- Recherche d'une séquence de mots;
- Recherche avec l'opérateur booléen OU;
- Recherche avec les opérateurs booléens ET,SAUF.
Pour deux opérateurs du même rang, Phase3 évalue en priorité celui qui se trouve le plus à gauche.
Pour modifier l'ordre d'évaluation par défaut, il est possible de prioriser une opération en la plaçant entre parenthèses. L'effet de la modification de l'ordre d'évaluation des opérateurs est illustré par l'exemple suivant.
La requête débiteur OU insolvabilité SAUF faillite commande à l'outil de rechercher d'abord les documents qui contiennent le mot débiteur seulement, ceux qui contiennent le mot insolvabilité seulement et ceux qui contiennent les deux mots. Parmi ces documents, l'outil de recherche excluera ensuite ceux qui contiennent le mot faillite, si bien que ce mot ne figurera dans aucun des documents retournés.
La requête débiteur OU (insolvabilité SAUF faillite) priorise le retranchement du mot faillite des documents qui contiennent le mot insolvabilité. Il ajoute ensuite aux documents retournés tous ceux qui contiennent le mot débiteur. Contrairement à la requête précédente sans parenthèses, certains documents retournés contiendront le mot faillite.
