Recherche rapide : Avancée

 

Vous êtes ici : Accueil > Articles > Recherche indexée avec TYPO3 > Recherche indexée avec TYPO3 (suite)

Configuration du crawler

Indiquez tout d'abord les lignes suivantes dans le TSconfig de votre gabarit TYPO3 (propriétés de la page). Ces paramètres sont très importants !

tx_crawler.crawlerCfg.paramSets {

language = &L=[|_TABLE:pages_language_overlay;_FIELD:sys_language_uid]
language.procInstrFilter = tx_indexedsearch_reindex, tx_cachemgm_recache
language.baseUrl = http://www.typo3journal.info/

tt_news = &tx_ttnews[tt_news]=[_TABLE:tt_news;_PID:191]
tt_news.procInstrFilter = tx_indexedsearch_reindex, tx_cachemgm_recache
tt_news.cHash = 1
tt_news.pidsOnly = 190

}

Explications

La 1ère ligne est conventionnelle. Elle demande la réindexation et la mise en cache des données. Ensuite, les lignes suivantes concernent l'indexation de tt_news.

[_TABLE:tt_news;_PID:191] où 191 est le dossier système de stockage de tt_news

tt_news.pidsOnly = 190 où 190 est l'id de la page d'affichage d'une seule news (single news)

Ainsi, nous allons même indexer les news de notre site. Cependant, l'indexation ne fonctionne que pour les pages en cache. Veillez donc à vous assurer de la mise en cache des news de tt_news sur votre site. Voici la ligne à placer dans le Setup :

# Active le cache des news (indexed_search)
plugin.tt_news.allowCaching = 1

La configuration du crawler au niveau de notre template est terminée ; passons à indexed_search.

Configuration d'indexed_search

Par défaut, indexed_search, même après son installation, n'indexera aucun site. Il faut préciser le ou les sites à indexer. Allons-y ! Insérez les lignes suivantes dans la partie 'constantes' votre gabarit TYPO3.

# Configuration d'Indexed search
plugin.tx_indexedsearch {

search.rootPidList = 68 // page d'accueil
show.resultNumber = 1 // affiche le numéro des résultats
}

Comme vous le voyez, on indique la 1ère page du site. Vous pouvez également ajouter d'autres branches pour l'indexation. Les id doivent être séparés par des virgules.

J'ai rajouté une autre option : show.resultNumber = 1
Ceci permet d'afficher le nombre de résultats pour chaque recherche.

Show.advancedSearchLink = 0 désactive le lien vers la recherche avancée. Je préfère conserver le lien (par défaut, l'option est activée).

Pour la partie setup, une seule ligne nous intéresse (j'en rajoute une autre sur l'indexation des fichiers dans fileadmin).

# Activation de l'indexation du site
page.config.index_enable = 1

# Indexer des documents MS Word, PDF (ici option désactivée)
page.config.index_externals = 0

Indexation des pages

Si vous revenez sur la page créée précédemment dans le dossier système, vous verrez le champ Session ID à , ce qui signifie qu'aucune indexation ne sera lancée.

Le schéma est simple :

Indexation par le crawler -> Lancement d'indexed_search ensuite

Allez dans le module Web -> Info puis sélectionnez "Site Crawler".

3 options sont accessibles :

Start Crawling récupère l'ensemble des pages à indexer
Crawler log affiche des informations sur les pages à indexer
CLI status

La CLI (Interface en ligne de commande ou Command Line Interface) permet de lancer le crawler manuellement. Vous serez donc obligé de paramétrer un service cron pour lancer régulièrement le robot.

Les derniers articles à consulter :

Afficher une page 404
Comment créér une page non trouvée (404) sous TYPO3

TYPO3 et le e-Commerce (1ère partie)
Quelle extension utiliser pour faire du e-Commerce avec TYPO3 ?

Felogin, la newloginbox intégrée (TYPO3 v 4.2)
Felogin remplace l'extension newloginbox et offre la possibilité d'offrir une boite de connexion pour protéger l'accès à certaines pages.