Indexation et
optimisation
Technique
(SEO)
Présentation réalisée par Jean-Claude Domenget – MCF sciences de
l’information et de la communciation – JCD blog à destination d’étudiants
dans le web.
Diffusable sous licence Creative Commons – by-nc-nd 2.0
1
http://creativecommons.org/licenses/by-nc-nd/2.0/fr/
Les actions de référencement naturel
Principes du référencement SEO
Indexation et optimisation technique
Opti
t m
i i
m s
i ati
t o
i n é
dit
i o
t ria
i le
l
Inscription dans les annuaires, maillage interne et liens entrants
Recherche universelle et derniers moteurs
Mesures d’audience (outils, KPI, tableaux)
2
2010 – Indexation et optimisation technique
JCD blog
Optimiser l’indexation de votre site
Google indexe naturellement votre site.
Vous pouvez néanmoins améliorer l’indexation de votre site :
travailler l’accessibilité pour les robots (fichier robots.txt, fichier
sitemap)
éviter les freins au référencement
3
2010 – Indexation et optimisation technique
JCD blog
Le fichier robots.txt
4
2010 – Indexation et optimisation technique
JCD blog
La syntaxe d’un fichier robots.txt
Ce fichier explique au moteur où il ne doit pas aller, avec l’instruction :
« Disallow » suivie soit d’un répertoire, soit d’un fichier.
Us
U er-
r a
- gent: *
Disallow: /cgi-bin/
Disallow: /tempo/
Disallow: /abonnes/prix.html
+ Depuis 2007, indication
User-agent: Googlebot
de l’adresse du fichier
sitemap dans le fichier
Disallow: /cgi-bin/
robots.txt :
Disallow: /perso/
(user-agent ; disal ow, sitemap (Url))
Disallow: /entravaux/
5
2010 – Indexation et optimisation technique
JCD blog
Créer un fichier robots.txt
Cf :https://www.google.com/webmasters/tools/dashboard?hl=fr
6
2010 – Indexation et optimisation technique
JCD blog
Où placer votre fichier robots.txt
Le fichier texte robots.txt est à placer à la racine du site :
http://monexemple.com/robots.txt
Ou http://premier.monexemple.com/robots.txt
7
2010 – Indexation et optimisation technique
JCD blog
Le fichier sitemap
Fichier Sitemap = plan du site au format xml
Il s’agit de la liste des adresses de vos pages.
4 informations sont distinguées : adresse – dernière modification – fréquence
de
d
e m
ise
i
se à
à jo
j u
o r
u – pr
p io
i r
o it
i é
é d’
d i’n
i d
n e
d x
e a
x t
a io
i n
o .
n
<urlset>
<url>
<loc>http://www.lemechantlipdub.fr/</loc>
<lastmod>2009-04-04</lastmod>
<changefreq>daily</changefreq>
<priority>1</priority>
</url>
Pour plus d’informations,
voir : sitemaps.org
</urlset>
8
2010 – Indexation et optimisation technique
JCD blog
Créer un fichier sitemap
Ex : Cf Création d’un fichier sitemap dans le centre d’aide pour les
webmasters.
Possibilité de
- créer u
n s
it
i e
t ma
m p e
n f
o
f ncti
t o
i n d
u p
roto
t cole
l s
it
i e
t ma
m p ;
- créer un sitemap à l’aide d’un fichier .txt ;
- utiliser un flux RSS/Atom sous forme de fichier sitemap.
Liste de liens d'outils pour créer un fichier sitemap : nouveau générateur de google -
outils tiers - outils pour wordpress - Outils pour Dotclear - ou auditmypc google sitemap
generator
9
2010 – Indexation et optimisation technique
JCD blog
Faire connaître votre fichier sitemap
Google :
utiliser Outils pour les webmasters
Yahoo :
utiliser Yahoo ! Search
10
2010 – Indexation et optimisation technique
JCD blog
Les freins au référencement
Certains choix de programmation constituent des facteurs gênant ou
bloquant au référencement
Les Frames
Le Javascri
r pt
Cf
C La pré
r sentation faite par
r
Les pages trop graphiques
David Degrelle en 2008 à
Montbéliard pp.18 à 34
Le flash
La duplication de contenu
Cf Les obstacles au
référencement (Action-
Les URL exotiques
rédaction)
Les redirections trompeuses
Les techniques de spam (pages satellites, cloaking etc.)
11
2010 – Indexation et optimisation technique
JCD blog
Conseils
L’indexation de flash pose toujours problème. Eviter les sites full
flash sinon fournir un contenu alternatif en swfobject
Les menus déroulants, les pop ups et les contenus AJAX posent
problè
l me
m .
. L
e l
a
l ngage J
ava
v scrip
i t peut
t ê
tr
t e a
ccessib
i le
l e
n v
e
v nant
t e
n
surcouche du HTML
Les moteurs ne savent pas remplir les formulaires. Seuls les
résultats de type GET sont indexables et il faut prévoir une navigation
alternative
Source : cours 4 optimisation
structurelle de Sébastien
Billard pp. 11 à 22
12
2010 – Indexation et optimisation technique
JCD blog
Conseils (2)
Les images doivent être dotées d’un attribut alt pertinent
La duplication de contenu provient de doublons qui peuvent être
éviter notamment par des redirections 301et balise link rel=canonical
Les r
edir
i ecti
t o
i ns doiv
i e
v nt
t ê
tr
t e d
éfi
f n
i it
i i
t v
i e
v s 3
01 e
t
t n
on t
e
t mp
m orair
i es 3
02
Source : cours 4 optimisation
structurelle de Sébastien
Billard pp. 23 à 40
13
2010 – Indexation et optimisation technique
JCD blog
Optimiser techniquement votre site
Précisions
L’optimisation technique est la première étape d’un référencement de
qualité, le socle de votre travail de référencement;
Su
S iv
i r
v ont
t e
nsuit
i e
t ,
, l
’lopti
t m
i i
m s
i ati
t o
i n é
dit
i o
t ria
i le
l (
créati
t o
i n d
’un c
onte
t nu d
e
qualité) et les actions de linking pour améliorer la popularité du site
(actions pour augmenter la visibilité du contenu).
14
2010 – Indexation et optimisation technique
JCD blog
Discussion quant à l’utilité de 4 critères
d’optimisation technique
Balise Title
Texte visible et soin du code (X)HMTL
Ba
B lils
i es m
e
m ta
t
Attribut alt
+ Une technique d’optimisation : l’URL rewriting
15
2010 – Indexation et optimisation technique
JCD blog
Balise TITLE
La balise TITLE est un des critères essentiels d’optimisation SEO
Elle s’affiche comme titre de page dans votre navigateur
Ex : <title>JCD - blog: pre-requis seo - referencement naturel - version 2010</title>
Règles :
Chaque page web possède son titre propre
Ce titre est en relation avec le contenu de la page
Le titre ne doit pas dépasser 69 caractères
16
2010 – Indexation et optimisation technique
JCD blog
Erreurs :
Un seul titre pour toutes les pages
Un titre n’est pas une liste de mots clés
Pas de titres multilingues
Conseils :
créer des pages mono-thèmes – multiplier les pages. Le titre doit
être un résumé de la page (éviter donc les pages multi-thèmes)
17
2010 – Indexation et optimisation technique
JCD blog
Texte visible et soin du code (X)HTML
Le texte visible comprend outre le titre de la page, le contenu textuel
de la page, y compris la légende des images. Autrement dit tout texte
qui n’est pas lissé ou inaccessible au robot.
L’
L opti
t m
i i
m s
i ati
t o
i n t
e
t chniq
i ue d
’une p
age p
asse p
ar l
a
l r
éda
d ctio
i n
o
n d
’
d u
’ n
u
n
code propre
Règles :
Respecter la sémantique des balises (X)HTML (vérification par
Lynx cf cours 4 Sébastien Billard p.8)
Utiliser la balise <H1> pour le titre de l’article et <H2>, <H3> etc.
pour les sous-titres
18
2010 – Indexation et optimisation technique
JCD blog
Utilisation de la feuille de style CSS pour mettre en page, avec les
balises de fonction <div> (positionner un bloc) et <span> (modifier le
style d’une portion de texte).
Mi
M s
i e e
n v
a
v le
l ur d
es m
o
m ts
t c
lé
l s a
ve
v c l
e
l s b
alils
i es d
’in
i dic
i ati
t o
i n <
str
t ong>
>
(moteurs) et <b> (lecteur)
Longueur des articles : si possible supérieur à 200 mots descriptifs
(Olivier Andrieu). Google prend en compte les textes entre 110 et
1320 mots (Maxime Grandchamp).
L’attribut SWF Object pour proposer un contenu texte alternatif à
une animation flash
19
2010 – Indexation et optimisation technique
JCD blog
Erreurs :
Des pages ou des images trop lourdes (100 ko max environ)
Une page ne contenant qu’une animation flash – Nécessité d’avoir
un contenu texte visible et une image
Déto
t urner d
es b
alils
i es.
. U
ti
t liils
i er d
es b
alils
i es d
e m
i
m s
i e e
n v
a
v le
l ur d
u
contenu au lieu de balise sémantique. Ex : <b> au lieu de <strong>
20
2010 – Indexation et optimisation technique
JCD blog
Balise meta description
La balise meta description n’est plus prise en compte pour le
positionnement d’une page web
Elle permet de donner une indication pour le texte descriptif affiché
sous l e
l t
i
t t
i r
t e d
e p
age,
, d
ans l
a
l p
age d
e r
ésult
l a
t ts
t d
es m
o
m te
t urs d
e
recherche (snippet)
Règles :
Chaque page web doit posséder une description propre
La description doit contenir les mots clés visés par la page
La description ne doit pas dépasser 152 caractères
Erreurs : Une desciption n’est pas une liste de mots clés
21
2010 – Indexation et optimisation technique
JCD blog
Balise meta keywords
La balise meta keywords n’est plus prise en compte pour le
positionnement d’une page web
Elle ne peut avoir d’intérêt que pour faciliter l’inscription de votre site
dans d
es a
nnuair
i es
Règles :
Elle contient une liste de mots clés en relation avec la page
Indiquer l’univers sémantique des mots clés visés, les variations de
genre et de personne
22
2010 – Indexation et optimisation technique
JCD blog
Balise meta robots
La balise meta robots est prise en compte par les moteurs
Elle sert à définir des restrictions au robot qui vient scroller vos pages
Les valeurs principales :
noindex, (pas de crawl avec le fichier robots.txt)
nofollow, (ne crawl pas le lien)
noarchive, (pas d’accès à la version cache dans les résultats)
Noodp (descriptif de DMOZ pas pris en compte)
Cf L’article de Webrankinfo sur les balises meta
23
2010 – Indexation et optimisation technique
JCD blog
L’attribut alt de la balise <img>
L’attribut alt permet de proposer un contenu texte alternatif à une
image. Ce contenu texte est pris en compte par les robots pour
identifier les images.
Règle
l s :
Rédiger un texte alternatif court contenant les mots clés visés par la
page.
Erreurs :
Désigner une image par un code passe-partout. Ex : 0001.jpg
24
2010 – Indexation et optimisation technique
JCD blog
L’URL rewriting
La réécriture d’URL permet de modifier les URL exotiques.
Elle n’a pas forcément d’impact sur le positionnement mais sur
l’incitation au clic
Adre
r sse t
yp
y e : typ
y e / genre
r / pro
r duit – voiture
r / monospace / C4
C picasso
25
2010 – Indexation et optimisation technique
JCD blog
Votre CMS est-il “SEO Friendly” ?
Avez-vous la main sur 100% du code HTML généré par votre
solution ?
Pouvez-vous personnaliser le contenu des balises ?
Vo
V tr
t e s
olu
l ti
t o
i n g
énère-t’
t ellle
l d
e l
a
l d
uplilc
i ati
t o
i n d
e c
onte
t nu ?
Utilisez-vous des technologies qui bloquent les moteurs ?
+ Réécriture d’URL, rubricage – navigation, arborescence,
suppression cookies – javascript, erreurs, fichiers et balises
sémantiques, contenus multimédia etc.
Cf : SEO et Joomla ! Comment
tirer le meilleur parti du CMS –
Philippe Yonnet
26
2010 – Indexation et optimisation technique
JCD blog
SEO et Joomla !
Problèmes Joomla / SEO = Réécriture URL, champs manquant,
souplesse structurelle etc.
Plugin SEO = sh404SEF (incontournable) – ensemble avec
Jooml
m a
l !
! M
e
M ilille
l ur q
ue d
es C
MS
M
S r
éputé
t s /
/ S
E
S O
E
URL = pour que URLs deviennent SEF (search engine friendly)
Cf Joomla.org
Templates SEO : code léger, pas
de facteurs bloquant, respect
des balises sémantiques
27
2010 – Indexation et optimisation technique
JCD blog
SEO et blog
Certains CMS offre une aide avantageuse. Matt Cutts a indiqué que
wordpress règle 80 à 90% des aspects relatifs au SEO.
Le guide du référencement de blogs de webrankinfo
(dont
t p
roposer d
es f
l
f u
l x
x R
SS
S
S – arti
t c
i le
l s a
ssocié
i s –
ta
t gs –
bookma
m rks
sociaux)
Et utiliser les plugins qui vont bien avec parcimonie !
28
2010 – Indexation et optimisation technique
JCD blog
Conclusion
L’optimisation technique est le premier maillon d’une stratégie de
référencement. Elle en constitue son socle.
Elle doit faciliter le travail d’indexation des robots.
El
E lle
l f
a
f vo
v ris
i e u
n b
on p
osit
i i
t o
i nneme
m nt
t d
es p
ages s
ur l
e
l s m
o
m ts
t c
lé
l s
visés.
29
2010 – Indexation et optimisation technique
JCD blog
Pour aller plus loin :
Cf les cours de Sébastien Billard – consulant SEO – relevant traffic –
master 2 IDEMM.
Cours 4 : Optimisation structurelle pour le référencement
30
2010 – Indexation et optimisation technique
JCD blog
Jean-Claude Domenget – Maître de conférence 71e section
Enseignant en communication web – DUT SRC Montbéliard
Consultez mon blog : http://enseignantmultimedia.blogspot.com
Abonnez-vous au flux RSS :
http://feeds.feedburner.com/JCD/srcmontbeliard
Suivez mon twitter : http://twitter.com/jcdblog
31
2010 – Indexation et optimisation technique
JCD blog