PDF’s in de zoekresultaten van Google
De missie van zoekmachine Google is om de informatie die er in de wereld ter beschikking is universeel beschikbaar en bruikbaar te maken. Tijdens deze ambitieuze opdracht stoot Google ook vaak op niet-html bestanden zoals PDF bestanden, spreadsheets en presentaties. Google gaat ook deze bestanden zo snel mogelijk aan een onderzoek onderwerpen om zo de inhoud te indexeren. Maar hoe worden deze bestanden nu precies geïndexeerd en welke richtlijnen gelden er? En wat als ik niet wil dat mijn PDF bestand geïndexeerd wordt? Laten we de meest gestelde PDF index vragen eens bekijken.
Kan Google elk PDF bestand indexeren?
Meestal kan Google inderdaad alle tekstuele inhoud van PDF bestanden indexeren, zo lang de bestanden maar niet beschermd zijn met een paswoord. Over het algemeen geldt dat wanneer de tekst kan gekopieerd en geplakt worden, het ook mogelijk is om hem te indexeren.
Wat gebeurt er met foto’s in een PDF file?
Momenteel gaat Google deze foto’s niet indexeren. Wilt u toch dat ze geïndexeerd worden dan moet u er een afzonderlijke HTML pagina voor aanmaken.
Hoe worden links in een PDF document behandeld?
Over het algemeen worden links in een PDF bestand op dezelfde manier behandeld als links op een HTML pagina. Ze kunnen een invloed hebben op de paginaranking en op andere indexeringsvoorwaarden.
Hoe kan ik voorkomen dat mijn PDF bestand wordt opgenomen of hoe kan ik het verwijderen als het al is geïndexeerd?
De eenvoudigste manier om indexering van een PDF bestand te voorkomen, is door een zogenaamde X-Robots-Tag toe te voegen; noindex in de http header. Als het bestand al is geïndexeerd dan gaat het document na een tijd weer verwijderd worden als u ook weer de X-Robot-Tag met de noindex code gebruikt. Eventueel kan ook de URL Removal tool, die in Google Webmaster tools kan gevonden worden, gebruikt worden.
Kunnen PDF bestanden een hoge pagerank krijgen in de Google zoekresultaten?
Natuurlijk kunnen ze dat. Ze worden op dezelfde wijze geïndexeerd als andere webpagina’s. Hierbij spelen dezelfde pagerankfactoren als bij een HTML pagina een rol.
Wordt het als dubbele content aanzien als ik zowel een HTML als een PDF bestand heb van een bepaalde inhoud?
Waar mogelijk, is het aan te raden om slechts één bestand van een bepaalde inhoud op het Internet te plaatsen. Is dit niet mogelijk zorg er dan voor dat u aangeeft naar welk document uw voorkeur uitgaat door de favoriete URL bijvoorbeeld in uw Sitemap te plaatsen.
Gerelateerde berichten
Het laatste nieuws
- Google Glass mogelijk volgend jaar voor iedereen beschikbaar
- Social networking op computers kende een piek in 2011
- Het nieuwe News Feed design van Facebook: Groter is beter
- Sociale Videodienst Viddy ontslaat een derde van zijn werknemers
- Twitter houdt volgende week geheimzinnig evenement met ontwikkelaars