Hoe Google werkt
Voordat u kunt begrijpen hoe Google werkt, hebt u waarschijnlijk moet een idee hebben van hoe het internet werkt. Wanneer u een website bezoekt, wordt uw browser daadwerkelijk contact opneemt met een webserver, een computer wiens taak het is om webpagina's te leveren. Dus wanneer u klikt op een link, uw browser contact op met de server en zegt: "Stuur me deze pagina." De server heeft het verzoek en stuurt de pagina naar de browser, die zij geeft op uw computer. Notice Server Een computer wiens taak het is om een gespecialiseerde taak uit te voeren en informatie te leveren. Bijvoorbeeld AWeb server serveert websites, terwijl een e-mail server stuurt of ontvangt e-mail. Oke, nu heb je dat de fundamentele achtergrond neer, laten we eens kijken hoe Google werkt. In enkele zeer fundamentele manier, Google werkt net als andere zoekmachines. De basishandelingen zijn precies hetzelfde. Net als alle andere zoekmachines, is Google bestaat uit drie delen:
Notice Search engine Een site waarmee je op het web zoeken. The SpiderDe spin deel van de Google-zoekmachine is een geautomatiseerd stukje software, ook wel een robot, dat de verzoeken vele duizenden pagina's van honderden websites tegelijk. Als het links op de pagina's vindt, volgt hij deze, en verzoekt deze ook. De belangrijkste is de Google spider GoogleBot, en het in wezen kruipt op het web een keer per maand. Uiteraard veel sites veranderen meer dan eens per maand, en dus Google heeft ook een crawler genoemd FreshBot dat pagina's doorzoekt voortdurend. De IndexerDe spinnen verzenden van informatie over alle pagina's vinden ze naar de indexeerfunctie deel van de zoekmachine. De indexeerfunctie doet dan een pretty amazing jobit creëert een index van elk woord op elke pagina die haar door de Google spider. Niet alleen index elk woord en elke URL, houdt het ook een record van waar elk woord is op elke pagina. Meerdere exemplaren van deze index worden gehouden op de verschillende Google-servers. Een enkele server zou niet in staat zijn bij te houden met alle zoekopdrachten die worden gedaan. De Query EngineHet enige onderdeel van Google die je ziet is de query-engine, en u ziet slechts een deel van dat. Het is het publieke gezicht van Googlethat uitnodigende zoekvak op de top van Google-pagina's. Wanneer u een zoekterm, een Google-webserver stuurt uw verzoek naar de indexeerfunctie, die is gehuisvest op meerdere servers indexeren. De index servers kijken via de index en overeenkomen met wat zij vinden met uw verzoek. De index server stuurt vervolgens die informatie te documenteren servers, die de juiste informatie en de vorm te halen, zodat uw browser kan begrijpen. Dat geformatteerde informatie wordt vervolgens verstuurd naar uw browser. En het gebeurt allemaal in een fractie van een seconde. Google's Special SauceAl deze zoekmachine logica is niet nieuw of revolutionair. Deze technologie bestaat al jaren, lang voordat Google was een glimp in de ogen van de oprichters. Waarom is Google zo goed in wat het doet? Google maakt gebruik van algoritmen beter dan enige andere zoekmachine, en voortdurend verfijnt ze. Algoritmen zijn sets van regels voor het uitvoeren van een bepaalde taak. In het geval van Google, zijn de algoritmen verantwoordelijk voor het nemen van uw zoekopdracht en beslissen welke resultaten laten zien. Notice Algoritme Een set van regels voor het uitvoeren van een taak. In het geval van Google, algoritmen zijn wat bepaalt welke pagina's het zegt overeenkomen met uw zoekopdracht verzoeken. Google's algoritmen zijn niet bijzonder makkelijk voor gewone stervelingen te begrijpen, ze veranderen de hele tijd, en ze zijn niet openbaar gemaakt. Google maakt gebruik van meer dan 100 factoren in zijn algoritmen. Voor elke zoekopdracht die u doet, van mening dat al deze factoren en vervolgens berekent een score voor elke mogelijke matching pagina. De pagina met de hoogste score is het eerste zoekresultaat. De pagina met de tweede hoogste score is de tweede zoekresultaat, en zo verder. Enkele van de statistieken zijn vrij obviousthe zoekterm moet worden weergegeven op een pagina, bijvoorbeeld. Google's algoritmen ook factor in het aantal keren dat het woord wordt weergegeven op een pagina, of de term voorkomt op een prominent onderdeel van een pagina, ongeacht of deze voorkomt in de titel van een pagina, en vele andere factoren. Niets van dit alles is bijzonder revolutionair, hetzij. Veel zoekmachines hetzelfde doen. Google's echte schittering is het inzetten van de collectieve intelligentie van het web om erachter te komen wat er echt relevant, in plaats van enkel te vertrouwen op dit soort regels. Google geeft ook een veel gewicht aan het aantal en de aard van pagina's die linken naar een webpagina. Bijvoorbeeld, Google figuren die als een webpagina veel sites met links naar het heeft, is de kans heel goed zijn dat de pagina is een belangrijke. En als belangrijke sites een koppeling naar die pagina, het is nog belangrijker. Dus Google berekent een page rank voor elke pagina, en die pagina rang wordt een zeer belangrijk onderdeel van de berekening ook. Bijvoorbeeld, heb je een zoekopdracht, en Google vindt uw zoekterm vijf keer op een pagina waarop nauwelijks pagina's verwijzen, maar drie keer op een pagina (zoals op de New York Times-website) dat veel sites met links naar het heeft. De belangrijkste pagina (de New York Times pagina) verschijnt hoger op de lijst met zoekresultaten, hoewel de zoekterm verschijnt op het minder vaak. een artikel afkomstig van Simon Brown
|
|||||
|