Greek infotainment community

Το Lateam είναι Ε Ν Α Ν Τ Ι Α σε οποιαδήποτε μορφή Π Ε Ι Ρ Α Τ Ε Ι Α Σ
Facebooktwitter
Επιστροφή   Greek infotainment community > Tech Point > ΤΕΧΝΟΛΟΓΙΚΑ ΝΕΑ-GADGETS

Μηχανές Αναζήτησης και Web Robots

This is a discussion on Μηχανές Αναζήτησης και Web Robots within the ΤΕΧΝΟΛΟΓΙΚΑ ΝΕΑ-GADGETS forums, part of the Tech Point category; Μηχανές Αναζήτησης Γενικά, υπάρχουν δύο ειδών μηχανές αναζήτησης: αυτές που βασίζονται σε κάποιο πρόγραμμα, που συχνά αναφέρεται ως Web Robot ...

Νέο Θέμα  Απάντηση στο θέμα
 
Εργαλεία Θεμάτων Τρόποι εμφάνισης
Παλιά 11-02-2007, 07:31:   #1
aggelos_a
LaTeamer
 
Το avatar του χρήστη aggelos_a
 
Εγγραφή: Nov 2006
Περιοχή: Los Almyros
Μηνύματα: 1.192
Thanks: 13
Thanked 26 Times in 10 Posts
My Mood:
aggelos_a is on a distinguished roadaggelos_a is on a distinguished roadaggelos_a is on a distinguished road
Προεπιλογή Μηχανές Αναζήτησης και Web Robots

Μηχανές Αναζήτησης
Γενικά, υπάρχουν δύο ειδών μηχανές αναζήτησης: αυτές που βασίζονται σε κάποιο πρόγραμμα, που συχνά αναφέρεται ως Web Robot ή Aράχνη (Spider) ή Eρπετό (Crawler), για την δημιουργία των καταλόγων τους, και αυτές που στηρίζονται σε μία συντακτική ομάδα ανθρώπων για την συγκέντρωση, την αξιολόγηση και την κατηγοριοποίηση των ιστοσελίδων. Και στις δύο περιπτώσεις οι ιστοσελίδες, αφού αξιολογηθούν αποθηκεύονται σε μία βάση δεδομένων. Ενα CGI (Common Gateway Interface) πρόγραμμα, γραμμένο συνήθως σε γλώσσα Perl, ή κάποιο άλλο scripting πρόγραμμα που ερμηνεύεται από τον διακομιστή (server) που φιλοξενεί την βάση δεδομένων, διαβάζει τις λέξεις-κλειδιά (keywords) που εισάγει ο χρήστης, ψάχνεί στην βάση δεδομένων, βρίσκει τις αποθηκευμένες ιστοσελίδες που το περιεχόμενο τους ταιριάζει με τις λέξεις-κλειδιά, και επιστρέφει στον χρήστη μία σύντομη περιγραφή, την διεύθυνση της κάθε σχετικής ιστοσελίδας, και ένα σύνδεσμο (link) προς αυτή.
Όταν οι συγγραφείς ιστοσελίδων και οι webmasters αναβαθμίζουν τα sites τους ή τα μεταφέρουν σε άλλη διεύθυνση στο Web, τα Web Robots αναγνωρίζουν τις αλλαγές και αντικαθιστούν τις παλιές με τις νέες ιστοσελίδες αξιολογώντας εκ’ νέου του περιεχόμενό τους.


Πως λειτουργούν τα Web Robots
Τα Web robots είναι προγράμματα που ξεκινώντας από μία αρχική ιστοσελίδα στο Web, βρίσκουν, κατηγοριοποιούν και αποθηκεύουν όλες τις ιστοσελίδες που συνδέονται με link με την αρχική ιστοσελίδα (αρχικό URL). Η αρχική σελίδα είναι ένας κατάλογος από links, μπορεί όμως να είναι και μία σελίδα με πολύ υψηλή επισκεψιμότητα ή ένα portal. Οι δυνατότητες που έχουν τα robots για αναζήτηση και συγκέντρωση πληροφοριών στο Web είναι τεράστιες, ενώ μερικά μπορούν να παίρνουν και αποφάσεις, σχετικά με το περιεχόμενο των ιστοσελίδων που ψάχνουν, βασιζόμενα σε προηγούμενες αναζητήσεις τους.
Υπάρχουν επίσης robots που ανακτούν και αποθηκεύουν ιστοσελίδες δημιουργώντας τα λεγόμενα και αρκετά διαδεδομένα ‘mirror sites’ που διευκολύνουν τους χρήστες να κατεβάσουν γρήγορα και ανέξοδα προγράμματα, αρχεία και παιχνίδια.
Οι λειτουργίες ενός Web robot είναι βασικά δύο:
1)Aναζήτηση: Ακολουθώντας τα links, αναγνωρίζει τις νέες ιστοσελίδες που επισκέπτεται, στη συνέχεια αποφασίζει εάν θα τις διαβάσει ή θα τις απορρίψει και θα συνεχίσει αλλού το ψάξιμο. Εάν αποφασίσει να τις διαβάσει τότε μπορεί να διαβάσει και να αποθηκεύσει ολόκληρη την σελίδα, μαζί με τα συνοδευτικά αρχεία (εικόνες κτλ) ή εναλλακτικά μπορεί να διαβάσει και να αποθηκεύσει ένα μέρος της μόνο (τον τίτλο και τις πρώτες παραγράφους). Υπάρχουν robots που αποθηκεύουν μόνο κάποιες από τις λεγόμενες μετα-ετικέτες (meta tags) που υπάρχουν στις ιστοσελίδες και οι οποίες περιγράφουν το περιεχόμενο της.
2)Κατηγοριοποίηση: Φτιάχνει καταλόγους με τις ιστοσελίδες που αποθηκεύει, αναλύοντας το περιεχόμενό τους. Δημιουργεί έτσι καταλόγους από λέξεις κλειδιά (keywords) που διευκολύνουν τους χρήστες.
Η τεχνική που ακολουθεί το robot στην αναζήτησή του ποικίλει.
Διεξάγοντας την λεγόμενη εκτεταμένη αναζήτηση, το robot ακολουθεί το πρώτο link της αρχικής ιστοσελίδας, ακολούθως επανέρχεται στην αρχική ιστοσελίδα, ακολουθεί το δεύτερο link, και συνεχίζει να κάνει το ίδιο μέχρι να εξαντλήσει όλα τα links της αρχικής ιστοσελίδας. Με αυτό τον τρόπο συγκεντρώνει όλες τις ιστοσελίδες που συνδέονται με link με την αρχική ιστοσελίδα. Ακολούθως επαναλαμβάνει την ίδια διαδικασία, ξεκινώντας τώρα από την σελίδα που συνδέεται με το πρώτο link της αρχικής ιστοσελίδας κ.ο.κ
Υπάρχει επίσης και η λεγόμενη εις βάθος αναζήτηση. Σε αυτή τη περίπτωση το robot ξεκινά από το πρώτο link της αρχικής ιστοσελίδας και το ακολουθεί πηγαίνοντας σε μία νέα ιστοσελίδα όπου και επαναλαμβάνει την ίδια διαδικασία (βρίσκει το πρώτο link και το ακολουθεί). Αυτό το κάνει συνέχεια μέχρι να φτάσει σε κάποιο τερματικό σημείο όπου και σταματά. Ακολούθως επιστρέφει στην προτελευταία σελίδα, βρίσκει το δεύτερο link και το ακολουθεί μέχρι να φτάσει ξανά σε κάποιο τερματικό σημείο όπου σταματά, κάνει πάλι ένα βήμα πίσω, βρίσκει πάλι το δεύτερο link και το ακολουθεί. Η εις βάθος αναζήτηση δημιουργεί καταλόγους ιστοσελίδων που καλύπτουν εκτενώς ένα συγκεκριμένο θέμα (πχ ιατρική) ενώ η εκτεταμένη αναζήτηση δημιουργεί γενικούς καταλόγους ιστοσελίδων, που όμως δεν καλύπτουν λεπτομερώς τα θέματα στα οποία αναφέρονται.

AltaVista vs Google


Οι δύο πιο δημοφιλής μηχανές αναζήτησης στο Web είναι η AltaVista (http://www.altavista.com) και η Google (http://www.google.com). Η πρώτη δημιουργήθηκε το 1995, και ήταν από τις πρώτες μηχανές αναζήτησης που χρησιμοποίησαν τα Web Robots για την δημιουργία των καταλόγων τους. Η AltaVista (Alta Vista σημαίνει θέα από ψηλά) κυριάρχησε στο Web για περισσότερα από δυόμισι χρόνια, για να παραχωρήσει την θέση της στην Google, η οποία τα τελευταία δυόμισι χρόνια είναι με διαφορά η πιο δημοφιλής και περισσότερο χρησιμοποιούμενη μηχανή αναζήτησης από τους χρήστες του Web παγκοσμίως. Η Google δέχεται καθημερινά 150 από τις συνολικά 375 εκατομμύρια αναζητήσεις, ενώ οι κατάλογοί της, οι οποίοι ανανεώνονται συνεχώς, περιέχουν περισσότερα από 2 δισεκατομμύρια websites. Τον τελευταίο καιρό ωστόσο, η AltaVista προσπαθεί να επανέλθει (έχει αλλάξει και τον λογότυπό της όπως μπορείτε να δείτε) χρησιμοποιώντας τεχνολογία αιχμής, που της επιτρέπει να αξιολογεί και να ανανεώνει κάθε 24 ώρες το 50% περίπου των αποθηκευμένων εγγράφων της.
Ο χρήστης aggelos_a δεν είναι συνδεδεμένος   Απάντηση με παράθεση
Sponsored Links
Απάντηση στο θέμα

Bookmarks

Εργαλεία Θεμάτων
Τρόποι εμφάνισης

Δικαιώματα - Επιλογές
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is σε λειτουργία
Τα Smilies είναι σε λειτουργία
Ο κώδικας [IMG] είναι σε λειτουργία
Ο κώδικας HTML είναι εκτός λειτουργίας


Παρόμοια Θέματα
Θέμα Δημιουργός Forum Απαντήσεις Τελευταίο Μήνυμα
Μηχανές που εναρμονίζονται τέλεια! Κατερίνα VIDEO POINT !!!!!!!!! 1 06-09-2008 10:46:
Νέα Μηχανή Αναζήτησης, ManagedQ antonis SOFTWARE 0 29-02-2008 12:34:
Μηχανές Αναζήτησης ilias ΧΡΗΣΙΜΑ LINK 5 01-04-2007 13:19:
Ψηφιακές μηχανές σε κίνδυνο ilias ΔΙΕΘΝΗ ΝΕΑ 0 14-12-2006 00:21:
Η νέα επαναστατική Μηχανή Αναζήτησης. master ΕΛΛΑΔΑ 0 19-11-2006 06:31:


Όλες οι ώρες είναι GMT +2. Η ώρα τώρα είναι 21:59:.


Powered and Developed by Lateam.gr
Forum engine powered by : vBulletin Version 3.8.5
Copyright ©2000 - 2017, Jelsoft Enterprises Ltd.
Content Relevant URLs by vBSEO 3.5.1
Lateam