Βlogle: άλλη μια CSE για μπλογκ

ΜΠΛΟΟΓΚΛ. Ψάξε τα ελληνικά blogsΗ δημιουργία Google CSE’s για μπλογκ συνεχίζεται και φαίνεται πως ο καθένας ανεβάζει κι από λίγο τον πήχυ.
Μετά τα blogz.gr, gelo.gr και  την μηχανή του daremon, έρχεται το Μπλοογκλ από το cosmix.org.
Τι προσθέτει; Δυο πράγματα:

1. Στη λίστα των μπλογκ του mpouligator που χρησιμοποιεί, όπως κι ο daremon, προσθέτει κι άλλα μπλογκ από ιδία συγκομιδή. Βέβαια ο συνολικός αριθμός που αναφέρει ο mpouligator αυτή τη στιγμή (15.908) είναι μεγαλύτερος από αυτό που αναφέρεται στο Μπλοογκλ (15720) αλλά αυτό μπορεί να είναι απλώς λάθος πληροφορία στην πρώτη σελίδα της μηχανής αναζήτησης. Υπάρχει δε κι η υπόσχεση ότι στο μέλλον θα μπορούν να προτείνουν κι οι χρήστες της μηχανής αναζήτησης νέα μπλογκ.

2. Έρχεται με ένα plugin για IE7 ή Firefox 2.x που προσθέτει το Μπλοογκλ στις μηχανές αναζήτησης του browser. Ωραίο αυτό!

Πάντως, επειδή υπάρχει πια η διαθέσιμη λίστα του mpouligator κι η δυνατότητα των CSE από το Google, εύκολα θα δούμε κι άλλες τέτοιες προσπάθειες. Γι αυτό ρίχνω την ιδέα, κι ας μου απαντήσουν οι των CSE: Μήπως να φτιάχναμε μια κανονική μηχανή αναζήτησης για τα ελληνικά μπλογκ; Υπάρχει κώδικας σε μορφή open source. Ενδιαφέρεται κανείς;

10 thoughts on “Βlogle: άλλη μια CSE για μπλογκ

  1. cosmix

    Πρώτα απ’όλα ευχαριστώ πολύ για την αναφορά! Ο αριθμός πηγών στην αρχική σελίδα του ΜΠΛΟΟΓΚΛ ανανεώνεται περιοδικά.

    Στην ερώτησή σου: Όχι μια custom search engine δεν ενδέχεται να έχει καλύτερα αποτελέσματα από μια Google CSE. Αυτό είναι και το νόημα. Ειδάλλως θα χρησιμοποιούσαμε τις μηχανές των aggregators. Προσωπικά θεωρώ πως αργά ή γρήγορα το πρόγραμμα των CSEs θα εξελιχθεί αρκετά ώστε να επιτρέψει πρακτικά απεριόριστες λειτουργίες από τρίτους. Συμφωνώ πως θα ήταν ιδιαίτερα ευχάριστο εαν υπήρχε ανοιχτό λογισμικό που να προσέγγιζε (έστω και στο ελάχιστο) την απόδοση των αλγορίθμων του Google ώστε να μη εξαρτώμαστε από υπηρεσίες τρίτων αλλά δυστυχώς κάτι τέτοιο δεν υπάρχει — απ’όσο γνωρίζω.

    Τέλος μια μικρή παρατήρηση: είναι μέρος του netiquette εδώ και πάρα πολλά χρόνια, όταν παραθέτεις μια εικόνα από κάποιον τρίτο ιστότοπο (με κάποιες εξαιρέσεις: βλ. τα γραφικά μπάνερς) αφού πρώτον ζητήσεις άδεια για τη προβολή της, να την μεταφέρεις στον δικό σου χώρο και να μην βάζεις απλά αναφορά στην αρχική εικόνα στον διακομιστή απ’όπου τη παίρνεις. Προφανώς στη προκειμένη περίπτωση δε με ενοχλεί ιδιαίτερα, καθώς το άρθρο σου προβάλλει τη σελίδα μου — και σ’ευχαριστώ γι’αυτό — όμως πιστεύω πως είναι βασικό λάθος που κάνει αρκετός κόσμος. Επιπλέον, λόγω περιορισμών στο htaccess η εικόνα αυτή (που δείχνει τις μηχανές αναζήτησης του Firefox) μάλλον δε θα φαίνεται σε όσους δε την έχουν ήδη στη cache. Ίσως θα ήθελες να την αντιγράψεις στον δικό σου server. 🙂

  2. nikan

    @cosmix Ομολογώ ότι βλακωδώς το θέμα htaccess δεν το είχα σκεφτεί. Αναρωτιέμαι πόσες άλλες περιπτώσεις τέτοιες έχουν τα ποστ μου 🙁
    Ανέβασα το screenshot στο server μου.

    Για το ζήτημα netiquette, θα αναφέρεσαι σε κάποια συνήθη πρακτική που επίσης αγνοούσα, γιατί απ’ όσο θυμάμαι, εδώ δεν λέει τίποτα σχετικό. Εννοώ βέβαια ότι δε μιλάμε για υλικό με copyright και δεν φαντάστηκα ότι θα θεωρούσες τέτοιο ένα screenshot, αν και από νομική άποψη έχεις κάθε λόγο να το θεωρείς. Απολογούμαι αν σε έθιξα με κάποιο τρόπο.
    Για το ζήτημα της μηχανής αναζήτησης, επειδή είναι και μια συζήτηση που είχα offline με τον Daremon, το ερώτημα είναι θέλουμε κάτι με Google Pagerank όταν ψάχνουμε στα μπλογκ; Δηλ. ψάχνουμε για την πιο relevant απάντηση; Ή ψάχνουμε για το που συζητιέται ένα θέμα; Γιατί βασικά στα μπλογκ το κυρίαρχο ερώτημα είναι αυτό. Δεν ζητάμε απαντήσεις με authority. Ζητάμε να δούμε ποιος μιλάει για τι. Αυτό δεν το λέω θεωρητικά μόνο. Το λέω κι από τις αναζητήσεις στο Technorati ή στο Blogsearch που χτυπάνε το μπλογκ μου, όπου φαίνεται ότι στην πλειονότητα των περιπτώσεων τέτοια είναι η πρόθεση του αναζητούντος. Αν είναι έτσι, δεν χρειάζεται pagerank. Χρειάζεται κάποιας μορφής ordering, ημερολογιακό βασικά, αλλά κι ανα μπλογκ κτλ. Και υπάρχουν open source μηχανές που το παρέχουν. Παρεπιπτόντως, οι aggregators δεν έχουν μηχανή αναζήτησης, αλλά λειτουργία αναζήτησης. Ακόμα κι αυτή όμως, υπό προϋποθέσεις, θα έκανε τη δουλειά της.

  3. cosmix

    Όχι αλλοίμονο δε με έθιξες καθόλου, απλώς θεώρησα σωστό να το αναφέρω. Όπως είπα, δεν είχα ιδιαίτερο πρόβλημα — τα banners π.χ. του ΜΠΛΟΟΓΚΛ τα διαθέτω από το δικό μου σάιτ, όπως θα είδες και από το snippet που παρέχω. Απλά είναι επικίνδυνο τόσο για σένα όσο και για αυτόν που παρέχει κάποιο περιεχόμενο (εικόνες, βίντεο, ήχο) και για πολύ κόσμο θεωρείται κλοπή (bandwidth, πληροφορίας κλπ) και δεν εκτιμάται. Το RFC που μου παρέθεσες είναι αρκετά παλιό (1995;) ώστε να καλύπτει κάτι τέτοιο. Ψάξε για hotlinking, inline linking κλπ. Γενικότερα υπάρχει μεγάλο θέμα με το deep linking και παρ’ότι υποστηρίζω την ελευθερία του deep linking στον ιστό, πιστεύω πως το θέμα των αρχείων όπως εικόνες κλπ. θέλει ιδιαίτερη προσοχή.

    Στο προκείμενο τώρα. Διαφωνώ με την άποψη πως το PageRank δε μας κάνει. Πρώτον το Google δε χρησιμοποιεί (αποκλειστικά) PageRank όπως πιστεύει πολύς κόσμος — δηλαδή τον αλγόριθμο που παρουσιάζεται στη διάσημη δημοσίευση του 1998. Θεωρώ πως όταν ψάχνεις για κάτι θέλεις να έχεις authority-based ranking ιδιαίτερα επειδή σε κάποια θέματα συμμετέχει πολύς κόσμος και αυτό καθιστά αρκετά δύσκολη την αναζήτηση χρήσιμης πληροφορίας. Εκεί που έχεις δίκιο είναι πως οι αλγόριθμοι του Google ίσως να μην αρμόζουν απολύτως για αναζήτηση σε blogs — να δίνουν δηλαδή λανθασμένο βάρος. Πιθανόν, όμως δε μπορώ να δω πως μια απλή μηχανή που παραθέτει δεδομένα με χρονολογική σειρά ή ομαδοποίηση ανα μπλόγκ αποτελεί καλύτερη λύση. Μάλλον πολύ χειρότερη μου φαίνεται. Προφανώς αν αυτό είναι το ζητούμενο δε χρειάζεται καν να γίνει λόγος για ‘open source’ μηχανές: γράφουμε μια και μόνοι μας.

    Τώρα, η διαφορά που εκλαμβάνω μεταξύ της μηχανής αναζήτησης και της λειτουργίας αναζήτησης είναι — κατα βάση — εαν λάβουμε υπ’όψην μας τον (απλοϊκό) αλγόριθμο παράθεσης και επιλογής πληροφορίας που περιγράφεις οι crawlers; Εαν ναι, τότε θα διαφωνήσω και πάλι καθώς αν δε κάνω λάθος ο mpouligator πρέπει να κάνει crawl ή τουλάχιστον harvest links από blogrolls κλπ. Δε διακρίνω με άλλα λόγια ιδιαίτερη διαφορα περαν αυτής της ικανότητας που έχει το Google να επεξεργάζεται και να παρουσιάζει ‘καλύτερα’ τα δεδομένα που έχει στη διάθεση του.

    Ας σημειωθεί πως το sites όπως το technorati κ.ο.κ. κάνουν χρήση authority βάσει ενός πρώιμου αλγορίθμου τύπου PageRank.

    Όπως και να έχει, προφανώς θα παρακολουθώ τις εξελίξεις και εαν δω πως υπάρχει ανάγκη, λόγος και — προ πάντων — χρόνος, ίσως κοιτάξω παραπάνω τη πρόταση σου. Προς το παρόν πιστεύω πως το Google CSE είναι μια καλή λύση — έστω κι με τους αρκετούς περιορισμούς που συνεπάγεται.

    Και πάλι ευχαριστώ για τη προβολή.

  4. nikan

    @cosmix Ευχαριστώ για τις υποδείξεις στο linking.Θα το ερευνήσω γιατί μ’ ενδιαφέρει.
    Για να μη θεωρητικολογούμε για τις μηχανές αναζήτησης, εσύ, όταν χρησιμοποίησες τελευταία φορά μηχανή αναζήτησης στα μπλογκ, τι έψαχνες να βρεις; Εγώ ΠΑΝΤΑ ψάχνω να βρω που συζητιέται τι, πόσα ποστ έχουν αναφορά σε μια λέξη, πόσα έχουν ένα tag, πόσα ανέβηκαν σε συγκεκριμένη ημερομηνία κτλ. Ποτέ δεν έκανα μια αναζήτηση στα μπλογκ για να βρω απάντηση σε ένα θέμα, αναζήτηση ενός όρου π.χ. Δεν νομίζω ότι θα βρεις την καλύτερη απάντηση άλλωστε στα μπλογκ.
    Τα μπλογκ είναι συζητήσεις. Κι οι αναζητήσεις που τα αφορούν, σαν αναζητήσεις επί συζητήσεων πρέπει να αντιμετωπίζονται.
    Στο βαθμό που ένας aggregator χρησιμοποιεί crawler , όπως ο mpouligator, είναι μηχανή αναζήτησης. Νομίζω η πλειονότητα δεν χρησιμοποιεί όμως.
    Όταν χρησιμοποιεί κανείς την αναζήτηση στους aggregators, έχει τεράστιους περιορισμούς αυτή τη στιγμή. Βασικά το μόνο που μπορεί να κάνει είναι να ψάξει λέξη ή φράση κλειδί, με κάποιοες μικρές παραλλαγές ανά aggregator. Δεν υπάρχουν λογικοί τελεστές, cut off σε ημερομηνίες, συνδιαστικές αναζητήσεις του τύπου πoια ποστ έχουν το tag ταδε και τη λέξη δείνα κ.α.
    Εμένα, έχοντας σα θεματικό αντικείμενο τη μπλογκόσφαιρα, αυτά μου λείπουν έντονα. Κάθε φορά αναγκάζομαι να κάνω ένα νοητικό πάντρεμα του τι επιστρέφει το technorati και τι το blogsearch για να σχηματίσω μια άποψη. Αλλά πόσο και πως μπορείς να το κάνεις αυτό όταν τα απότελέσματα είναι εκατοντάδες; Τεσπα, αν βρω το χρόνο, μπορεί το ξεκινήσω έστω και μόνος

  5. cosmix

    Διαβάζωντας την απάντησή σου διακρίνω πως επαναλαμβάνεις τη λέξη ‘πόσα’. Και ακριβώς αυτό είναι το προκείμενο κατα την άποψή μου. Το ‘πόσα’ το έχουμε (βλ. tag clouds’) και μέσω του πόσα και το πού.

    Αυτό που μου έλειπε — και δεν διατείνομαι πως το έχω βρεί απλώς θεωρώ πως έχω μια καλύτερη εικόνα πλέον — ήταν το “Τι απ’όλα”. Τα μπλόγκς είναι πάρα πολλά και ο χρόνος μου πολύ λίγος. Όμως από το 2001 (που πρωτοέφτιαξα ένα ‘μπλόγκ’ με την έννοια που το εννοούμε στις ημέρες μας) μέχρι σήμερα παρατηρώ πως ολοένα και μεγαλύτερο μέρος της πληροφόρησης και της ενημέρωσης μου γίνεται μέσα από αυτά. Δε συμφωνώ λοιπόν με το ότι ‘δε θα βρείς τη καλύτερη απάντηση άλλωστε στα μπλόγκ’. Πολλές φορές όχι. Κάποιες φορές θα τη βρείς όμως. Και τότε θα θέλεις να μπορείς να ψάξεις και να μην χρειάζεται να περάσεις από χιλίαδες σελίδες μέχρι να βρείς τη μία που αξίζει. Το φιλτράρισμα και επεξεργασία της πληροφορίας αποτελεί ίσως τη βασική πρόκληση του Web 2.0 — και τον λόγο ύπαρξης του 3.0 🙂

    Για να το θέσω σε μια πιο πρακτική βάση: πες πως μετά τις πυρκαγιές του Ιουνίου ήθελες να διαβάσεις για το θέμα. Το αναφέρω γιατί είναι ένα θέμα για το οποίο έγραψαν *όλοι*. Πες πως ψάχνεις για ‘Πάρνηθα’, ή για ‘Πήλιο’ ή για ‘Πυρκαγιά’, ή συνδυασμούς. Μέσα σε όλα αυτά τα άρθρα, τις διαμαρτυρίες, την έκθεση θλίψης, απογοήτευσης, απόγνωσης κλπ κλπ. ίσως υπάρχουν κάποια με μικρότερη εντροπία, από ανθρώπους που είτε γνωρίζουν λόγω επαγγέλματος (όπως π.χ. τα άρθρα περι ιατρικής που γράφει ο Αzrai στο σπιτάκι) είτε έχουν καθήσει και μελετήσει με κάποιο θέμα και εκφράζουν μια πιο πλούσια και ακριβή σε πληροφορία άποψη. Πες πως γράφει ένας πυροσβέστης ή ένας εθελοντής που τις έζησε. Ή ένας δικηγόρος του Υπουργείου Γεωργίας που παραθέτει τη νομική πλευρά. Ή ένας δήμαρχος. Αυτά τα άρθρα — κατα την άποψή μου — αξίζουν πάρα πολύ ώστε να χάνωνται μέσα στο πλήθος των άλλων. Εκεί έγκειται και η ανάγκη ύπαρξης των μηχανών αναζήτησης. Ίσως πιστεύεις πως αυτά τα άρθρα εαν αξίζουν θα έρθουν στην επιφάνεια μέσω {ping,track}backs, αναφορών, social bookmarking κλπ. Δυστυχώς — παρ’ότι θα ήθελα να συμφωνήσω — αυτό σπανίως συμβαίνει.

    Προφανώς το παράδειγμα μου είναι ελλειπές και ίσως πολύς κόσμος να μην ενδιαφέρεται για κάτι τέτοιο. Παρ’όλα αυτά θεωρώ πως αξίζει να υπάρχει κάτι καλύτερο από μια απλή χρονολογική παράθεση του τι συμβαίνει — και πάω και ένα βήμα παραπέρα: θεωρώ πως αυτή η απλή χρονολογική παράθεση είναι απολύτως άχρηστη όταν μιλούμε για χιλιάδες blogs ό,τι και να θέλεις να κάνεις με αυτά.

    Τώρα, συμφωνώ πως οι περισσότεροι aggregators δεν κάνουν crawl και κατα συνέπεια με τη διαφοποίηση που έκανες. Απλώς ήθελα να θίξω το θέμα της επεξεργασίας σε αντίθεση με την απλή παράθεση.

    Σχετικά με τους περιορισμούς στους aggregators συμφωνώ αλλά κάτι τέτοιο θα ήταν εύκολο να διορθωθεί δεδομένης της δομής της πληροφορίας: οι βάσεις δεδομένων παρέχουν τη δυνατότητα ούτως ή άλλως. Εαν σε πρωτίστως σε ενδιαφέρει η επιλογή λογικών τελεστών και χρονικού περιορισμού η δική μου άποψη θα ήταν να το προτείνεις στους μεγάλους aggregators — έχουν ήδη πολλή πληροφορία αποθηκευμένη και άμεσα διαθέσιμη.

  6. nikan

    @cosmix Ενδιαφέρουσα συζήτηση. Τα παίρνω στα γρήγορα:
    Προφανώς οι αφετηρίες μας είναι διαφορετικές.
    Ναι, βασικά εμένα το ενδιαφέρον μου είναι ποσοτικό.Τα tags δεν αρκούν γιατί δεν χρησιμοποιούνται συστηματικά (νομίζω μόνο το 35% χρησιμοποιεί tags) και δεν χρησιμοποιούνται με ομοιομορφία και συνέπεια.Επίσης δεν νομίζω ότι υπάρχει μηχανή αναζήτησης που να ανασύρει πρώτα το ποιοτικό. Τι σημαίνει αυτό άλλωστε; Και το Google με ποσοτικά στοιχεία ιεραρχεί. Θα ήμουν πολύ περίεργος να δω, ας πούμε, τις περιπτώσεις γιατρός δασονόμος πυροσβέστης κτλ να έρχονται ψηλά στην αναζήτηση.
    Έχω μια ασαφώς διαμορφωμένη άποψη ότι στη μπλογκόσφαιρα δεν υπάρχει authority. Όχι γιατι κάποιοι δεν ξέρουν περισσότερο από κάποιους άλλους τι λένε, αλλά γιατί δεν είναι αυτός ο σκοπός. Κι εγώ θα ήθελα να βρω ένα τρόπο που να αναδεικνύει τα πιο ενδιαφέροντα για μένα πράγματα, αλλά τότε μάλλον θα έπρεπε να βάλω και το μυαλό μου στον αλγόριθμο 😀

    Όσο για τους aggregators το έχω ήδη ζητήσει/προτείνει αλλά με δεδομένο ότι όλοι στον ελεύθερο χρόνο τους μας παρέχουν ότι μας παρέχουν, δεν έχω απαιτήσεις να εισακουστώ πάραυτα. Μακάρι να γίνει…

  7. cosmix

    Τα tags δεν αρκούν γιατί δεν χρησιμοποιούνται συστηματικά (νομίζω μόνο το 35% χρησιμοποιεί tags) και δεν χρησιμοποιούνται με ομοιομορφία και συνέπεια.

    Συμφωνώ και συμφωνώ. 🙂

    Επίσης δεν νομίζω ότι υπάρχει μηχανή αναζήτησης που να ανασύρει πρώτα το ποιοτικό. Τι σημαίνει αυτό άλλωστε; Και το Google με ποσοτικά στοιχεία ιεραρχεί.

    Ο λόγος επιτυχίας του Google (ως μηχανή αναζήτησης, όχι εμπορικά) είναι πως επιχειρεί (και καταφέρνει σε κάποιο βαθμό) να αποσπάσει μετρικές ποιότητας από αυτές της ποσότητας. Οι περιπτώσεις γιατρός, δασονόμος, πυροσβέστης ίσως είχαν καλύτερο ranking επειδή θα έγραφαν περισσότερο συνολικά για σχετικά θέματα (λεξικολογικά) και η μηχανή θα τους απέδιδε μεγαλύτερο βάρος για παρεμφερείς όρους.

    Έχω μια ασαφώς διαμορφωμένη άποψη ότι στη μπλογκόσφαιρα δεν υπάρχει authority.

    Γενικό, απόλυτο authority όχι. Όμως υπάρχουν competencies όπως στη κοινωνία.

    Κι εγώ θα ήθελα να βρω ένα τρόπο που να αναδεικνύει τα πιο ενδιαφέροντα για μένα πράγματα, αλλά τότε μάλλον θα έπρεπε να βάλω και το μυαλό μου στον αλγόριθμο

    Όχι απλώς χρειάζεσαι μια μηχανή αναζήτησης που να μπορεί να ταυτίσει (όσο αυτό γίνεται) τους όρους που περιγράφουν αυτό που σε ενδιαφέρει με σελίδες που το περιέχουν αυτή τη στιγμή, ή έχουν ιστορικά σαφείς και κοινώς αποδεκτές αναφορές αυτού 🙂

    Βρίσκω κι εγώ αρκετά ενδιαφέρουσα τη συζήτηση και το θέμα. Ίσως κάποια στιγμή να τη συνεχίσουμε εκτιμώντας παράλληλα τη πιθανότητα μιας custom μηχανής. Ευχαριστώ για τα σχόλια.

  8. Nikos Kapsomenakis

    To θέμα το οποίο συζητάτε έχει εξαιρετικό ενδιαφέρον. Θα προσθέσω και εγώ πολύ σύντομα κάποιες παρατηρήσεις

    Το Google προκειμένου να αξιολογήσει το περιεχόμενο κάθε σελίδας χρησιμοποιεί περισσότερους από 100 παράγοντες. Οι περισσότεροι από αυτούς βασίζονται σε κριτήρια τα οποία δεν έχουν σχέση με στοιχεία των σελίδων τα οποία μπορεί ο καθένας να ελέγξει (meta tags, meta keywords κλπ) και σε πολλές περιπτώσεις να χρησιμοποιήσει για να παραπλανήσει τους πιθανούς επισκέπτες . Τέτοια κριτήρια είναι το λεγόμενο “authority” τόσο της ίδιας της σελίδας όσο και του domain που ανήκει συνολικά. Επιπλέον το Google δίνει πολύ μεγάλη βαρύτητα στον εντοπισμό του θεματικού αντικειμένου τόσο με βάση την ανάλυση του περιεχομένου της σελίδας όσο και με βάση την ευρύτερη θεματική οικογένεια στην οποία ανήκει η σελίδα, με βάση τα εισερχόμενα links, το θεματικό αντικείμενο των σελίδων που τοποθετούν link προς αυτήν κτλ. Μια τέτοια ανάλυση απαιτεί τεράστια resources εάν αναλογιστεί κανείς το συνολικό πλήθος των ιστοσελίδων και επιπλέον τεράστια εξειδίκευση πάνω στον τομέα αυτό κάτι το οποίοι ελάχιστοι έχουν καταφέρει πέραν του Google και σίγουρα όχι στον ίδιο βαθμό με αυτό. Δείτε για παράδειγμα τη μηχανή της Microsoft , η οποία έχει βαλθεί να κατατροπώσει το Google, η οποία παρά τα πολύ σημαντικά κεφάλαια που έχει επενδύσει έχει καταφέρει ελάχιστα πράγματα. Συνεπώς η δημιουργία μιας αποτελεσματικής μηχανής αναζήτησης δε είναι καθόλου εύκολη υπόθεση .

    Ο κάθε ένας από εμάς χρησιμοποιεί τις μηχανές αναζήτησης για διαφορετικούς λόγους και με διαφορετικούς τρόπους. Οι γενικές μηχανές αναζήτησης θα πρέπει να καλύψουν όσο το δυνατόν μεγαλύτερο αριθμό χρηστών και στον καλύτερο δυνατό βαθμό με μεθόδους οι οποίες βασίζονται σε αλγόριθμους και όχι σε ανθρώπους. Αυτό φυσικά έχει και πλεονεκτήματα και μειονεκτήματα

    Όσοι ενδιαφέρονται για συγκεκριμένα θεματικά αντικείμενα μπορούν είτε να χρησιμοποιήσουν μία από τις εκατοντάδες καθετοποιημένες μηχανές αναζήτησης (vertical search engines) είτε να δημιουργήσουν τη δική τους με βάση τα κριτήρια τα οποία θεωρούν ότι έχουν μεγαλύτερη βαρύτητα. Σημειώνω δε εδώ ότι οι CSE του Google, χωρίς να είναι οι μοναδικές, έχουν σημαντικές δυνατότητες ευελιξίας όπως μπορείτε να διαβάσετε εδώ ενώ υπάρχει η επιπλέον δυνατότητα της συμμετοχής στην διαδικασία αξιολόγησης των αποτελεσμάτων και άλλων «ειδικών» πάνω στο συγκεκριμένο θεματικό αντικείμενο προκειμένου να βελτιωθεί ακόμη περισσότερο η ποιότητα τους.

    Στο blogsearch του Google υπάρχει η δυνατότητα ταξινόμησης τόσο με βάση τη σχετικότητα του αντικειμένου όσου και με βάση την ημερομηνία των άρθρων.

    Η διαδικασία τοποθέτησης tags είναι κάτι το οποίο έχει κάνει την εμφάνιση το τελευταίο χρονικό διάστημα και ελάχιστοι είναι αυτοί οι οποίοι την εφαρμόζουν . Επιπλέον δεν θα πρέπει να ξεχνάμε ότι όλοι οι άνθρωποι δεν χρησιμοποιούν τις ίδιες λέξεις (tags) για να περιγράψουν ένα θεματικό αντικείμενο. Συνεπώς η διαδικασία αυτή έχει ελάχιστη αποτελεσματικότητα προς το παρόν ειδικότερα εφόσον δεν υπάρχει ένα κοινό λεξιλόγιο (vocabulary).

    Τέλος δεν θα πρέπει να ξεχνάμε ότι οι μηχανές αναζήτησης είναι απλά …μηχανές και όχι άνθρωποι. Εξαίρεση βέβαια σε αυτό τον κανόνα είναι μια νέα γενιά «μηχανών» αναζήτησης που βασίζονται σε editors όπως η Mahalo.

  9. nikan

    @Kapsomenakis Λόγω των πολλών λινκ του σχολίου σου είχες μπει σε moderation. Πάντως κοιτώντας τι έχει διαμοιφθεί εδώ, μάλλον για thesis σε μηχανές αναζήτησης το πάμε 😀

Comments are closed.