Ελληνικοί Aggregators: Μια αναξιόπιστη σύγκριση.

Σήμερα κάνει το γύρο του διαδικτύου ένα ποστ του TechCrunch σχετικά με την αναξιοπιστία του Alexa, αφού το Alexa δείχνει το youtube να έχει μεγαλύτερη επισκεψιμότητα από την ίδια τη Google.
Την αναξιοπιστία του Alexa δεν χρειαζόμουνα τον Arrington να μου την υποδείξει, αλλά η υπενθύμιση δίνει αφορμές για σκέψη. Έτσι κι ο Νίκος στο Nylon έπιασε να συγκρίνει τα γνωστά web 2.0 sites για να δει που στέκουν. Αυτό μου έδωσε την ιδέα να κάνω μια μικρή σύγκριση των ελληνικών aggregators στα pageviews. Τα πεδία του Alexa δεν μου επιτρέπουν να τους συμπεριλάβω όλους γιατί είναι μόνο πέντε. Διάλεξα αυτούς που νόμιζα ότι ταιριάζουν για συγκριση καλύτερα και ιδού τα αποτελέσματα για το περασμένο εξάμηνο:

aggregators-comparison.jpg

Το τι βγαίνει και γιατί βγαίνει μόνο το Alexa θα μας μπορούσε να μας το εξηγήσει. Εγώ να πω πως τo blogspace, δεν είναι μόνο aggregator. Το blogspace είναι και blog και forum εκτός από aggregator.

Παρακάτω είναι μια σύγκριση των δύο κλειστών aggregators, mindblog και phigita, που επίσης δεν είναι μόνο aggregators κι οι δύο.

aggregators-comparison1.jpg

9 thoughts on “Ελληνικοί Aggregators: Μια αναξιόπιστη σύγκριση.

  1. Μπούλης

    Οπως ανέφερα και στο blog του Φωτη η Alexa χρησιμεύει μόνο όταν δεν έχεις στη διάθεση σου αξιόπιστα πρωτογενή στοιχεία. Τότε μόνο έχει κάποιο νόημα προκειμένου να έχεις μία γενική εικόνα του χάους και πάντα με επιφύλαξη. Από κει και πέρα ισχύουν οι γνωστές αδυναμίες που προκύπτουν από τη χρήση μη ελεγχόμενου/σταθμισμένου panel. Ιδιαίτερα στην περίπτωση της Ελλάδας όπου τα μεγέθη είναι μικρότερα σε σχέση με το εξωτερικό αυτές οι αδυναμίες είναι εμφανέστερες.

    Οσο αφορά το γράφημα και τον mpouligator με μια πρώτη ματιά δείχνει να πιανει σωστά την εξέλιξη της επισκεψιμότητας, ειδικά τη μεγάλη της πτώση μετά τα μέσα Ιουνίου όταν περιόρισα μέσω του robots.txt τις επισκέψεις από search engines.

    Για να συμβάλλω όμως και πιο πρακτικά στην κουβέντα, παραθέτω το παρακάτω login μέσω του οποίου μπορεί να δει ο καθένας την επισκεψιμότητα του mpouligator:

    http://www.statcounter.com
    Login: mpouliguest
    Pass: 123456

    Κι εδώ δεν έχουμε απόλυτα ακριβή εικόνα γιατί π.χ. μετράμε με statcounter και όχι με Netratings ή Omniture, δεν μετραμε τα rss feeds, αλλά οπωσδήποτε έχουμε μία ακριβέστερη εικόνα συγκριτικά με την Alexa.

  2. JustAnotherGoneOff

    Συμφωνώ σε γενικές γραμμές με τον Μπούλη, αφού χρησιμοποιούμε ένα από τα αξιόπιστα εργαλεία σαν το statcounter, η Alexa καταντά παραφιλολογία.

    Υπάρχει όμως κάτι που δεν καταλαβαίνω, ας μου εξηγήσουν ο Μπούλης και ο Νίκαν. Χρησιμοποιώ εδώ και ένα χρόνο σχεδόν το statcounter και παράλληλα βλέπω τα χιλιάδες σπαμ από το Akismet που μπλοκάρονται. Αν αυτά τα spam αφορούν σίγουρα επισκέψεις, πως δεν καταγράφονται από το statcounter; Δεν μπορώ να καταλάβω πως λειτουργεί το σύστημα με τα spider, για να με έχει στη λίστα των λινκ και μου στέλνει σπαμ, δεν ισοδυναμεί με επίσκεψη; Σημειώνω πως τα spider εμφανίζονται άνετα στα στατιστικά των φόρουμ, εξ ου και κάποια εξωφρενικά stats τύπου “περισσότεροι συνδεδεμένοι χρήστες την τάδε ημέρα 600”!

  3. nikan

    @mpoulis Εντυπωσιακή κίνηση να ανοίξεις τα στατιστικά σου. Ευχαριστούμε!

    @Jago Spiders ή web crawlers ή crawlers ή Κάτι-bots λέγονται τα προγράμματα που χρησιμοποιούν κυρίως μηχανές αναζήτησης και που διατρέχουν όλο το διαδίκτυο ακολουθώντας τα link που βρίσκουν σε κάθε σελίδα προς άλλες, χαρτογραφώντας έτσι το διαδίκτυο.
    Δεν καταλαβαίνω τη συσχέτιση που κάνεις με το σπαμ.
    Ένα spider απλώς ‘διαβάζει’, δεν κάνει κάποια ενέργεια του τύπου να αφήσει σχόλιο.
    Οι σπάμμερς έχουν δικά τους προγράμματα που μπορεί να περιλαμβάνουν spiders για να ανιχνεύσουν ευάλωτες ιστοσελίδες, η ενέργεια του spamming όμως είναι ξεχωριστή.
    Επειδή τα στατιστικά προγράμματα σαν τον statcounter χρησιμοποιούν κώδικά μέσα στη σελίδα του μπλογκ, για να πάρουν πληροφορία για μια επίσκεψη, πρέπει να φορτωθεί από κάποιο client η σελίδα. Δεν ξέρω πως δουλεύει το Akismet, είναι κλειστό σύστημα, αλλά ΙΜΟ, μάλλον μπλοκάρει το request αυτών των σελίδων που ζητάει το σπάμ κι έτσι ποτέ δεν φτάνουν στα στατιστικά σου.

  4. cheaplog

    Είναι γενικά πασίγνωστο άμα πρόλαβες την εποχή της κόντρας, και το γράφει και ο Μπούλης στο θέμα που παραπέμπει. Στην Ελλάδα ειδικά, η Alexa είναι, γενικά, ακόμα δείγμα του τι διαβάζουν οι υπάλληλοι όσων είχαν εμπλακεί στην διαμάχη στις αρχές της δεκαετίας.

  5. Μπούλης

    @justanothergoneoff

    Χονδρικά η επισκεψιμότα μετριέται με 2 τρόπους. Είτε αναλύοντας με το κατάλληλο software το log file του web server ενός site, είτε τοποθετώντας ένα κομμάτι κώδικα στην κάθε σελίδα του site. O κάθε τρόπος έχει τα πλεονεκτήματα και τα μειονεκτήματα του αλλά γενικά έχει επικρατήσει σαν πιο ακριβής ο δεύτερος (με την σωστή υλοποίηση πάντα). Στον πρώτο τρόπο καταγράφονται τα πάντα συμπεριλαμβανομένων και των επισκεψεων από spiders μηχανών αναζήτησης, spammers κλπ, ενώ στον δεύτερο τροπο πρέπει η επίσκεψη να γίνει από κανονικό client που θα τραβήξει όλα τα στοιχεία της σελίδας (άρα και τον κώδικα που μετράει την επισκεψιμότητα).

    Τα spam comments δημιουργούνται ως εξής: Τρέχει ένα πρόγραμμα και διαβάζει σελίδες από το internet. Κατά κανόνα, διαβάζει μόνο τη σελίδα και όχι τα συστατικά της, πχ. εικόνες, scripts (εδώ βάλε και το statcounter) κλπ . Αναλύει τον κώδικα της σελίδας και βλέπει αν υπάρχει φόρμα. Εάν υπάρχει, αναγνωρίζει τα πεδία που πρέπει να συμπληρωθούν και στέλνει αυτομάτως ένα comment. Ανάλογα με το αν υπαρχει καποιο antispam το μήνυμα θα μπλοκαριστεί ή θα εμφανιστεί. Σε όλη τη διαδικασία η επίσκεψη δεν θα φτάσει ποτέ στο statcounter. Ασφαλώς όμως θα καταγραφεί στο logfile του webserver. Στα forum που αναφέρεσαι προφανώς υπάρχει κάποιο script που διαβάζει απευθείας το logfile γι αυτό και βλεπεις αυτα τα μεγάλα νούμερα.

    Σχετικά με την Alexa, το βασικό πρόβλημα είναι ότι επιχειρεί να καταγράψει τα πάντα με panel (δηλαδή οι άνθρωποι που εγκαθιστουν το toolbar και των οποιων οι επισκεψεις καταγραφονται) που είναι ελεύθερο και συμμετέχει όποιος θέλει. Υπάρχουν άλλες λύσεις όπου μετριούνται συγκεκριμένα sites (καθορισμένα εκ των προτέρων) με ελεγχόμενο και σταθμισμένο panel. Εκεί τα αποτελέσματα προσεγγίζουν εντυπωσιακά την πραγματικότητα. Είναι απλά θέμα μεθοδολογίας και αγοράς στην οποία απευθύνεσαι. Οπως για όλους εμάς τους απλούς χρήστες υπάρχει το τζάμπα statcounter και για τα μεγάλα sites υπάρχει η omniture (τυχαία παραδείγματα) όπου η μέτρηση κοστίζει αρκετα χρήματα και προσφέρει πολύ μεγαλύτερη ακριβεια και εγκυρότητα, έτσι και στα panel metrics υπάρχει η Alexa που δίνει τζαμπα τα αποτελέσματα της και συμμετέχουν εκατομμύρια άνθρωποι χωρίς κανένα έλεγχο και ταυτόχρονα υπάρχει και η Nielsen που έχει ένα ελεγχόμενο panel 100.000 χρηστών που προσφέρει απείρως μεγαλύτερη ακρίβεια σε μια διόλου ευκαταφρόνητη τιμή.

  6. Rodia

    Μερσί παιδιά, τώρα κατάλαβα αρκετά.. αλλά.. για πείτε κάτι περί “ευάλωτων ιστοσελίδων”. Πως αναγνωρίζονται δλδ..?

  7. nikan

    @rodia Καλή ερώτηση. Οι σπάμμερς ψάχνουν για δυο ειδών σελίδες: τέτοιες που θα τους επιτρέψουν να στείλουν σπάμ και άλλες που θα λάβουν.
    Για τις πρώτες, επειδή το έχω δει να συμβαίνει, δοκιμάζουν μια σειρά από requests σελίδων με url διαμορφωμένα με τέτοιο τρόπο που να εκμεταλλεύονται γνωστές τρύπες σε γνωστά προγράμματα δημιουργίας ιστοσελίδων. Από αυτές τις τρύπες μπορούν να αποκτήσουν, σε κάποιες περιπτώσεις, και πλήρη έλεγχο του σέρβερ. Μόλις ο εχθρός περάσει τις πύλες χρησιμοποιεί τις δυνατότητες αποστολής -κυρίως- email του συγκεκριμένου ιστοτόπου, και, αν πρόκειται για μπλογκ, για trackback και pingback που ‘δημιουργούν’ σχόλια σε άλλα μπλογκ. Γι αυτό κι οι δημιουργοί των προγραμμάτων κατασκευής ιστοτόπων κυκλοφορούν σε ταχτά διαστήματα security fixes, ή updates κτλ

    Στη δεύτερη περίπτωση τα πράγματα είναι πιο απλά. Κι εσύ μπορείς να το κάνεις. Ανοίγεις ένα μπλογκ ας πούμε στον blogger, καταχωρείς ποστ με το γνωστό διαφημιστικό περιεχόμενο (viagra, penis enlargement, μετοχές, κτλ), παίρνεις μια λίστα από ποστ urls από ένα aggregator, και τα χρησιμοποιείς για να στείλεις trackback στα μπλογκ απ’ όπου προέρχονται. Έχεις φτιάξει έτσι ένα splog δηλαδή σπαμ μπλογκ. Βέβαια οι σπάμμερς είναι πιο έξυπνοι, δεν τα κάνουν χειροκίνητα αυτά, αλλά μπαίνεις στο νόημα..Μπλογκ που επιτρέπουν τα σχόλια και τα trackback και δεν διαθέτουν αντισπάμ προστασία, σίγουρα είναι προτερεότητες. Αλλά σε γενικές γραμμές, όπως θα έχεις διαπιστώσει, οτιδήποτε μπορεί να είναι στόχος

    Άλλη περίπτωση είναι οι λεγόμενες contact forms που έχουν πολλά εταιρικά sites. Όταν δεν προστατεύονται από captch μπορεί ο οποιοσδήποτε να τις χρησιμοποιήσεις για να στείλει μήνυμα στον κάτοχο της ιστοσελίδας αλλά και σ’ οποιονδήποτε άλλον, δηλώνοντας απλώς σαν δικό του e-mail τρίτου. Απ’ αυτή την άποψη το verification που τόσο μισούμε στον blogger είναι καλό πράγμα 🙂 Σταματάω γιατί πάει για διάλεξη το πράγμα

  8. Rodia

    Στην ιστοσελίδα μου, πριν λίγο καιρό, είχα δεχτεί ένα καταιγισμό από σπαμ -σε μια νύχτα έφτασα να σβήσω πάνω από 2.000!!! Εσπασα το κεφάλι μου να βρω τι έφταιγε, αλλά τπτ. Μετά, μου κατέβηκε η ιδέα να μη δέχομαι αυτόματη εγγραφή μελών και σώθηκα. Βέβαια, εξακολουθούν να έρχονται (κυρίως από Ρουμανία και Ουκρανία) αιτήσεις για εγγραφή, αλλά τώρα το ελέγχω το πράγμα. Η σελίδα ανανεώνεται πλέον σπανίως και ίσως αυτό διεγείρει όσους το έχουν παρατηρήσει αυτό.

Comments are closed.