Προγραμματισμός

Το ISBN.nu χάνεται και εντοπίζεται στο Google

Σκέφτηκα την περασμένη εβδομάδα ότι ολοκλήρωσα τη σειρά μου στο ISBN.nu, μια διαδικτυακή υπηρεσία σύγκρισης τιμών βιβλίων που εισάγει 135.000 από τις σελίδες της στο ευρετήριο του Google.com. Αλλά αυτό προτού γίνει η σχέση μεταξύ της υπηρεσίας Ιστού και της Google.

Μια μέρα μετά το τεύχος 21 Φεβρουαρίου αποκάλυψε ότι το ISBN.nu αποθηκεύει λιγότερες από 4.000 σελίδες στον διακομιστή του - οι άλλες 131.000 σελίδες δημιουργούνται δυναμικά κάθε φορά που μια αράχνη μηχανής αναζήτησης (ή ένας άνθρωπος) ακολουθεί έναν σύνδεσμο - σχεδόν όλες οι Οι σελίδες του ιστότοπου εξαφανίστηκαν ξαφνικά από το ευρετήριο της Google. Όταν έλεγξα τον σύνδεσμο (που αναπαράγεται παρακάτω) που δείχνει τον αριθμό των σελίδων ISBN.nu που βρίσκονται στο ευρετήριο της Google, το σύνολο είχε μειωθεί σε μόλις εννέα.

Ο webmaster του ISBN.nu, Glenn Fleishman, αρχικά πίστευε ότι ένας λειτουργός χαμηλότερου επιπέδου στο Google είχε ακούσει για την ιστορία μου και αποφάσισε να απαγορεύσει τον ιστότοπο. Αυτό δεν ήταν σωστό με τον Fleishman. Λέει ότι έχει μιλήσει προσωπικά με τα ανώτερα στελέχη της Google όλα αυτά τα χρόνια. Όπως το περιγράφει, η Google δεν έχει κανένα πρόβλημα να ευρετηριάσει σελίδες που δημιουργούνται δυναμικά, αρκεί το περιεχόμενο που βλέπει μια αράχνη να είναι ακριβώς το ίδιο με αυτό που θα έβλεπε ένας άνθρωπος. Πολλοί ιστότοποι που βασίζονται σε βάση δεδομένων δημιουργούν νόμιμα σελίδες κατά παραγγελία και όχι αποθηκεύουν κάθε πιθανή σελίδα στον σκληρό δίσκο ενός διακομιστή.

Ευτυχώς, η διακοπή προκλήθηκε από σφάλμα σε μια ρουτίνα λογισμικού στο Google. Η εταιρεία μηχανών αναζήτησης με διαβεβαιώνει ότι οι σελίδες του ISBN.nu θα επιστρέψουν στο ευρετήριο Google μέσα σε λίγες μέρες, εάν δεν το έχουν ήδη διαβάσει.

Ο τρόπος με τον οποίο ο Fleishman αντιμετώπισε το πρόβλημα, ωστόσο, μας δίνει ένα πολύτιμο σεμινάριο. Ταυτόχρονα, η διακοπή αποκαλύπτει πώς λειτουργεί ένας σχετικά νέος αλγόριθμος "απαγόρευσης" στο Google. Εδώ είναι η ιστορία:

1. ΑΝΟΙΚΤΗ ΕΠΙΚΟΙΝΩΝΙΑ. Όταν ο Fleishman παρατήρησε στις 6 Μαρτίου ότι οι σελίδες του έλειπαν από το ευρετήριο Google, έστειλε ευγενικά αλλά αφορούσε μηνύματα ηλεκτρονικού ταχυδρομείου στις επαφές του στη μηχανή αναζήτησης, τους οποίους είχε γνωρίσει προηγουμένως.

2. ΣΧΕΣΕΙΣ ΤΥΠΟΥ Ο Fleishman με ενημέρωσε για το πρόβλημα, μετά από το οποίο έστειλα ένα ξεχωριστό e-mail στις επαφές μου στο Google (για το οποίο είχα κάνει μια ευγενική κλήση από σύμπτωση στις αρχές Φεβρουαρίου) ζητώντας διευκρινίσεις.

3. ΑΝΑΛΥΣΗ. Όταν ένας εκπρόσωπος της Google απάντησε ότι οι σελίδες που λείπουν οφείλονταν απλώς σε τεχνική δυσλειτουργία και όχι σε πολιτική απόφαση, ο Fleishman ανέλυσε την κατάσταση και διαπίστωσε ότι δεν χρειάζονταν αλλαγές στο σχεδιασμό της βάσης δεδομένων του.

Το πρόβλημα? Κάθε σελίδα σύγκρισης τιμών στο ISBN.nu περιλαμβάνει συνδέσμους σε έως και εννέα διαφορετικά βιβλιοπωλεία. Με 135.000 σελίδες ευρετηριασμένες, που προσθέτει έως και πολλούς συνδέσμους. Και κάθε σύνδεσμος περιέχει βασικές συμβολοσειρές κώδικα θυγατρικών, ώστε το ISBN.nu να μπορεί να κερδίσει προμήθεια εάν ένας χρήστης καταλήξει να αγοράσει ένα βιβλίο.

Όπως το θέτει ο Nate Tyler της Google, "Το πρόβλημα φαίνεται να έχει να κάνει με τον μεγάλο αριθμό ανακατευθύνσεων συνεργατών, οι οποίες πυροδότησαν μέρος της αυτοματοποιημένης τεχνολογίας μας." Αυτό σημαίνει ότι μια ρουτίνα λογισμικού της Google μαντέψει ότι το ISBN.nu ήταν "link farm". Πρόκειται για ένα ψεύτικο δαχτυλίδι στο οποίο εκατοντάδες ιστότοποι δημιουργούν εκατοντάδες συνδέσμους μεταξύ τους, προσπαθώντας να ξεγελάσουν το γνωστό σύστημα "δημοτικότητα συνδέσμου" της Google.

Ο Fleishman αναφέρει ότι το blackout της Google προκάλεσε πτώση στους 5.000 επισκέπτες την ημέρα από 9.000 (μείωση 45%) και πτώση 30% έως 40 τοις εκατό στα έσοδα της θυγατρικής του. Προσθέτει ότι το Yahoo παρέλειψε πρόσφατα το ISBN.nu για μερικές ημέρες, περικόπτοντας μερικές χιλιάδες παραπομπές ανά μήνα από αυτήν την πηγή. Αυτό υπογραμμίζει τη σημασία της κυκλοφορίας μηχανών αναζήτησης σε ορισμένους ιστότοπους ηλεκτρονικού επιχειρείν, ενώ άλλοι εξαρτώνται πολύ περισσότερο από τις δικές τους προσπάθειες διαφήμισης και μάρκετινγκ.

Εάν δοκιμάσατε τον σύνδεσμό μου τον περασμένο μήνα με τον αριθμό των σελίδων ISBN.nu στο Google, ζητώ συγνώμη αν δεν αποκάλυψε τις 135.000 σελίδες που υποσχέθηκα. Μπορείτε να δοκιμάσετε τον παρακάτω σύνδεσμο για λίγες ημέρες για να δείτε πόσες από τις σελίδες του ιστότοπου επιστρέφουν στο ευρετήριο καθώς η αράχνη της Google ανιχνεύει σταδιακά τους συνδέσμους.

ΠΑΡΑΤΗΡΗΣΕΙΣ ΤΟΥ GLENN FLEISHMAN ΓΙΑ ΤΟ GOOGLE OUTAGE:

//[email protected]/?4e52

ΑΝΑΖΗΤΗΣΗ ΠΟΥ ΠΑΡΟΥΣΙΑΖΕΙ Ο ΑΡΙΘΜΟΣ ΤΩΝ ΣΕΛΙΔΩΝ ISBN.NU ΣΤΟ GOOGLE

//[email protected]/?61da

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

ΑΝΑΣΚΟΠΗΣΗ ΤΕΧΝΙΚΗΣ ΗΛΕΚΤΡΟΝΙΚΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ: ΑΝΕΠΙΘΥΜΗΤΕΣ ΠΡΟΣΤΑΣΙΕΣ ΜΠΟΡΕΙ ΝΑ ΑΣΥΡΚΕΥΟΥΝ ΤΗΝ ΑΝΤΛΙΑ

Χρησιμοποιώντας ένα κενό τσιπ πατάτας Pringles ως εξωτερική κεραία, κακόβουλοι χάκερ μπορούν εύκολα να βρουν και να εισχωρήσουν σε πολλά εταιρικά ασύρματα δίκτυα, σύμφωνα με μια ανάλυση της I-sec, μιας συμβουλευτικής ομάδας ασφαλείας.

Η εταιρεία οδήγησε ένα αυτοκίνητο γύρω από την οικονομική περιοχή του Λονδίνου, χρησιμοποιώντας ένα άδειο κουτί Pringles για να μεγεθύνει τα σήματα ασύρματου δικτύου. Πάνω από τα δύο τρίτα των εταιρειών που χρησιμοποιούν ασύρματο ή Wi-Fi, δεν είχαν εφαρμόσει χαρακτηριστικά κρυπτογράφησης, ανέφερε η ομάδα ασφαλείας. Τέτοια δίκτυα είναι ευάλωτα σε κλοπή εύρους ζώνης ή εισβολή δεδομένων.

Το σωληνοειδές δοχείο Pringles δημιουργεί μια αποτελεσματική κατευθυντική κεραία, επίσης γνωστή ως κεραία Yagi. Τα σχέδια για χρήση αυτής και άλλων συσκευών για την αναγνώριση σημάτων Wi-Fi άρχισαν να κυκλοφορούν στο Διαδίκτυο πέρυσι.

Το BBC News Online αναφέρει ότι είδε ένα δευτερόλεπτο να ανιχνεύει σχεδόν 60 ασύρματα δίκτυα σε ένα μόνο ταξίδι 30 λεπτών μέσω των φαραγγιών της πόλης. Η έκθεσή της περιγράφει το πρόβλημα και προτείνει απλές λύσεις.

Τα κενά PRINGLES μπορούν να βοηθήσουν τους χάκερ να βρουν μη προστατευμένο WI-FI:

//[email protected]/?7562

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

ΤΟ ΝΕΟ 10 ΝΕΑ ΤΟΥ LIVINGSTON ΠΑΡΟΥΣΙΑΖΕΙ ΤΗΝ ΕΒΔΟΜΑΔΑ

1. Το Netscape Navigator 6 διαβάζει αναζητήσεις, λέει το Newsbytes

//[email protected]/?41a

2. Οι μικρογραφίες των διαδικτυακών εικόνων είναι εντάξει, κανόνες δικαστηρίου

//[email protected]/?802

3. Ροή μουσικών ιστότοπων αποκρυπτογραφούν ποσοστά δικαιωμάτων

//[email protected]/?bea

4. Πώς η αγορά χαρτιού Mill-Freeman b-to-b κερδίζει χρήματα

//[email protected]/?fd2

5. Η προσφορά δωρεάν αποστολής άνω των 99 $ αυξάνει το μέγεθος της παραγγελίας

//[email protected]/?13ba

6. Το Ανώτατο Δικαστήριο μπορεί να αντιστρέψει την επέκταση πνευματικών δικαιωμάτων

//[email protected]/?17a2

7. Cool: Πώς να φτιάξετε μια περιστρεφόμενη γκαλερί στο ColdFusion

//[email protected]/?1b8a

8. Η απάτη είναι 19 φορές πιο πιθανή στο διαδίκτυο από ότι εκτός σύνδεσης

//[email protected]/?1f72

9. Συμβουλές HTML: Ο σωστός τρόπος για να κάνετε γρήγορες αλλαγές

//[email protected]/?235α

10. Σταματήστε τους χάκερ να χρησιμοποιούν το PayPal για να κλέψουν το περιεχόμενό σας

//[email protected]/?2742

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

ΕΒΔΟΜΑΔΑ WACKY WEB: TABLOID POP BAND SPLIT-UP GENERATOR

Ίσως αυτό να ικανοποιήσει την ανάγκη περιεχομένου του ιστότοπού σας. Πληκτρολογήστε μερικές λέξεις-κλειδιά σε μια φόρμα Web και ένα presto: Το Popjustice, ένας ασεβής ιστότοπος μουσικής-indie, φτιάχνει ένα τέλειο άρθρο σχετικά με την επικείμενη διάλυση οποιασδήποτε ποπ μπάντας της επιλογής σας.

Λίγο κόψιμο και επικόλληση για να αντιγράψετε τη γνωστή φήμη που ακούγεται και εσείς, επίσης, μπορείτε να μοιάζετε με μουσική. Ο ιστότοπος της Popjustice στο Ηνωμένο Βασίλειο είναι ένα είδος διασταύρωσης μεταξύ ενός fanzine και ενός από τα πιο περίτεχνα ιστολόγια που θα δείτε ποτέ. Δοκιμάστε το, αλλά προειδοποιήστε: άτακτη γλώσσα και νεανικό χιούμορ, μπλουζ.

ΣΦΑΙΡΙΚΟΣ ΜΗΧΑΝΙΚΟΣ ΙΣΤΟΣΕΛΙΔΑΣ BOP-SPLIT:

//[email protected]/?c382

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

ΜΥΣΤΙΚΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ: Η αποστολή μας είναι να σας προσφέρουμε τόσο χρήσιμες και προκλητικές πληροφορίες σχετικά με τον Ιστό που πραγματικά ανυπομονείτε να διαβάσετε το e-mail σας.

ΣΧΕΤΙΚΑ ΜΕ ΤΟΝ ΣΥΓΓΡΑΦΕΑ: Τα μυστικά του ηλεκτρονικού επιχειρείν γράφονται με τη συνεισφορά

Συντάκτης Brian Livingston (//SecretsPro.com). Διευθυντής της έρευνας είναι ο Ben Livingston (χωρίς σχέση). Ο Μπράιαν έχει δημοσιεύσει 10 βιβλία, συμπεριλαμβανομένων:

Μυστικά των Windows Me:

//[email protected]/?0764534939

Μυστικά των Windows 2000:

//[email protected]/?0764534130

Κερδίστε ένα δωροεπιταγή καλό για ένα βιβλίο, CD ή DVD της επιλογής σας εάν είστε ο πρώτος που θα στείλει μια συμβουλή Brian εκτυπώσεις. mailto: [email protected]