And now for something completely different

Ειπα να δοκιμασω τις μεταφρασεις του γκουγκλ και γω ο φτωχος. Κοιταχτε πως διαβαζει ενας αγγλοφωνος ενα τυπικο κειμενο μας:

Recently I had the misfortune to fly with Olympic Aviation for Germany. [ως εδω μια χαρα] I say misfortune because each traveler with little experience avoids the Olympic as the devil in holy water [χαχα αυτο ακουγεται σαν κινεζικη παροιμια].

At the time, went on the plane was obviously hired by Hungarian company, in gyrismo from petty ftinometaforea [ε? ε? τρομερη μεταφραση!] Spanish Hola Airlines

With this Olympic behavior not only shows tremendous disrespect to the Greeks customers (not not know Hungarian most [αυτο μου θυμιζει το μυθικο triple negative: “is it not true that the water is not not undrinkable?”] ), not only our xeftilizei even more (to enjoy the “national airline” you [αυτο θυμιζει Μπορατ στα καλα του] ) but embarking on a very dangerous path.

Το κειμενο συνεχιζει με παρομοιο χιουμορ και ασυναρτησιες…

Η προσπαθεια της google ειναι αξιεπαινη και οταν τα καταφερουν καλα θα ανοιξει νεους οριζοντες στους πολιτες του κοσμου. Αλλα μπορει κανεις να πει με σχετικη βεβαιοτητα οτι η τεχνολογια αυτοματης μεταφρασης δεν εχει ωριμασε αρκετα ακομα, οπως και οι αλλες σχετικες τεχνολογιες, αναγνωρισης φωνης*, αναγνωσης κειμενου κτλ. Αν σκεφτοσασταν να παρετε κανενα παρομοιο ηλεκτρονικο δωρο σε καποιον φετος (ας πουμε αυτοματο μεταφραστη τσεπης για την αλλοφωνη συντροφο σας, οπως σκεφτομουν εγω) ξανασκεφτειτε το. Μπορει να προσφερουν αξεχαστες ωρες διασκεδασης, αλλα τον πραγματικο τους σκοπο δεν τον επιτελουν. Νομιζω λοιπον οτι το 2007 δεν εμελλε να ειναι το ετος που οι μηχανες μπορεσαν να αντικαταστησουν ενα 10χρονο παιδι μετριας νοημοσυνης και αμφιβαλλω αν το 2008 θα ειναι πολυ καλυτερο…

*Πηρα συναχωμενος την τραπεζα μου τηλεφωνο και το μηχανημα δεν καταλαβαινε ουτε καν το “yes”.

12 thoughts on “And now for something completely different”

  1. Έλα ρε συ, εντάξει η μετάφραση είναι χάλια. Και πώς θα μπορούσε να γίνει αλλιώς όταν η λογική της ελληνικής σύνταξης και η γραμματική της πολυπλοκότητα δεν είναι συμβατές με τη νεολατινική συντακτική άκλιτη απόδοση; Είσαι νομίζω αυστηρός. Σαφώς ακι είναι σχετικά πειραματικό, αλλά είναι μια προσπάθεια που έχει ακόμα πολύ μέλλον.

    Reply
  2. …αν σκεφτει κανεις μαλιστα οτι η τεχνολογια πισω απο τη μεταφραση του γκουγκλ ειναι μια απλη στατιστικη αναλυση μεταγλωττισμενων κειμενων που μαλσιτα δεν εχει συμπληρωσει χρονο απο τοτε που το γκουγκλ ξεκινησε να συλλεγει υλικο για το εν λογο εγχειρημα, τοτε τα αποτελεσματα ειναι μαλλον εντυπωσιακα. Φυσικα ο δρομος που πρεπει να διανυσουμε ακομα ειναι τεραστιος.

    Reply
  3. Egw pantws eixa xrisimopoiisei to babelfish gia na riksw mia galida. Leitoyrgise apsoga vevaia stin metafrasi agglikis-gallikis exei pesei perisoteri douleia apo tin elliniki.

    Reply
  4. δεν λεω οτι δεν ειναι αξιοσημειωτη η προοδος μας και σοβαρη η δουλεια της γκουγκλ. Αλλα ειναι πραγματικα τρομερο το ποσες αδυναμιες εχει το συστημα, δειγμα κιολας του ποσο δυσκολες ειναι καποιες λειτουργιες του εγκεφαλου μας που τις εχουμε για ευκολες και αυτονοητες.

    Καπιταλιστ εχεις λεπτομερεςι για το πως το κανει η γκουγκλ? Απο που μαζευει το υλικο?

    Reply
  5. Κυρια πηγη τους ηταν κειμενα απο τον οργανισμο ηνωμενων εθνων. Γι αυτο και εχει και καλυτερο αποτελεσμα με κειμενα αντιστοιχου υφους, οπως τα ειδησιογραφικα πχ. Προσφατα μαλιστα αφησαν να εννοηθει οτι βασικος λογος που ξεκινησαν την υπηρεσια τηλεφωνου της Γκουγκλ, ηταν και η στατιστικη επεξεργασια των ερωταπαντησεων(για τεχνητη νοημοσυνη), δεν θυμαμαι που το διαβασα αυτο το τελευταιο.

    Παντως αν και η τεχνολογια στατιστικης αναλυσης ειναι νεοτατη -δεν την εφηυρε η Γκουγκλ- καταφερνει ηδη και ξεπερνα τα παραδοσιακα λογισμικα. Φυσικα βεβαια ολοι καταλαβαινουμε τις δυσκολιες που εχει μια αψογη μεταφραση, αν ποτε γινει εφικτη οσο ζουμε, αλλα το ολο προτζεκτ παραμενει εντυπωσιακο.

    Εδω για περισσοτερα: http://googleresearch.blogspot.com/2006/04/statistical-machine-translation-live.html

    Reply
  6. βασικα η στατιστικη αναλυση της εννοιας μιας γλωσσας ( με σκοπο την αναπαραγωγη της σε μια αλλη = μεταφραση ) ειναι το ιδιο που κανει ενα λεξικο, αλλα με πιο εγκυρα ( απο χρονικη αποψη ) στοιχεια. δεν ειναι κατι καινουριο. το μονο που αλλαζει ειναι ο ρυθμος της ανανεωσης της βασης δεδομενων ( database update ). σε ενα λεξικο ( ειτε ηλεκτρονικο ειτε τυπωμενο ) γινεται καθε φορα που εκδιδεται ( ισως καποια χρονια ), με την καινουρια μεθοδο μαλλον καθε μερα η εβδομαδα. θα πρεπει να αφησουμε και ενα περιθωριο ελεγχου εγκυροτητας και ορθοτητας νεων υποψηφιων εντακτεων κειμενων. και αυτο πιθανοτατα θα ειναι παλι δυναμικη συναρτηση του παρελθοντος της πηγης.

    database decision making και fuzzy logic context building δεν ειναι καινουρια concepts, απλα τωρα αρχιζουμε σιγα σιγα να εχουμε την τεχνολογια που τα κανει εφικτα και κυριως αποδοτικα σε real time. ( και marketing για να τους δινει ωραια φανταχτερα επιστημονικοφανη ονοματα )
    ;)

    Reply
  7. πολυ ενδιαφεροντα ολα αυτα. Υπαρχουν διαφορα προβληματακια παντως:

    η γκουγκλ λογικα αναλυει φρασεις και λεξεις ταυτοχρονα και αυτο ειναι βασικη διαφορα με ενα λεξικο που μεταφραζει συνηθως μονο λεξεις. Πως αποφασιζει το προγραμμα αν μια φραση ειναι μεγαλη ή μικρη, δηλαδη αν πρεπει να μεταφρασει καθε λεξη μιας φρασης χωριστα ή ολοκληρη την φραση ενιαια?Εχω την εντυπωση οτι απλη στατιστικη αναλυση δεν φτανει εκει, πρεπει καποιος ανθρωπος να εκπαιδευσει το προγραμμα…

    Reply
  8. ενα λεξικο σου δινει για καθε λεξη 2 η 3 η περισσοτερες δυνατοτητες επιλογης αναλογα με την (στατιστικη) χρηση της εννοιας και πολυ συχνα και παραδειγματα για καθε διαφορετικη εννοια. αυτο που κανουν οι μεταφραστες τυπου γκουγκλ ειναι να παρουν 1000 η 100.000 παραδειγματα για καθε λεξη ωστε να μπορει να αποφασισει καλυτερα ποια εννοια ( μεταφραση ) θα πρεπει να διαλεξει.

    μην ξεχνας οτι ενας ανθρωπος επισης δεν μπορει να διαλεξει σωστα, πως θα μεταφρασει μια λεξη, αν δεν την εχει ξανακουσει ποτε, η ακομα χειροτερα δεν ξερει καν την γλωσσα, στην οποια θα μεταφραζει. επειδη ομως ενας ανθρωπος ξερει να μιλαει ( εχει ηδη δημιουργησει μια μεγαλη βαση δεδομενων για μια γλωσσα ), εχει περισσοτερες πιθανοτητες να πετυχει την σωστη μεταφραση με λιγοτερα παραδειγματα.

    με τον ιδιο τροπο δουλευουν και τα neuronal networks. τα ταιζεις δεδομενα ωστε να μπορουν παρουν καλυτερες αποφασεις ( να δημιουργηθει /ενισχυθει η ενωση που θα οδηγησει στην αποφαση αυτη ). μια ισχυροτερη ενωση αντεχει σε μεγαλυτερη αποκλιση απο το υπαρχον στοιχειο. το σημαντικο σημειο ειναι οτι ειναι δυναμικη διεργασια, δηλαδη οτι καθε καινουριο στοιχειο προστιθεται στην βαση δεδομενων και αλλαζει την κατανομη.

    Πως αποφασιζει το προγραμμα αν μια φραση ειναι μεγαλη ή μικρη, δηλαδη αν πρεπει να μεταφρασει καθε λεξη μιας φρασης χωριστα ή ολοκληρη την φραση ενιαια

    το ενα δεν σημαινει το αλλο.

    1. οι φρασεις χωριζονται απο την στιξη. οι φρασεις που θα δημιουργησει ο μεταφραστης θα ειναι αναλογες της γλωσσας στην οποια μεταφραζεις ( στο μελλον θα μπορεις να διαλεξεις αν θες περισσοτερο ακριβη η ελευθερη μεταφραση ).

    2. με τον ιδιο τροπο που μεταφραζεις και εσυ. το τελικο κειμενο πρεπει να εχει συνολικα τις μεγιστες πιθανοτητες να συμπιπτει με ενα αλλο ομοιο.

    Reply
  9. κοιτα ξερω 5 πραγματα περι νευρωνικων δικτυων αλλα εδω μιλανε για στατιστικη αναλυση που δεν ειναι ακριβως το ιδιο.

    Το προβλημα με τις φρασεις ειναι που να τις κοψεις και τα σημεια στιξης δεν φτανουν. Παραδειγμα: “κανε περα ρε φιλε”

    αν το πας λεξη λεξη θα ειναι “make far friend”

    αν το χωρισεις σε δυο λεξεις θα μεταφρασεις σωστα την πρωτη φραση
    “go away” αλλα το δευτερο κομματι ακομα θα το κακομεταφρασεις ως “friend”. Αν την πιασεις ολοκληρη θα καταλαβεις οτι το φιλε δεν εννοειται πραγματικα φιλικα και θα μεταφρασεις κατι σαν “go away man”. Μπορω να σκεφτω πολυ πιο περιεργες φρασεις που θα ειναι δυσκολο να ξερεις που αρχιζει και που τελειωνει η φραση. Αν θες παντα να μεταφραζεις ολοκληρες προτασεις η πιθανοτητα να εχεις αντιστοιχες στο λεξικο σου ειναι μικρη αρα θα τα αφηνεις ολα αμεταφραστα!

    ολα αυτα νομιζω φαινονται ξεκαθαρα στην μεταφραση του γκουγκλ που παρεθεσα…

    Reply
  10. το αν το πας λεξη λεξη αντιστοιχει στο να διαλεξεις την πιο πιθανη μεταφραση (εννοια) για την συγκεκριμενη λεξη ασχετως με τις υπολοιπες, κατι που προφανως δεν θα σου δωσει το σωστο αποτελεσμα.

    επισης: για να μπορεις να συνδυασεις το κανε με το περα σε μια εννοιολογικη ενοτητα και να το μεταφρασεις ως go away, τοτε πρεπει να το εχεις ξαναδει, δεν γινεται αλλιως (ουτε ως ανθρωπος).

    η στατιστικη αναλυση κειμενων και λεξεων, περι της οποιας ο λογος, ειναι ουσιαστικα η δημιουργια (πιθανοτικων) συσχετισμων αναμεσα σε διαφορετικες (καταρχην) λεξεις ωστε να μπορει ενας (ηλεκτρονικος) μεταφραστης να υπολογισει καλυτερα τα συμφραζομενα, ουσιαστικα μια αναπροσαρμογη των πιθανοτητων (μιας εννοιας προς μια λεξη/συνολο λεξεων). το ιδιο κανει και ενας ανθρωπος ασυνειδητα συνηθως αλλωστε.

    με αλλα λογια οταν εχεις μια παραγραφο η ενα κειμενο που περιεχει το κανε περα και το ρε φιλε και το φυγε απο δω, εχεις περισσοτερες πιθανοτητες να εισαι σωστος οταν μεταφραζεις το ρε φιλε με το man/pal/sports κτλ. (ασε που απο μονο του το ρε θα επρεπε ηδη να σου δωσει αυτο το στοιχειο και στην μεταφραση σου δεν το εχεις καν παρει υποψιν ;) ).

    δεν χρειαζεται να εχεις ολοκληρη την προταση στο λεξικο σου, μονο τις εννοιολογικες ενοτητες. αλλα βεβαια οσο μεγαλυτερο αρχειο εχεις τοσο πιθανοτερο να πετυχεις και μια παρομοια προταση.

    τελος οσο λιγοτερο πιθανη ειναι μια εννοια απολυτα τοσο λιγοτερο ανθεκτικη ειναι στην αποκλιση αλλα παραλληλα τοσο μεγαλυτερη ειναι η πιθανοτητα να πετυχεις την σωστη μεταφραση. (γιατι τοσο πιθανοτερο ειναι να αποτελει συγκεκριμενη ενοτητα). βασικοτερο παραδειγμα φρασεις που ανοικουν στην αργω.

    Reply
  11. με αλλα λογια οταν εχεις μια παραγραφο η ενα κειμενο που περιεχει το κανε περα και το ρε φιλε και το φυγε απο δω, εχεις περισσοτερες πιθανοτητες να εισαι σωστος οταν μεταφραζεις το ρε φιλε με το man/pal/sports

    Καταλαβαινω γενικα τι προτεινεις, αλλα δεν νομιζω οτι αυτο ειναι καλη ιδεα, πρεπει στο λεξικο σου να εχεις και φρασεις ως φρασεις, αλλιωτικα η πιθανοτητα παρανοϊκων μεταφρασεων ειναι πολυ μεγαλη. Παρεπιμπτοντως κοιταξτε και δω τι παθαινει κανεις οταν κανει κακες μεταφρασεις
    :-)

    Reply
  12. και φρασεις ως φρασεις

    μα αυτο ειναι το ολο νοημα του να δημιουργησεις μια βαση δεδομενων απο ολοκληρα κειμενα, των οποιων η αποδοτικη και ταχεια επεξεργασια ειναι δυνατη τα τελευταια χρονια. σε μια καλυτερη εκτιμηση των συμφραζομενων, ωστε να μην ειναι παρανοικες οι μεταφρασεις.

    αλλα μην ξεχνας οτι και στα λεξικα (τυπωμενα η ηλεκτρονικα) αυτο κανεις. παρε ενα οποιοδηποτε λημμα και δες. εκει αποσκοπει (και) η παραθεση παραδειγματων.

    Reply

Leave a Comment