ספרים שתרגמתי
My Translations






אלן טיורינג
בני הנפילים
ג'יין אוסטן
שם צופן וריטי

משחק אחרון
וורקרוס
מנתץ הכתר
קוטל המלכה
כובל הנשמות
פיליפה פרי
שפע של קתרינות














לרשימה המלאה
Complete list


logo

ענבל שגיב נקדימון, מתרגמת

עמודים קבועים

בזמן האחרון

נושאים

Subscribe2

איך מזהים?

12/04/2011


כשחושבים על זה, כושר הזיהוי האנושי מפליא. וחושבים על זה, כל האנשים החכמים שמנסים לגרום לתוכנות לזהות דברים שתינוקות מזהים כמובן מאליו. למשל ששלוש שיערות שפם ואוזניים מחודדות משמען חתול. או שחצי עיגול יכול להיות בננה, או נדנדה, וקו קטן שנוסף לו באמצע הופך אותו למטריה (כל הדוגמאות מהחוכמות של נגה בגיל שנתיים).

במסגרת התנדבותי עבור הספרייה האלקטרונית לאנשים עיוורים, לקויי ראייה ודיסלקטים התקנתי לאחרונה קובץ של הספר “אורה הכפולה” מאת אריך קסטנר בתרגומו לעברית של מיכאל דק (הוצאת אחיאסף). הקובץ נסרק מן הספר המנוקד, ותוכנת ההמרה התקשתה מאוד להתמודד עם האותיות המנוקדות ולהמיר אותן לטקסט נקי שישמש את התוכנות של הקוראים העיוורים. התוצאה היתה בחלקים רבים של הספר רצפי אותיות משונים מאוד. למשל זה:

״מכל מקום יותר מ$אבו ךאויים לו,״ הוא אומר בלבד לאש, ״אבל לא יותר משאבךובו יכולים לעזאת

השוויתי למקור ותיקנתי, והנה צורתו הנכונה של המשפט:

״מכל מקום יותר משאנו ראויים לו,״ הוא אומר בכובד ראש, ״אבל לא יותר משאנחנו יכולים לשאת.״

עם זאת, לאורך העבודה הסתבר לי שלמעשה את רובם של התיקונים אני מזהה בעצמי, ורק מוודאת מול המקור שניחשתי נכון, בניגוד לתוכנה המקורית, שניחושיה היו מושכלים פחות (מן הסתם).

זה מזכיר את הקטע באנגלית שכיכב במיילים רבים לפני כמה שנים, ובו האותיות בתוך כל מילה מעורבבות, ולמרות זאת אנחנו מבינים אותו כמעט בלי בעיה:

Unisg the icndeblire pweor of the hmuan mnid, aocdcrnig to rseecrah at Cmabrigde Uinervtisy, it dseno’t mttaer in waht oderr the lterets in a wrod are, the olny irpoamtnt tihng is taht the frsit and lsat ltteer be in the rhgit pclae.

(הקטע המלא והנוסח המתוקן שלו בקישור)

reCaptcha“הארץ” פרסם כתבה על reCaptcha, השיטה לאימות אנושיותם של משתמשים באתרי אינטרנט שבה השתמשתי לאורך תקופה מסוימת גם באתר הזה. הרעיון שמאחורי השיטה הוא שבני אדם מזהים אותיות מעוותות במידה רבה של הצלחה, בעוד תוכנות (כולל אלה שמנסות למלא תגובות לאתרים בספאם פרסומי) מתקשות לעשות זאת. reCaptcha תופסת שתי ציפורים במכה אחת, כיוון שתמונות המילים שבהן היא משתמשת לאימות האנושיות לקוחות מסריקות של ספרים ישנים, והן כאלה שתוכנות לא הצליחו לזהות. כאשר המשתמשים האנושיים באתרים מקלידים את המילים כפי שהם זיהו אותן, הם מפענחים בכך טקסטים שיוכלו להיפתח בהמשך לכלל הקוראים. דרך מצוינת לרתום כוח-מוח בחינם להעשרת הידע האנושי.



2 תגובות »

  1. אינגה מ. כתב\ה:

    איזה יופי, לא ידעתי על העניין הזה עם ריקפצ’ה… ולגבי הקטע המשובש שהבאת באנגלית, אני חושבת שהמוח שלנו מתוכנת לקרוא “נכון” את המילים גם כשהן שגויות. ולכן אנחנו אף פעם לא יכולים להגיה את עצמנו כמו שצריך, כי אנחנו יודעים מה כתוב והמוח שלנו קורא את הטקסט כמו שצריך להיות ולא כמו שהוא באמת.

    12/04/2011 בשעה 12:39 pm

  2. Inbal Saggiv כתב\ה:

    נכון מאוד, אינגה. לכן גם העברתי את “אורה הכפולה” לעריכה אחרי המוני התיקונים שלי אצל מתנדבת נוספת (הייתי משבחת אותה כאן, אבל אני לא יודעת אם היא מעוניינת).

    13/04/2011 בשעה 11:05 am

כתיבת תגובה