האלגוריתם שפותח על ידי חוקרים באוניברסיטת וושינגטון משתמש ב"למידה עמוקה" על מנת להשמיע אך ורק את רעשי הסביבה שהמשתמש מעוניין לשמוע ובמילים אחרות – מהיום תוכלו לבחור את רעשי הרקע הרצויים 

אין כמעט יצרנית אודיו שלא מתגאה בתכונות ביטול הרעשים של האוזניות שלה. הבעיה היא שסינון הרעשים הוא לא בררני. במילים אחרות, המאזין לא שומע כלל רעשי רקע או שומע אותם בעוצמה נמוכה ביותר. קבוצת חוקרים מאוניברסיטת וושינגטון מנסה להתגבר על הבעיה הזו באמצעות אלגוריתם "למידה עמוקה" (Deep Learning) שהוא למעשה אלגוריתם AI שלומד באופן הדרגתי כיצד נשמעים רעשים שונים במטרה לסנן אותם ולהעביר אל המאזין רק את אלו שהוא רוצה לשמוע.

 החוקרים קוראים לאלגוריתם שלהם "שמיעה סמנטית". איך בדיוק זה עובד? במקום שמסנן הרעשים יהיה חלק ממבנה האוזניות עצמן, רעשי הרקע מעובדים על ידי האפליקציה החכמה והיא מחזירה אך ורק את צלילי הרקע שהמשתמש בוחר לשמוע אל האוזניות. נכון להיום יש בערך 20 קטגוריות שונות כמו למשל סירנות, בכי של תינוקות, דיבור, ציוץ ציפורים ואפילו רעש של שואבי אבק…

למשל, כפי שרואים בסרטון אדם יכול לבחור לשמוע אך ורק נקישות על הדלת כאשר הוא משתמש בשואב אבק מרעיש או אך ורק את ציוץ הציפורים ולא קולות רמים של חבורת אנשים לידו.

 

על פי החוקרים, מדובר באתגר גדול יותר מכפי שהוא נשמע (תרתי משמע). לא בהכרח בשל הצורך לזהות את הצלילים, אלא על מנת לסנכרן את הצליל שהמשתמש שומע מבחוץ עם החושים החזותיים שלו. אחרת עשוי להיווצר מצב דומה לזה של חוסר סנכרון בשפתיים, כפי שאנחנו מכירים טוב מאוד משידורים דיגיטליים (לדוגמה, אצל קריין בחדשות…).

מסיבה זו לא ניתן לבצע את הסינון בענן (שרת מרוחק), אלא הדבר חייב להתבצע דרך אפליקציה בטלפון. האלגוריתם חייב להתאים את עצמו לשמיעה ההיקפית באמצעות שתי האוזניים וצלילים שמגיעים מכיוונים שונים. כמו כן, על פי הדוגמאות שהחוקרים הציגו, נראה כי כל האוזניות בהן נעשה כרגע שימוש הן אוזניות חוטיות, מה שמאפשר להגיע לזמן תגובה של 6.56 מילישניות בלבד. 

הנסיינים שהשתתפו בפיתוח העידו שהצלילים נשמעים טבעיים יותר בהשוואה להקלטות קיימות של אותם הצלילים. בהקשר הזה, אי אפשר שלא לחשוב על השימושים הפוטנציאליים של הטכנולוגיה במניעת תאונות. לדוגמה, מי ששומע מוזיקה יוכל לבחור לשמוע אך ורק רעש של מנוע מכוניות וכך לא לסכן את עצמו כאשר הוא עובר במעבר חצייה. דוגמה אחרת היא של עובדים בתעשיית הבניה שיוכלו עדיין לשמוע מה העובדים האחרים אומרים באופן ברור.

נכון להיום האלגוריתם  עדיין לא עובד בצורה מושלמת ולפעמיים יכול למשל להתבלבל בין מוזיקה ווקאלית לבין דיבור אנושי. ובכל זאת, החוקרים בטוחים שהשקת גרסה מסחרית של האלגוריתם היא רק שאלה של זמן.

מי שמעוניין להבין את הנושא באופן טכני ולהתנסות בעצמו, יכול לגשת לדף הייעודי שהוקם למטרה זו.

קרדיט תמונה ראשית – Freepik Premium

Share.

Leave A Reply

Time limit is exhausted. Please reload CAPTCHA.

מתכננים לשנות אווירה?

קבלו חמישה טיפים מהאדריכלית המובילה שירלי זמיר

הכירו את המקרן החדש מבית

LG