Categories
Stadiums

כל מה אמרת? שתבדקו לא מדעית הנקרא שירותי תמלול אוטומטיים

שובב יותר מכך השנה, בזמן שהשתתף בסדנת סופרים, עיתונאית המדע העצמאי ג’סיקה וופנר הדהימה את אותה החדר כשנושא התמלול טפח. הנוכחית וסופר מדע את כל בלוח הזכירו שאנו תמללו את הראיונות שאיתם, וכי הם עשו את זה בעצמם. “כולם בכיתה הסתכלו אנו צריכים לדוגמא, מה? כאילו שימשו לכולם שש עיניים, “נזכר וופנר. חילופי העניינים גרמו לה לדמיין מחדש על אודות השירות לרכבת התחתית. מימים אלו הנוכחית נעשתה בררנית בהרבה על אודות מהם של מתמללת, ואפילו טרנסקציה בשימוש בתמלול אוטומטי. זאת שמעה בדבר אגודת תמלול אוטומטי בשם תמי והחליטה לתת להם באמצעות. או שמא כזה זוהי נודעה מרוצה. “תעתיק אוטומטי ניווכח מוצק”, בכלל וופנר. “אני מהרהר שכשזה איננו הולם נקרא סוג ניתוח וזאת ולכן העסק שלך מתרחש ומקשיב להקלטה.”

לעומת אפשר נמכר בשם להקליט ראיונות תוך שימוש מקורות, עיתונאים נאלצו להתמודד יחד עם ההחלטה או שמא לתמלל רק את חומרי הפורמולה הזה, ואם כן כמה. עיתונאים תוך שימוש משאבים כספיים או שמא מוסדיים יודעי דבר יוכלו לשכור אדם ואדם רק את להאזין ולהקליד את הראיונות, דרך פעם אחת מחברות עצמאיות מבוססות כהנה וכהנה המציעות עזרת תמלול מבוססי אנוש. נוני הסידורים הנותרים נאלצו בעשיית זאת בעצמם. היום הופיעו מקוון של שירותי תמלול שמעבדים אודיו אם אוטומטי. כל אחד יכולים להעלות את אותם קבצי האודיו הדיגיטליים הגולמיים שאליהם לאתרי אינטרנט של בתי עסק לדוגמה ו- שאלגוריתמי הדיבור לטקסט שאליהם יוצאים אליו להתחיל לעבוד בהמרת הנתונים. אולם מחיר התמלול האנושי המסורתי זו בסביבות $ 1 לדקת שמע, תאגידים אוטומטיים נוחים כמו למשל $ 0.חמש לדקה, או פעמים רבות יכולים להיות בחינם (עם מגבלות). תשלומים שאינן יקרות הנ”ל העמידו תעתיק אוטומטי בהישג יד לקראת עיתונאים יודעי דבר.

טרינט $ 15 לשעה (המחיר יורד יחד עם תוכניות חבילה ענקיות יותר)
כותבי מדע מתמודדים עם מעמד יקר שיש להן תמלול מיקור מעבר – פעם אחת או אולי נולד לאיש רק את עד למכונה – מפני המילים הטכניות שעולות לפרקים קרובות בדיאלוג בעלי מקורות. קטרינה צימר, עיתונאית מדעים ונתונים פרילנסר שממוקמת בניו יורק, נהגה לתמלל אחר הראיונות לה בעצמה מפני הפרעות בם נתקלה בשירותי תמלול תמלול זום . “ניסיתי רק את טרינט אך מצאתי שזה נעדר ניצול לראיונות הקשורים למדע שנעשים באופן מיוחד בתנאים ממש לא אופטימליים למשל סקייפ”, זו מגלה. לדוגמא, לסיפור אקולוגי על הפרקט דיווחה, התהליך האוטומטי המשיך לתמלל “דינגו” כ”דונג-דונגס “.

קרל צימר (ללא איחוד לקטרינה) אומר היות לדעתו תעתיק אוטומטי עבר בשנים האחרונות סף דיוק שהופך אודותיו ליעיל. “אני זוכר שחלמתי לפנות זה”, בכלל צימר, שיש לו טור ב”ניו יורק טיימס “ומחבר ספרי קריאה מגוונים אודות מדע.

האפשרויות הפורחות לתמלול אוטומטי הותירו אי אלו עיתונאים מגרדים בראש לדעת אף אחד לא מה הכי מצויין. השוואות שירותי רשת תמלול אוטומטיים באו למסקנות מגוונות. הערכה לעומק שהיא פוינטר הגיעה למסקנה שטרינט נמכר בשם “כלי התמלול האוטומטי אידיאלי לכל אלו שנמנים על העיתונאים”. בינתיים, סוכנות פרסום דיגיטלית אשר נקרא 47 בדקה 6 עזרת תמלול והגיעה למסקנה כי ו- התעופפו במקום הראשון פעם אחת השיטות האוטומטיות. אתר הסקירות ששייך ל הניו יורק טיימס בחר את אותה תמי. לעומת של מגזין נעשה שוויון בדירוג הטוב ביותר גם מגוון פעולת תמלול אוטומטיים.

העמדת תאגידים אוטומטיים למבחן
כדי להבדיל טוב יותר איך עזרת תמלול אנשים רבים הצטברו לעיתונות מדעית, המחברת המזמינה שלחה 2 פיסות ראיון השייך 15 רגעים לסיפורים שדווחו לפני עשור לארבע בתי עסק המציעות תמלול אוטומטי: תמי, אוטר, סוניקס וטרינט. שלחנו את כל נקודות גם כן ל- בעלי חברת תמלול אנושי מובהק. שתי השיחות היו באנגלית והוקלטו על מקליט קול אלקטרוניקה מטעם אולימפוס. ראיון מי התקיים טלפונית בשיתוף גנטיקאי זכר יליד טייפה, טייוואן, ששפת למקרה ממנו אינן הייתה אנגלית ושדיבר במבטא (מכשיר האולימפוס קיבל קלט שמע כלילי דרך מחבר יומן קווי), והשני הוקלט בלב אף אחד לא בעלי אנדוקרינולוגית בקיימברידג ‘, בריטניה, שהיה מי שיש ברשותו מבטא בריטי.

לראיון הטלפוני עם המדען שהיה דובר אנגלית שהוא לא יליד, בית עסק התמלול שיצא מעט יותר בהקשר של הדיוק נמכר בשם מעבדת טלפונים התמלול המסורתי והאנושי, הכומר. משמש לקח זמן רב ו דקות עד שהתמליל נהיה חזר, נוני הדיוק ששייך ל (אם מכיוון ש לא מושלם) טפח למעלה בנושא הוא למעשה מטעם tהוא עשה אגודות אוטומטיים.

רק אחת התוצאות הטובות המפתיעות נתפסה היאך השירותים שמציעה המיוחדים תמללו את אותו המילים “התפוצצות קמבריאנית”, חגיגה מכריע לפני כ -מיליון קיימת אם בעלי חיים ספציפיים אלו או אחרים הקיימים לראשונה בתיק המאובנים. מתמלל ה- האנושי אינם הצליח לפענח את כל המילים וציין זאת כ”בלתי נשמעים “, וזוג תאגידי אוטומטיים גם כן תמלל את אותה הביטוי” פיצוץ קנברה “(חבל על תושבי העיר האוסטרלית ההיא!). עלינו להציע, יחד עם זה, אוטר קלוט מוצלח.

הראיון הבא, שנערך בעזרת דובר אנגלית שפת או, חזר בזמן קצר במהירות יותר מזה היכן שהיה ההתחלתי – הנו לקח שעתיים מאוד. לראיון הוא למעשה, ההבדל בטיב הדיוק בין שירותי תמלול אוטומטיים הינו כמו למשל, מדי המערכות האוטומטיות העבירו בצורה מדויקת מונחים טכניים דוגמת “היפותלמוס” ו”לפטין “.

אחת בלבד המערכות האוטומטיות שבדקנו, מצאנו מרחק מוקדם בביצועים או גם בזמן קצר. מהמדה 4 התמלולים החזירו יותר מזה בזמן מועט היכן שעשתה לקח לתוצאות תוצאות פעם אחת 5 לתשע זמנים. ונראה שדיוק הטקסט שהועתק במכונה רלוונטי יותר מכך לרמת הקלטת האודיו ולבהירות ההגייה נותן אפשרות לשירות שבה יוצרים עשיית שימוש.

דובר (חברת במידה ש המתקיימות מטעם באופן כללי היות עיתונאים עלולים להגדיל רק את ההצלחה של תמלול אוטומטי דרך, למשל, תוך כדי מיקרופון חיובי או אולי אפליקציית הקלטה בעלת אמינות כדי לקלוט צליל שהן אינן, ועל ידי התשורה עבור מקורות לסיים את אותו הדיבור על מנת למנוע הצטברות מהידברות צולבות. “יש כאן אפליקציות או גם כלים שאפשר נוסף על כך להריץ בעזרתם קובץ שמע היכולים למחוק רעשי רקע”, זוהי מציינת בהתייחס למוצרים כמו (לאייפון), (ל- או גם מעבדות. מלאכה זאת עלולה לאפשר בשיפור נוי התמלול האוטומטית, הזאת מוסיפה.

שום שלעיתים קרובות תכשירי התמלול האוטומטיים יש צורך ממשקי נעזר דומים, קיים הבדלים רגישים. לדוגמה, קטעים שהועתקו והודבקו מתמלילי טרינט יקימו חותמות הרבה זמן, והממשק שהיא תמי נותן סמלים בכתום כדי להוסיף שהאלגוריתם בזול בטוח יותר שהוא גרף אותן אפשרי.

קרל צימר בכלל מכיוון ש לשירותי התמלול האוטומטיים שניסה שימשו ממשקי משתמש בעלי עיצוב היטב הכוללים יכולות כמו סרגל מציאה מהירה ובקר מהירות. יכולות אילו מיומנות לקזז את גרור הצורך להתמודד יחד העדר דיוקים בתעתיק מכיוון שהם מציעים לנכס לפנות להצעות מחיר מצויינות זריז. יחד עם זה, בכלל בין אשר הוא משתמש בתעתיק אוטומטי, הנו עובד פונה לקבצי האודיו הראשיים כדי להבטיח יאריך שהמילים שהועתקו חיוביות. דוגמת אשר הוא אומר: “אם אני בהחלט טועה, נקרא עלי, אינו קלוש

לתמלל או אינו לתמלל
אי אלו עיתונאים מצמידים שיודעים קצרנות יכולים להתיז הערות רציפות ומילוליות לגבי הנייר כשמישהו מסביר. עיצוב ייחודי נלווה מסוג ערך הוא למעשה מי שיכול למצוא דייו מהר על מנת ללמוד את כל מילות המקורות שהם עושים בדרך ואמינה ככל שמתרחש הראיון בזמן כראוי. קארה גיאימו, עיתונאית מדעית פרילנסרית שמהירות ההקלדה הממוצעת לה מתקרבת עבור 100 תוים לדקה, אומרת מסוג מתעדת שיחות כגיבוי, אך למרבית מקלידה הכל כפי שנהוג שמדובר הדוברים. לדבריה, התרגול חסך בידה “אינספור שעות” זמן רב ושיפר את כל כישורי ההקלדה לה.

עם זאת, כולנו מוכרחים להתמודד יחד אי אלו – ובאיזו תדירות – לתמלל ראיונות. בכדי לתפוס הרבה יותר מסייע ב אך שברי ראיון מילה במילה, לחלוטין העיתונאים מסתמכים הפרקט כיום נהפך למוצר שמצוי בבתים רבים בדבר כלי הקלטת שמע ועל גבי תעתיק אנושי אם אוטומטי מעתה ואילך.

קיים חסרונות בהאזנה לאודיו ותמלולו. לדוגמא, כאשר חיבר מקיימת זו, צריכים להיות יכולים לקחת דקויות כמו הפסקות וצחוקים שאולי לא קלטו בהערותיהם מזמן ידוע, בכלל וופנר.

עיתונאים רבים ומגוונים חושבים היות תמלול כל – עצמם או אולי שימוש בצבא – עשוי לעשות לעיכובים מיותרים אם הם ככל הנראה יוצאים אליו דיווח על אודות האירוע של לא ארוך. קרל צימר מסביר היות שיחותיו לכתבות בעיתונים אורכות המון רק אחת 15 בשביל -30 רגעים והוא עשוי לאפס בזמן קצר את הדבר הראוי בהערותיו ובהקלטותיו על מנת ליטול רעיונות. לדבריו, תמלולים מלאים, על ידי חברות אוטומטיים, אלו עם סכום רחב יותר לפני יכולות מגזין או אולי ספרי קריאה, ביקום משמש יכול לנסות עת על אודות עת שיש להן מקורות ויהיה להמציא אותו לעשות ביקור שוב פעם בשיחות מתכנת בפירוט רב בהרבה יותר.


“זה פשרה, ולכן אתה מומלץ להסתכל על גבי סכום הכסף שלכם – בדבר תקציב הכספים שלכם ואודות תקציב הזמן שלך”, באופן כללי צימר. “חברות התמלול האוטומטיות מתחילות להחליף רק את האופן בה הייתי מסתכל בדבר הפיצוי דבר זה היות הנישות בעלות קלות ומהירות יותר מזה, ובמקרים רבים זולות יותר.”

התעסקות ביטחוניות
מכיוון שכותבי מדע החלה להעלות קבצים קליינטים לשירותי תמלול מקוונים, החלק שלהם תהו על התוצאות הטובות הביטחוניות שנחוץ באופן זה, כולל שאלת למקרה הינו אמת לספק תאגידיים חיצוניות לטפל בהקלטות הראיונות אשר בהן. דאגות כאלה התעוררו בקיץ האחרון, כאשר גוגלהודיעה בדבר השעיה זמנית ששייך ל עיבוד ההקלטות הקוליות שיטה אביזר בשבילה באיחוד האירופי. בהתאם ל גלובל מדיק ידוע בגלל קבלן שהחברה שותפה שיחד עימו לתועלת דיוק הכלי הדליף קטעים מסוג בהרבה יותר מ -שיחות מבודדות, בא עם מספר שהכיל בניית רפואי, לכלי תקשורת. אפילו שעוזר גוגל אינם בעלי חברת תמלול, האירוע הדגיש בגלל אמצעי זיהוי דיבור בהיי-טק חשופות לבעיות אבטחה.

פעולת התמלול שבדיקת המחברת המזמינה אומרים אנחנו מכיוון ש מוטל עלינו לו מדיניות מדוקדקת למען לאשר את אבטחת קבצי לקוחות עסקיים ופרטיים. לדוגמא, (שבבעלותו שהיא אפילו השייך משתמשת באבטחה בטיב הבנק למוצריה, למעשה זוהי מצפנת את אותו נתוני המשתמש הנקרא שומרת או גם משדרת, וכי זוהי מייצר גיבויים יומיים למיקום מאובטח את. משמש אף מוחק לצמיתות קבצי לקוחות על פי בקשה.

האם פנו אליו על אבטחה, הדגיש אוטר בגלל ש הינו קורה שיש להן צדדים שלישיים על מנת לפקח על איומים זדוניים אפשריים אודות סביבת מחשוב הענן מהצלם. הוא גם מטהר פרמטרים מתיקיות האשפה ששייך ל המשתמשים אם וכאשר אוטומטי בסיומה של 30 זמן (או קטן בהרבה אם יוזם את המקום המשתמש) ובלתי שומר בעתיד כמעט כל עותק שהיא ההקלטה או אולי התמליל. אוטר מציין בגלל כלל מכבד דרישות אפשרות זימון, אולם רשויות אכיפת המשפט מיומנות וידע להשיג גישה לתכנים על ידי צו מציאה מהירה.



שום ההבטחות שהיא נגריות תמלול להגנת אלמנטים, הסכנה ששייך ל הפרות אזעקה ומסירה לא רצויה הנקרא מידע לאכיפת החוק ועוד מקומות מסתמנת כאפשרות. זה היעד שהרעיון להעלות ראיונות קלים לענן מחשבים אלו המשמשים את אותה עזרת התמלול האוטומטיים כדוגמת אלו איננו עף להוריש מהעיתונאים. “אני אינן יוכל ליטול את אותה הסיכון לעיסוק שאני עושה”, בכלל צ’רלס פילר, ערך חקירות המתקיימות מטעם מדע שמעולם אינם גולש בשירותי תמלול. “פשוט אהיה פרנואידית מכדי שבנסיבות המאוד אינן סבירות שהייתה הפרת אלמנטים, שהמקורות שלי ימצאו פגיעים. האמינות שלי ככתב חוקר תהיה בסיכון. ” *

מבטאים בפני אוטומציה
לנוכח האופי העולמי מטעם מדע ועיתונות מדעית, מומלץ לכלול כי תמלול אוטומטי מוכן במסת שפות שאין הן אנגלית. טרינט, למשל, נותן תמיכה בתוך -28 שפות, מורכב הונגרית, הינדית, מנדרינית סינית, יפנית ולטבית. החל מחודש ספטמבר החלה העסק לעשות תוספת של וגם מעבדת טלפונים תרגום. משתמשים יש בכוחם היום ביתי לתרגם את אותו תמלילי ה- שלם מכול פעם אחת מ -28 השפות אשר בהן היא תומכת. מוכרת תמלול ותרגום גם כן במגוון שפות, מורכב ערבית ואינדונזית.

מבטאים מסוגלים וגם לסבך את כל התמלול. מדי פעם קרובות עיתונאים שמקיימים ראיונות באנגלית מתעצבנים בנושא כמה נכונה פעולת תמלול אוטומטיים יש האם מינימום לדובר מי מוטל עלינו מבטא איננו אמריקאי. עיתונאי המדע האוסטרלי דיאני לואיס באופן כללי בגלל שירותי תמלול אוטומטיים יושלכו מפעם לפעם באמצעות המבטא לעוזרת. אבל הזאת מספרת שיש ברשותם עבודה גרועה הרבה יותר בתמלול הקיוויים הסמוכים שלה: “אני צריכה להזכיר שלאחרונה עשיתי סיפור יחד כמה אתם מניו זילנד, וגם, תמלול אוטומטי בהחלט שלא מתעמת בעלי מבטאים ניו זילנדיים . ”

פרייאנקה פולא, עיתונאית מדע ורפואה המדווחת במיוחד מהודו, מציינת היות היא ראתה תעתיקים אוטומטיים מצטברים בתנאי מקצועי בראיונותיה. הנוכחית תוהה עד המבטא בידה יכול להרים תרומה לנושא נקרא. “אני חושד – בוודאות שאני אינו הוא בעל ידע ודאי, מכיוון שאין עבורנו על כל מסוג שליטה פשוט – שהתהליך אינן מנקה נכונה בעלי מבטאים הודים”, אומרת פוללה.


יש להמנע מ הינו מפתיע ששירותי תמלול אוטומטיים יתמודדו בעזרת מבטאים אלו או אחרים, בכלל ג’וזף פרידמן, החוקר אחר האפשרויות התקשורת המדעית, כולל תקלות הנוגעות לפוליטיקה ולפרקטיקה מסוג תמלול, בהם המדעית האפקטיבית הבין-תחומית במעונו החולים המלא מטעם אוניברסיטת נורת’איסטרן / מסצ’וסטס. האלגוריתמים הממוחשבים שמפעילים פירמות כדוגמת אלו מפתחים הטיה בהתאם לשמע האימונים שעוסק ליצירתם, הנו באופן כללי, והם מטילים רק את ההטיה היא בשביל מה שהם מעבדים. “מוח הנקרא אוכל סגנונות יחודיים ששייך ל שפה וגורם עבור כל הנושאים הנותרים לסגל את זה”, מעביר פרידמן.

זה גרידא חוסר נגישות לעיתונאים, מזהיר פרידמן – הנו בנוסף איום עתידי על גבי המגוון וההכללה במתקני, מכיוון שכתבים אמורים לבחור בתת מודע מקורות שנתפסים כמגיבים באנגלית אמריקאית סטנדרטית כדי לוודא תמלול נקי בהרבה יותר. נקרא קורא לעיתונאים להישמר מכיוון נטייה זו להפנים אחר ההטיות שתעתיק אוטומטי יכול לעודד כנגד דוברים תוך שימוש מבטאים. “בכל בודדת שמשהו לרוב שהתהליך יקל מוטל עלינו פרויקט, משמש בייחוד קונה לבבנו להפסיק לתכנן אודותיו באופן ביקורתית.”