דו"ח בנושא עברית ותקינה
חברי הצוות:
מר דורון שקמוני, יו"ר
מר מתתיהו אלוש, חבר
מר יונתן בן אברהם, חבר
פרופ' עמנואל גרינגרד, חבר
מר אלי הרשקוביץ, חבר
מר גיל מור, חבר
מר יונתן (ג'וני) רוזן, חבר
מר דוד רשתי, חבר
תהילה ברייטברט, מרכזת הצוות
הצוות עסק במגוון תחומים, אשר מטרתם לאפשר
לאזרחי ישראל, שימוש נח ויעיל בטכנולוגית המידע.
פריצת אוטוסטרדת המידע לישראל אינה מתקדמת בקצב הראוי, עקב מחסור
בתוכנות מתאימות לשימוש חופשי בעברית ברשת, חוסר סטנדרטיזציה ובעיות הבטחת
מידע.
הצוות עסק במתן פתרון לסוגיות אלו, המהוות חסם בפני הטמעת השימוש
באוטוסטרדת המידע הלאומית.
מסמך זה מסכם את עבודת הצוות לנושא עברית ותקינת עברית, במסגרת
הפעילות להגדרת היערכות מדינת ישראל לקראת עידן המידע, מטעם ועדת הכנסת לתקשוב
ומידע.
מטרת המסמך לזהות נקודות בהן נדרשת התערבות או פעילות שלטונית כדי
להסיר מכשולים העומדים בפני החברה (והמדינה), בדרכה להיעשות "חברת מידע", ולהמליץ
על דרכי פעולה.
המסמך מציג סקירה של הבעייתיות ביישום עברית במערכות מחשב, ובייחוד
במערכות פתוחות ומרושתות (בדרך כלל באינטרנט), ומערכת המלצות לפעילות ממשלתית
העשויה לסייע בהתקדמות לעבר מערכות פתוחות "דוברות עברית".
מתחילת דרכו, עושה עולם התקשוב שימוש בעיקר בשפה
האנגלית. שפות התכנות מתבססות על שפה זו; התוכנות למיניהן מציגות מידע והודעות
למשתמש באנגלית; אפילו המקלדות והצגים מוכנים, בדרך כלל, לשימוש באותיות לטיניות.
השפה ה"טבעית" למחשב היא אנגלית.
שימוש רחב במחשבים בארצות הדוברות שפות אחרות מחייב, כמובן, התאמתם
לשפה המקובלת באותן ארצות. קל לראות, עם זאת, שהתאמה כזו לשפה המבוססת על האלפבית
הלטיני לא תהיה קשה במיוחד. לדוגמה, אם ירצה הצרפתי לעשות שימוש במחשב בשפתו, יוכל
לעשות זאת כמעט ללא שינוי עקרוני. אם ירצה להיות בין המהדרין, יצטרך להוסיף
לתוכנות (ולמקלדות) את התווים המיוחדים לצרפתית (כגון י, א, oe וכד'). מעבר לכך,
לא נדרש הרבה כדי ליצור מסמך או להתכתב בדואר אלקטרוני בצרפתית.
לעומת זאת, שימוש במחשב בשפה העברית מהווה אתגר גדול בהרבה. מעבר
לשימוש במערכת תווים (אותיות) שונה לחלוטין מהלטינית, מצטרפת בעיה חדשה: כיוון
הכתיבה. כתיבה מימין לשמאל היא בעיה כשלעצמה עבור תוכנות המחשב; לא כל שכן
כשאמורים הדברים בטקסט המכיל ספרות או טקסט מעורב עברי \ לטיני (ראה הרחבה
להלן).
עם השנים ניתנו פתרונות שונים לבעיה - והדגש הוא על המלה
שונים. חברות מחשבים שונות נתנו פתרונות עברית המתאימים לעבודה כאשר
עובדים בסביבה "טהורה" של אותה חברה. גם צרכי המשתמשים השתנו עם השנים - מיישומים
בסיסיים של רישום ודיווח וניהול חשבונות, ליישומי תקשורת ועיבודי טקסט וגרפיקה.
בנוסף, חלק מהפתרונות שיושמו אינם תואמים את כיווני ההתפתחות של התקינה
העולמית.
פריצתה של מהפכת המידע, ורשת האינטרנט כביטוי הבולט של מהפכה זו,
חידדה את הבעיה המרכזית לעיל: חוסר תקן אחיד בצורת הטיפול בעברית מקשה במידה רבה
את האפשרות לקישוריות פתוחה בין אנשים ומערכות שונות, בשפה העברית. קל לזהות,
שהחוסר בפתרון ברור, חד משמעי ויחיד מעכב ועלול לעכב גם בעתיד את חדירתה של תרבות
המידע והתקשוב לשכבות הרחבות של הציבור מחד, ולמערכות הכלכליות והמסחריות
מאידך.
פתרון מוצלח לבעיית העברית יביא לתוצאות הבאות:
השלטת תקן אחד ושיטה אחת במקום
"מגדל בבל" של השיטות ליישום עברית - בתאימות לתקנים הבינלאומיים.
יצירת מנוף במשקל מספיק שיעודד את
יצרניות התוכנה החשובות לתת פתרונות בעברית, לפי התקן הקובע דלעיל.
קיומו של מבחר מספק ומגוון של כלי
תוכנה בשפה העברית, נגישים לציבור הרחב, שיספקו את הצרכים לשימוש על גבי רשתות
המידע בהווה ובעתיד.
יצוין כאן מייד, כי אין כאן יומרה להציג פתרונות שייצרו עולם מיחשוב
מלא בשפה העברית, שבו כל היישומים, הכלים והמערכות פועלים בעברית. אין להניח שמצב
אוטופי מסוג זה יושג בזמן הקרוב. המטרה, כפי שהוצג לעיל, היא לאפשר יישום עברית
בכלי התקשוב הקיימים, בצורה שתאפשר שימוש בטקסט עברי בצורה נוחה על גבי רשתות המידע.
בעיית יישום העברית במחשבים מתחלקת לשני מרכיבים
עיקריים, שונים מאד באופיים ובפתרונות הנדרשים עבורם:
ייצוג התווים (אותיות, Glyphs)
העבריים. זה כולל ייצוג התווים בזכרון המחשב, וייצוגם באמצעי קלט-פלט (מקלדות,
צגים, מדפסות וכד'). עד כמה שיכול הדבר להישמע מוזר, זוהי הבעיה הקלה יותר לפתרון.
הטיפול בכיווניות הטקסט. יש לטפל
בטקסט עברי "טהור", ובטקסט מעורב.
לייצוג דיגיטלי של תווים עבריים הסטוריה ארוכה,
ומספר פתרונות רב. בשנות ה-
60 וה-
70 השתמשו, ברוב המערכות דאז, בייצוג שתפס את מקומם
של תווים לטיניים, אם אלו האותיות הגדולות A-Z (שימוש שנוהגים לכנותו כיום Ancient
Code) או האותיות הקטנות a-z (Old Code). אמצעי הקלט-פלט הודרכו, ידנית בדרך כלל,
שמדובר בטקסט עברי, כדי שיודפס, או יוצג, או יוקלד, טקסט עברי. החיסרון בשיטה זו
ברור: קשה, או לא ניתן כלל, לעבוד עם טקסט מעורב (לטיני גדול \ קטן ועברי). היתרון
היה שניתן היה להמשיך לעבוד עם מערכת תווים דפיסים בת 7 סביות (Bits), שהיתה
מקובלת אז במערכות המחשבים.
עם הזמן הוצגו מספר פתרונות משופרים (כולם כונו New Code בזמן זה או
אחר, דבר שלא תרם לבהירות). המשותף לכולם היה הרחבת השימוש למערכת של 8 סביות,
וייצוג העברית במקום בו לא היו מוצבים תווים לטיניים. כך, ניתן לעבוד עם טקסטים
מעורבים. עדיין, עקב ריבוי הפתרונות, לא ניתן היה להעביר טקסט בין מערכות שונות
(ניתן להזכיר בהקשר זה את קוד יבמ למחשב האישי, קוד יבמ למחשב
המרכזי, ותקן ISO - ראה להלן).
ארגון התקינה הבינלאומי ISO הגדיר את תקן ISO-8859, שבו ניתן פתרון
ייצוג לשפות רבות, כולל עברית וערבית. לתקן מספר חלקים, כשבכל אחד ייצוג לסביבת
שפה שונה, והכל במערכת של 8 סביות. כך למשל מכיל ISO-8859-8 את תווי השפה העברית,
בשעה ש-ISO-8859-6 מכיל את התווים הערביים. תקן ISO-8859-8 אומץ ע"י מכון התקנים
הישראלי (במסגרת ת"י 1311). עבור ייצוג עברית במערכות של 8 סביות (כמעט כל המערכות
כיום), זהו התקן המקובל והמומלץ; זהו כיום גם התקן המקובל לעברית, במערכות
MS-Windows, Macintosh, רוב מערכות ה-Unix וכדומה.
מערכות של 8 סביות מציגות עדיין חיסרון פנימי מסוים, באשר לא ניתן
לייצג בו-זמנית יותר משפה לא-לטינית אחת (זאת, מכיוון שייצוגן של שפות שונות
ב-ISO-8859 מנצל את אותם קודים בכל פעם; כלומר, המקומות המשמשים לתווים העבריים
משמשים גם לערביים, לצרפתיים וכד'). במטרה לפתור בעיה זו ולהגיע לפתרון "מושלם"
לייצוג כל השפות בעולם, מציע קונסורציום Unicode להשתמש במערכת בת 16 סביות.
במערכת כזו ניתן, תיאורטית לפחות, להציג 65,536 תווים שונים - די והותר לייצוג כל
השפות המקובלות (כולל שפות מזרחיות לא מעטות).
תקן Unicode 2.0, שאושר לאחרונה, מכיל ייצוג שלם לשפות רבות. עבור
עברית, הוא מכיל גם את סימני הניקוד וטעמי המקרא. יש לצפות שהשימוש ב-Unicode יגדל
במידה משמעותית תוך שנים מעטות; התפתחות רשתות המידע (ובראשן האינטרנט), והדרישה
הגוברת להתאמת הרשתות לשימוש רב-לשוני וגלובלי (בינאום - Internationalization),
יוצרים את הצורך והקרקע לכך.
נושא הכיווניות מורכב יותר וחד-משמעי פחות
מקודמו. השאלה כאן היא באיזה סדר יש להציב את התווים העבריים בתוך זרם המידע
במחשב.
בשיטה החזותית (Visual)
מיוצג הטקסט במחשב באותו סדר בו הוא מוצג על נייר או על צג המחשב. לדוגמא, הרצף
"שמו Joe" ייוצג ע"י: J, אח"כ o, אח"כ e,
אח"כ רווח, אח"כ ו, אח"כ מ, ולבסוף ש. אם תרצו, זוהי גישתה של מכונת כתיבה. גישה
זו קלה ליישום אך גורמת לקשיים רבים בעיבוד הטקסט (עריכת שורות, גלישה משורה
לשורה, שינוי גדלי תווים, הקלדת טקסט, מיון טקסט ועוד). ייצוג טקסט ויזואלי גורם
לתוצאות "מוזרות" ובלתי קריאות אם ננסה לערוך מחדש את השורות (באורך שונה), למשל.
גישה זו אומצה כפתרון אד-הוק לייצוג עברית ברשת האינטרנט, בדואר אלקטרוני ובאתרי
אינטרנט (WWW) לא מעטים.
בשיטה המשתמעת (Implicit),
מיוצג הטקסט במחשב באותו סדר בו הוא נכתב או נקרא, כלומר הסדר בו הוא מקבל משמעות.
הרצף "שמו Joe" דלעיל, בהנחה שכוון הטקסט הראשי הוא עברי (מימין לשמאל),
ייוצג ע"י: ש, אח"כ מ, אח"כ ו, אח"כ רווח, אח"כ J, אח"כ o,
ולבסוף e. תוכנת המחשב אחראית להצגה ולהדפסה נכונות של הטקסט. שיטה זו
מתאימה לטיפול מתקדם בטקסט; יישומה בתוכנה אינו טריביאלי. בנוסף, יש להגיע להסכמה
לגבי השיטה (אלגוריתם) שבו תוגדר הכיווניות. תקן Unicode 2.0 שהוזכר לעיל הוא התקן
המקובל כיום כתקן הקובע לצורך כיווניות משתמעת.
קיימת גם שיטה שלישית - מפורשת (Explicit), אך היא נמצאת פחות
בשימוש בשנים האחרונות. בשיטה הזאת, סימני בקרה מיוחדים קובעים באופן מפורש את
הכיווניות של כל קטע.
השימוש באינטרנט מבוסס על סדרה ארוכה של תקנים
מוסכמים. למזלנו, ברובם אין צורך בטיפול מיוחד לעברית. אולם שני נושאים עיקריים
אכן דורשים התאמה:
HTML: תקן זה מגדיר את מבנה דפי
המידע באינטרנט, כולל גם ייצוג המידע הטקסטואלי.
בישראל קיימות דה-פקטו שתי שיטות
ליישום עברית ב-HTML: שיטת "סנונית", המבוססת על עברית חזותית, ושיטה המבוססת על
העברית המשתמעת של מערכת Windows. יודגש, שאף אחת משתי השיטות אינה תקנית, משום
בחינה. שיטת סנונית מאפשרת שימוש באינטרנט בעברית במערכות הפעלה שונות מבלי להזדקק
למערכת הפעלה עברית, ולכן ניתן לעיין בדפי אינטרנט כאלה גם בתפוצות, תחת מגבלות
השיטה החזותית. שיטת Windows מתגברת על מגבלות השיטה החזותית אולם היא ייחודית
למערכת הפעלה מסוימת, אשר, בין היתר, כמעט ולא ניתן להשיגה מחוץ לישראל.
לאחרונה אושר תקן אינטרנט ליישום
שפות זרות (שאינן אנגלית) ב-HTML - RFC2070, והוא מספק את הבסיס ליישום תקני של
העברית. יש להשלימו בקביעת המשמעות העברית של פונקציות שונות, כגון סדר טורים
בטבלה וכדומה. פעילות בכוון זה מתבצעת כיום במכון התקנים הישראלי.
הודעות (דואר אלקטרוני): קיימת
סדרת תקנים המגדירה מבנה מסרים באינטרנט (אם אלו מסרי דואר אלקטרוני, קבוצות דיון
ועוד). כחלק מסדרה זו, קיימת מערכת תקנים הידועה בשם הכולל MIME, שתוקננה במטרה
להעביר בתוך מסרים כאלה, אובייקטים "מורכבים" (כלומר, שאינם הודעה טקסטואלית פשוטה
באנגלית).
נושא העברית בדואר אלקטרוני הוסדר
ע"י תקנים מיוחדים (RFC1555/6), העושים שימוש בטכניקת MIME כדי להעביר מסרים
בעברית. דא עקא, תקנים אלה מגדירים היטב העברה בשיטה החזותית בלבד (בהקשר של דואר
אלקטרוני, חסרונותיה של זו פחות בולטים). לאחרונה מסתמן הצורך לרענן תקן זה
ולהכליל בו הגדרה מדויקת של השיטה המשתמעת.
קשה לתאר מצב בו בעיית העברית תיפתר במלואה ע"י
פעולות מטעם השלטון בישראל. קיימים מספר פרמטרים שקיומם חיוני לפתרון מוצלח;
לדוגמא:
1. הטמעת עברית מלאה בתקנים
הבינלאומיים. ניתן לראות הישגים מרשימים בתחום זה כיום, הרבה בזכות פעילות
רבת שנים של נציגים מישראל.
2. יצירת מודעות אצל היצרנים
החשובים של מערכות תוכנה, לצורך בתמיכה בשפות הדו-כווניות (עברית, ערבית ועוד).
ניצנים של מודעות כזו מופיעים כבר; קפיצת הדרך הגדולה תהיה, ככל הנראה, יישום מלא
של Unicode במערכות השונות (כולל, כמובן, ביישומים).
עם זאת, קיימים מספר תחומים בהם פעילות מכוונת בישראל עשויה לקדם את
הנושא לקראת פתרון מוצלח. עיקר ההמלצות מבוססות על עקרונות אלה:
הנחיית הגופים הממשלתיים ליישם
במערכות המידע שלהם עברית בתקן אחיד ואיכותי, שיוכיח עצמו כעדיף לטווח הארוך.
שימוש בעוצמתן הכלכלית של
ההתקשרויות הממשלתיות, כמנוף לעידוד תעשיית התוכנה ליישם את התקנים האחידים לעברית
במערכות השונות.
סיוע ביצירה מקומית של מגוון כלים,
ביניהם כלי עזר לפיתוח וכלי תוכנה למשתמש, שיעשירו את היכולת לתקשוב בעברית בקשת
רחבה של מערכות.
סיוע למערכת התקינה להשלמת תהליכי
תקינה הנדרשים לנושא.
יצוין כאן, כי אישור התקנים Unicode 2.0 ו-RFC2070 הוא פריצת דרך
משמעותית עבור כל נושא העברית. יש לצפות להתקדמות בנושא, הנובעת מההכרה הבינלאומית
בתקנים אלה.
כדי ליצור מנוף להשלטת תקן אחד קובע ליישום
עברית במערכות פתוחות, מומלץ לקבוע דרישות כלהלן, בכל התקשרות או מכרז
להתקשרות של גורמים ממשלתיים עם ספקי תקשוב:
מערכת התווים העבריים תהיה ת"י
1311 (ISO-8859-8) (במקרה של 8 סביות) או Unicode 2.0 (במקרה של 16 סביות).
בתחום שירותים מבוססי HTML (כגון
שרותי אינטרנט למיניהם), תהיה התמיכה בעברית מבוססת על RFC2070. שרתי המידע
(Servers) יידרשו לתמוך בתקן זה. מערכות ממשק המשתמש (Browsers) יידרשו לתמוך בתקן
זה, תוך מתן העדפה ברורה למערכת שתתמוך גם בשיטה הויזואלית (שיטת "סנונית"),
לשמירת תאימות למערכות שכבר נבנו. עם פרסום ת"י 4281 (בהכנה, מבוסס על RFC2070),
תינתן העדפה למערכות שיעמדו בתקן זה.
ככלל, יישום עברית במערכות תקשוב
יהיה על פי כווניות Unicode 2.0, לפי ת"י 1753 (בהכנה).
מערכות דואר אלקטרוני יידרשו לתמוך
בצורה מלאה בתקנים RFC1555/6. אם וכאשר יעודכנו תקנים אלה (ראה לעיל), יתמכו
מערכות הדואר בתקן המורחב (כלומר, יכללו כווניות משתמעת לפי Unicode 2.0).
יודגש, כי הדרישה לעיל נוגעת אך ורק לייצוג עברית חיצוני
למערכות; כלומר, למערכת המייצאת או מייבאת מידע, אם בתקשורת או בדרך אחרת. אין
הכוונה להטיל דרישות על ייצוג פנימי של עברית בתוך מערכות מחשוב.
התמיכה המלאה והנכונה בעברית ביישומי המחשב אינה
קלה, והמאמץ לפיתוחה גדול בהתייחס למוצר תוכנה בודד. רק החברות הגדולות ביותר
יכולות להשקיע בתמיכה במוצריהן, וגם זאת במשורה ובאיחור. מכיוון שתוכנה רבה מפותחת
על ידי חברות קטנות נמצא כי ברוב התוכנות התמיכה בעברית חלקית, לקויה ומאוחרת.
המצב דומה גם ביחס למפתחי תוכנה ישראליים.
כדי להקל על יישום העברית, על מנת שהצרכנים והמוסדות בישראל יוכלו
ליהנות מתוכנה עדכנית, חדשנית ומשוכללת ובעברית, מומלץ להעמיד לרשות מפתחי התוכנה
את מרכיבי התוכנה הנחוצים.
אנו ממליצים: לפתח מערכת שגרות פתוחה, בשפת מקור, אשר תכיל את
כל הדרוש לתמיכה בשפה העברית ותהיה ניתנת לשילוב במוצרי תוכנה שונים. יחד עם מערכת
השגרות יועמדו לרשות כל דורש נתוני בדיקה, שבעזרתם מפתח התוכנה יוכל לוודא כי הוא
יישם במוצריו את העברית כהלכה.
פיתוח זה כולל מספר שלבים:
הגדרת מערכת השגרות הדרושה.
הגדרת נתוני הניסוי הדרושים.
הגדרת שפת התכנות לפיתוח השגרות על
בסיס תקני יבילות (Portability) תוכנה מקובלים, כגון POSIX.
פיתוח השגרות ונתוני הניסוי.
תיעוד.
בדיקה על ידי חברות וגופים
מעונינים אחרים.
פרסום השגרות, נתוני הניסוי
והתיעוד באינטרנט.
מוצע לרכז את הפרוייקט במסגרת מכון התקנים, שם קיימת מסגרת
מתאימה לשיתוף פעולה בין החברות השונות העוסקות בנושא. מימון הפרוייקט יבוא
ממקורות ממשלתיים.
העלות המשוערת: 200,000 ש"ח.
יישומים רבים הקיימים כיום בשוק, בין אם הם
יישומים מסחריים ובין אם לאו, משתמשים בגופנים (Fonts) בשפה העברית על מנת להציג
טקסט עברי. ברבים מיישומים אלה (בעיקר אלה אשר אינם מסחריים) קיימת בעייה של הצגת
העברית - הגופן לא תמיד קריא ונעים לעין. גופן אשר קריאותו גבוהה יגביר את רצון
המשתמשים להשתמש בעברית ברשת ויקדם, באופן כללי, את השימוש בעברית ברשתות
המידע.
הועדה ממליצה: לקיים מכרז ולקבל הצעות שכוללות פיתוח גופן
עברי.
בגדלים 8, 10, 12, 14, 18, 24, 28,
48, 72 - כמינימום.
בארבעת הסוגים המקובלים: רגיל,
מודגש, נטוי, נטוי-מודגש.
עבור 3 סביבות עבודה: MS-Windows
(TrueType), Macintosh, Unix (X11).
מכיל את האותיות העבריות והאנגליות
(לפי ת"י 1311 / ISO-8859-8).
בעל קריאות גבוהה בעברית ובאנגלית,
על מסך ובהדפסה.
המכרז יכול להתפרסם מטעם משרד המדע, משרד התקשורת, או איל"א -
איגוד ישראלי לטכנולוגית המידע. ועדת המכרז תכלול טיפוגרף (מעצב גרפי לדפוס); אדם
המצוי בשימוש גופנים בטכנולוגית מחשב; ונציגי אקדמיה, תעשייה וממשלה.
הזוכה יעמיד את הגופן המפותח לרשות הציבור, גם אם ייעשה שימוש בגופן
ביישומים מסחריים.
הערכת עלות - כ-
200,000 ש"ח.
יישום התמיכה העברית במערכות רבות ניתן כיום ע"י
שימוש בתמיכה עברית מובנית לתוך גירסה מיוחדת של מערכת ההפעלה. גירסה זו, בדרך
כלל, קשה להשגה (אם בכלל) מחוץ למדינת ישראל. עובדה זו מביאה לכך שקשה לתושבי
מדינות אחרות לגשת למידע בעברית (או יידיש).
מעבר כלל-עולמי של מערכות המחשוב ל-Unicode יפתור, ככל הנראה, בעיה
זו. בינתיים, מומלץ: להעדיף, בהתקשרויות ממשלתיות ליישומים מבוססי
רשת, מערכות בהן התמיכה העברית אינה תלויה במערכת הפעלה מגירסה מקומית.
כמובן, שהעדפה כזו תופעל רק במקרה שבו מוצעות מערכות כאלה, ובתנאי
שיהיו מבוססות על תקן HTML בינלאומי (RFC2070) (ראה המלצה 5.1 לעיל). על מערכות
אלה להיות זמינות במידה סבירה בארצות חוץ.
יישום מוצלח של המלצה זו יביא לקשר טוב יותר, בעברית או יידיש, עם
העם בתפוצות ועם קוראי עברית בכלל.
פעילות התקינה בתחום מערכות המידע בכלל ובתחום
העברית בפרט סובלת מחוסר מקורות מימון. תקציב מכון התקנים אינו מיועד לנושאים אלה,
שאינם שייכים לתחומי הבטיחות, הגנת הצרכן ואיכות הסביבה. בייחוד בעייתית השתתפות
ישראל במאמצי התקינה הבינלאומיים, הכרוכים בנסיעות רבות לחו"ל. פעילות זו חשובה
שכן בעידן האינטרנט השימוש בשפות השונות נעשה בעיקר על פי תקנים בינלאומיים (ראה
לעיל). בעולם מתקיימת פעילות ערה בתחום זה, ומספר רב של תקנים נמצאים בהכנה.
במיוחד יש לציין את וועדות התקינה הבינלאומיות הבאות:
SC2 קידוד תווים- וועדה זו מכינה תקנים העוסקים בקידוד התווים
השונים, כולל עברית.
SC17 כרטיס חכם. וועדה זו קובעת את תקני הכרטיסים החכמים וקידוד
הנתונים הרשומים בהם.
SC18 עיבוד טקסט. וועדה זו אחראית לתקנים העוסקים בעיבודי טקסטים,
כולל SGML ו-HTML.
SC22 שפות תכנות ומערכות הפעלה. וועדה זו עוסקת בין היתר בבינאום
שפות תכנות ומערכות ההפעלה.
בנוסף, יש צורך לאמץ את התקנים הבינלאומיים הרלבנטיים כתקנים
ישראליים.
מתברר שהנושא אינו בתחום האחריות של אף משרד ממשלתי.
אנו ממליצים כי הממשלה תטיל את האחריות לנושא על משרד המדע,
ומשרד זה יכלול בתקציבו את המימון הדרוש. הערכת עלות: כ-
250,000 שקל (להכנת תקנים ישראליים ולהשתתפות בפעילות תקינה בחו"ל;
לא כולל את הפעילות שמכון התקנים מממן היום, כלומר כח אדם לריכוז הנושא).
בשוק האינטרנט בישראל פועלים כיום מספר לא מבוטל
של גופים מסחריים. למרות זאת, מספר היישומים התומכים בשפה העברית לשימוש ברשתות
תקשורת ומידע הוא קטן, מסיבות שכבר פורטו לעיל. בעולם הוכח כבר שיישומים המפותחים
על ידי משתמשים מתוחכמים ומופצים ברשת ללא תשלום, מקדמים את המודעות לשימוש ברשתות
המידע ויוצרים לרוב גם שוק, אליו נכנסות לאחר מכן חברות מסחריות. בארץ, "נדחף" עד
כה נושא העברית באינטרנט בצורה כזו.
אנו ממליצים ליזום הקמת פרוייקט ליצירת תוכנה עברית. ייזום
פרוייקט זה יהיה ע"י משרד המדע. הפרוייקט יתנהל תחת המוסדות האקדמיים (או מחב"א),
ויהיה פרוייקט מתמשך (ולא חד פעמי). התוכנה שתיווצר בפרוייקט זה תוצע לציבור באופן
חופשי, ללא תשלום, כולל קוד מקור.