עידן המגה פיקסל 4 – טכנולוגיות דחיסת וידאו

היסטוריה
כאשר תעשיית האבטחה החלה את המעבר משימוש בקלטות וידאו לדיסקים קשיחים עלתה השאלה כיצד יש לשמור את המידע המוקלט. כיום כאשר התעשייה עוברת משימוש במצלמות אנלוגיות למצלמות IP ומערכות הקלטה מבוססות רשת (NVR) עולה שוב שאלה זו.
כאשר מצלמות אנלוגיות מחוברות למערכת הקלטה הקידוד והדחיסה מתבצעים במקום מרכזי אחד והוא מערכת ההקלטה עצמה. כאשר נעשה שימוש במצלמות IP הדחיסה מתבצעת במצלמה עצמה ומשודרת מוכנה לאיחסון ישירות למערכת ההקלטה. שיטה זו מאפשרת לכל מצלמה לדחוס את המידע בצורה שונה ובפורמט שונה כאשר לכל אחד יתרונות וחסרונות משלו.
המשמעות היא שעל מתכנני המערכת להבין את היתרונות והחסרונות ולדעת לבחור בכל מצב באיזה שיטה להשתמש בכדי למקסם את השקעתם.

כיום ישנן בשוק מספר טכנולוגיות שונות מבלי שאף אחת מהווה סטנדרט אמיתי. יתרה מזאת מימוש הטכנולוגיות בפועל שונה מאוד מיצרן ליצרן ואינו מספק את אותה איכות נדרשת.
מתקיני המערכות חושבים על דחיסה במושגים של שטח איחסון ומספר ימי הקלטה בעוד ששיטת הדחיסה קובעת גם את החומרה שבה נשתמש, התשתית לה נזדקק ואת ביצועי המערכת בפועל.

ישנן שתי שיטות דחיסה בשימוש נרחב בשוק האבטחה. תמונה אחר תמונה ודחיסת תוך תמונה. שתי קבוצות אלו מייצגות שיטות שונות בעלות יתרונות וחסרונות. רק הבנה של שתי שיטות אלו יובילו לתכנון נכון של מערכת אבטחה.

תמונה אחר תמונה
בשיטה זו כל תמונה (פריים) המופקת ע"י מצלמה נדחסת ונשמרת בפני עצמה ללא תלות בתמונה הקודמת או השפעה על התמונה הבאה. לשיטה זו יתרון בשליחת המידע ע"י המצלמה מאחר ואין תלו

ת בין תמונה לתמונה אין צורך להמתין לשליחת המידע והוא נשלח כמעט מיידית עם הפקתו. כמו כן כאשר רוצים לגשת אל המידע הגישה מהירה

ביותר מאחר ואין צורך לאחזר את המידע ממספר פריימים אלא פשוט להתחיל "לנגן" מהתמונה הרצויה.

שתי השיטות המרכזיות בשימוש הן JPEG ו JPEG-2000.

JPEG
שיטת דחיסה זו משמשת בעיר לדחיסת תמונות סטליס במצלמות דיגיטליות ובאינטרנט. השיטה שפותחה בשנת 1992 מתבססת על כך שכל קבוצת פיקסלים בתמונה דומים אחד לשני ומכאן שניתן לצמצם אותם. שיטה זו יוצרת לפעמים מעיין קוביות על גבי התמונה הפוגעות באיכות התמונה הסופית.

JPEG-2000
שיטת דחיסה זו ששוחררה לעולם בשנת 2000 הופקה מלקחים שנלמדו משיטת הדחיסה JPEG. היא נועדה קודם כל לשמור על איכות התמונה הסופית ומכאן מהר מאוד מצאה את דרכה לשימושים של ערכת סרטי קולנוע מסחריים, צילומים רפואיים, איחסון מסמכים ושליחת ושידור של תצ"א ותמונות לווין.

התוצאה היא קובץ שבאופן ממוצע קטן ב 30% מ JPEG אך עולה באיכותו על איכות התמונה של JPEG.
היתרון הנוסף של JPEG-2000 היא היכולת לשמור על טווח צבעים גבוה בתמונה החשוב ביותר בשוק האבטחה. יכולת שמירה זו באה לידי ביטוי בביטים. כאשר רוב טכנולוגיות הדחיסה מבוססות 8BIT משמעות הדבר שהן יכולות לבטא רק 256 צבעים שונים בתמונה הדחוסה. המצלמות של היום יכולות להפיק מגוון צבעים רחב הרבה יותר ו JPEG-2000 תוכנן מלכתחילה לשמור את כל אפשרויות הצבע מבלי לאבד דבר מן המקור. היתרון השני הוא ש JPEG-2000 תוכנן לשמירה של תמונות ברזולוציות גבוהות במיוחד. ביטויו של יתרון זה בהזרמת המידע על גבי הרשת יוסבר מאוחר יותר.

תוך-תמונה
דחיסת תוך תמונה מסתמך על דחיסת תמונה יחידה ולאחר מכן השוואתה לתמונה או התמונות הבאות אחריה. התוצאה היא וידאו המורכב מדחיסה של מספר תמונות בסדרה כאשר יש חשיבות גבוהה לסדר ולקשר בין כל תמונה לקודמת ולזו הבאה אחריה.
בדרך כלל שיטת דחיסה זו תשמור רק את ההבדלים בין תמונה לתמונה כאשר תמונה מלאה תשמר רק מידי פעם.
בעוד ששיטה זו תוביל לחסכון ברוחב פס היא יכולה באותה המידה להוביל לאיבוד מידע רב בגלל איבוד של תמונה יחידה.

שתי שיטות הדחיסה הנפוצות היום בשוק הן MPEG-4 ו H.264.

MPEG-4
MPEG-4 נתפס כטכנולוגית דחיסה אחת אך באופן מעשי זה קיבוץ של מספר טכנולוגיות ושיטות דחיסה שהוגדר ע"י קבוצה מסחרית בשם MPEG (Moving Picture Experts Group). פורמט הדחיסה שנכנס לשימוש בשנת 1999 משתמש באותם עקרונות דחיסה של JPEG אך דוחס מספר תמונות יחד ולא תמונה יחידה בלבד. בדרך כלל וידאו המקודד ב MPEG-4 מוגבל לרזולוציית VGA (640X480) ואינה בשימוש ברזולוציות גבוהות מכך. כמו כן ברוב המקרים נעשה שימוש בטווח צבעים נמוך של 8 ביט הגורם לאיבוד מידע ולתמונה בעלת צבע דהוי ולא "אמיתי".

H.264
טכנולוגיה זו היא החדשה ביותר מבין החבורה. היא בעצם עיבוד מחדש של MPEG-4 המאפשר שימוש באלגוריתמים חדשים להקטנת נפח הוידאו הנשמר מקבוצה של תמונות. כמו כן ב H.264 פותחה טכניקה המשמשת למנוע את אותן קוביות הפוגעות באיכות התמונה ועדיין לשמור על נפח וידאו קטן.

רוחב פס, קצב תמונות, פעילות ותאורה
שיטת הדחיסה תוך-תמונה מסתמכת על שינויים שנעשים בין תמונה לתמונה. שינויים אלו גורמים להבדלים משמעותיים ברוחב הפס הנצרך ע"י הוידאו המופק. ככל שיש יותר תנועה כך יהיו יותר הבדלים בין תמונה לתמונה ויהיה יותר "קשה" לשמור רק את ההבדלים. התוצאה היא וידאו הצורך רוחב פס גבוה. לעומת זאת אם מייד לאחר מכן אין תנועה כלל, הדחיסה תהייה יותר "קלה" ורוחב הפס הסופי ירד מאוד. בצורה זו של עבודה קשה לתכנן נכון את השרתים והרשת שישרתו את הוידאו. יש תמיד צורך להתכונן לגרוע מכל  בו כל המצלמות ישדרו וידאו ברוחב פס מקסימלי באותו הזמן. לעומת זאת שימוש בטכנולוגיות דחיסה של תמונה אחר תמונה מספקת רוחב פס קבוע שאינו תלוי שינויים ומאפשר לתכנן היטב כבר מהתחלה את הציוד הנדרש ולדעת מה תהייה בדיוק התוצאה המתקבלת.

קצב התמונות הוא דבר חשוב גם כן. לדוגמא מצלמה המשדרת ב 25 תמונות לשניה ב H.264 תשתמש בתמונה אחת כל שתי שניות ואת שאר התמונות תשדר רק כשינויים מהתמונה הראשית. בשיטה זו נחסכו 48 תמונות בכל 2 שניות. בצורה זו כאשר ישנם שינויים מזעריים נחסך רוחב פס רב. לעומת זאת במידה וקצב התמונות יורד למשל ל 10 תמונות לשניה יתכן ויהיה כל כך הרבה הבדל בין תמונה לתמונה שיהיה יתרון קל או לא יתרון כלל על פני דחיסה של תמונה אחר תמונה.

לתאורה יש גם השפעה גדולה על רוחב הפס. בסצנות בעלות תאורה נמוכה יווצר פעמים רבות "רעש" שיתפרש כשינויים רבים מאוד בין תמונה לתמונה ויגרום לרוחב הפס שבשימוש לעלות. בכדי למנוע זאת משתמשים יצרני מצלמות בשיטות שונות שמורידות את רמת הרעש אך פוגעות באיכות התמונה הסופית.

הזרמה ברשת
כאשר יצרני מצלמות עולים ברמת הרזולוציה ל HD ומגה פיקסל הם נתקלים בסט חדש של בעיות איחסון הזרמה ויעילות. ניתן לטפל בבעיות אלו ע"י בחירה נכונה של שיטת דחיסה.
נשווה כעת בין 2 השיטות המובילות JPEG-2000 ו H.264.

JPEG-2000
כאשר משתמשים בפורמט דחיסה זה במצלמות מגה פיקסל ניתן לדחוס את הוידאו מחד ולאפר פונקציות ניהול ושידור מתקדמות מאידך. חברת Avigilon הקנדית פיתחה את ה HDSM (High Definition Stream management) בכדי לאפשר שימוש בתכנות אלו ממש.
פורמט הדחיסה מאפשר להפוך תמונה לקבוצות מידע נפרדות ומאפשר לשדר רק חלק קטן מהתמונה מבלי להזדקק ליתר התמונה.

פורמט הדחיסה מאפשר להפוך תמונה לקבוצות מידע נפרדות ומאפשר לשדר רק חלק קטן מהתמונה מבלי להזדקק ליתר התמונה.

תיאור סכמטי של פעולה זו נמצא בתמונה הבאה. מנוע ה HDSM משדר רק את מה שהצופה מעוניין לראות. בתמונה ישנה תנועה רבה ברחוב אך הצופה מעוניין רק במספר הרכב. לשם מה לשדר לצופה את כל התמונה של האנשים, הרחוב והרכבים האחרים כשכל מה שהוא מעוניין בו הוא רק חלק מזערי מן התמונה כולה. כמו כן כאשר מעוניינים בתמונה כולה אין צורך לשדר אותה באיכותה המלאה מאחר והמתבונן אינו יכול לראות את כל הפרטים באותו הזמן. במקרה זה תשודר התמונה באיכות מופחתת לשימור רוחב הפס. בגלל ש ה HDSM יכול לשנות את רזולוציית התמונה המשודרת הוא מתאים את עצמו לגודלו של המוניטור של הצופה.

לדוגמא 9 מצלמות של 5MP מוקלטות ע"י מערכת הקלטה ונצפות ע"י קליינט יחיד מרחוק. מערכת ההקלטה תקליט 9X5=45 מגה פיקסל. לעומת זאת מסך הצופה הוא FULL-HD כלומר יש בו 2 מליון פיקסלים בלבד או 2MP. בצורה זו ה HDSM מודד את גודלו של המסך ושולח 2MP מתוך ה 45MP בלבד. זה חיסכון עצום שמתאפשר רק בגלל שימוש בטכנולוגיית דחיסה נכונה.

H.264
וידאו שנדחס ב H.264 יכול אך ורק להיות משודר באותה הצורה בה הוא נשמר. כלומר באותה הרזולוציה ובאותו קצב תמונות. משמעות הדבר היא שברגע שרוחב הפס אינו מאפשר שידור מלא של הוידאו אנו נקבל פגיעה ממשית באיכות וחווית הצפייה של של הקליינט.
בכדי להתגבר על בעיה זו יצרו יצרני המצלמות שיטה הנקראת שידור כפול (MULTI STREAM). בשיטה זו משודר הוידאו פעמיים מהמצלמה. פעם אחת עבור מערכת ההקלטה בפורמט מלא ופעם בפורמט "מוחלש" בקצב תמונות וברזולציה נמוכה יותר עבור הקליינט. יש לזכור 2 דברים מהותיים כאשר משתמשים בשיטה זו. הדבר הראשון  הוא שהקליינט יקבל תמיד אך ורק תמונה כללית של מה שמצולם ולא יוכל לבצע זום דיגיטלי לתוך התמונה. הדבר השני הוא שהשידור ה"מוחלש" אינו מוקלט וכאשר הקליינט ירצה לשחזר מידע הוא שוב יתקל באותה הבעיה של שידור הוידאו ברזולציה גבוהה ללא יכולת לשחזר את האירועים כפי שהיה רוצה.

מנוע ה HDSM של AVIGILON מציע דרך ייחודית להתמודד עם בעיות אלו. כאשר פועלים מספר שידורי וידאו בו זמנית ממצלמה יחידה, מנוע ה HDSM ינהל את שתי ההזרמות האלו וידע לשלוח אותן לצופה בהתאם לגודל התמונה בה הוא צופה כרגע. כלומר במידה והצופה המרוחק מביט במצלמת H.264 אך הגודל הפיזי של התמונה קטן, ישלח המנוע לצופה את השידור בעל הרזולוציה הנמוכה. כאשר המשתמש בוחר להתמקד בשידור יחיד ומגדיל אותו משמעותית (מסך מלא לדוגמא), יחליף ה HDSM את ההזרמה מהמצלמה לזו באיכות הטובה יותר, באופן אוטומטי ומבלי שהמשתמש יהיה חייב לעשות דבר.
בדוגמא הבאה מקליטה מערכת ההקלטה 9 מצלמות של 2 מגה פיקסל. כלומר 18 מגה פיקסל סה"כ. כאשר הקליינט צופה בכל 9 המצלמות בו זמנית הוא צופה רק בקובייה קטנה ואין לו צורך בתמונה המלאה. ה HDSM ישלח את השידור המשני שהוא 9X0.3 מגה פיקסל או 2.7 מגה פיקסל סך הכל. שוב חיסכון עצום ברוחב פס.

מנוע ה HDSM אינו מסתפק בזה. הוא מסוגל להשתמש באצת חומרה לשם פענוח וקידוד של H.264 בכדי להקל על המעבד הראשי.
כאשר מותקן כרטיס גראפי של חברת NVIDIA התומך בטכנולוגיית PURE VIDEO מנוע ה HDSM מפענח שידורי H.264 על גבי כרטיס הגראפי ואינו מאמץ את מעבד המחשב כלל. צורת עבודה זו מאפשרת לספק איכות שידור גבוהה למספר קליינטים רב בו זמנית מבלי להתפשר על איכות או קצב הוידאו.

בחירה נכונה
בחירת המצלמה הנכונה בכל מצב היא קריטית כאשר מתכננים מערכת הקלטה. ההיבט הראשון שיש לבחון תמיד הוא הרזולוציה. כלים מתקדמים מאפשרים לבחור רזולוציה נכונה ולדעת כמה פיקסלים יתקבלו בכל מטר תמונה ניצפת. כך עוד בשלב התכנון ניתן לבחור מצלמה העונה בדיוק על דרישות הלקוח.
כפי שדובר מקודם שיטת הדחיסה, קצב התמונה, הפעילות והתאורה שתקלוט עדשת המצלמה משפיעים מאוד על התוצאה הסופית. אם הלקוח מעוניין להשתמש במצלמות מגה פיקסל מעל 2 מגה פיקסל סביר להניח שדחיסת JPEG-2000 היא האופציה הטובה והאפקטיבית ביותר. ככל שהרזולוציה עולה כך כך גם יתרונות ה JPEG-2000 עולים. כאשר נדרשות מצלמות באיכות נמוכה דווקא כאן עולה יתרונו של פורמט ה H.264 אשר יעזור לשמור על רוחב פס נמוך. בחירת מצלמה מתאימה היא חשובה ביותר יחד עם זאת חובה לבחור במערכת הקלטה שמאפשרת גמישות ותמיכה באפשרויות דחיסה JPEG-2000 ו H.264 כדי לאפשר ללקוח להנות מכל העלומות בו זמנית.

לדוגמא טבלה המציגה איזורי כיסוי והמצלמה וקצב התמונות המתאימים להם בדרך כלל:

סצנה

רזולוציה

קצב תמונות

שיטת דחיסה

מגרש חניה

16 מגהפיקסל

3

JPEG-2000

קפטריה

5 מגהפיקסל

12

JPEG-2000

לובי

3 מגהפיקסל

15

JPEG-2000

כניסה או דלת

2 מגהפיקסל

15

H.264

מסדרון

1 מגהפיקסל

15

H.264

קזינו

1 מגהפיקסל

30

H.264