x
فن آوری فشرده سازی +Smart H265

سه‌شنبه 30 آذر 1395
بازدید: 4211 بار

فن آوری فشرده سازی +H265 در واقع همان فن آوری H265 است که در عملکردش تغییراتی جزیی وجود دارد. فن آوری Smart +H265 مجموعه ای است از الگوریتم های پیشرفته کدگذاری هوشمند که توسط داهوا و با توجه به فرمت H265 ارائه شده است. برای داشتن مشخصات تصویر +Smart H265 بعضی از تکنیک های کدگذاری تصویر را ایجاد می کند و این تکنیک ها می توانند بر اساس عملکرد و محصول اضافه، حذف و یا ترکیب شوند...

فرمت  Smart H265+ می‌تواند بازده کدگذاری تصویر را بر اساس مشخصات محیط بالا ببرد، علاوه بر این بیت ریت و حجم ذخیره سازی را کاهش داده و در نتیجه باعث بهبود عملکرد کل سامانه می‏شود.

شرایط

در نظارت تصویری باید در طول شبانه روز عمل ضبط انجام شود، بنابراین نیاز است حجم ذخیره سازی افزایش یابد. اگر عوامل نظارت به سمت اچ دی گرایش پیدا کنند، تصویر با کیفیت و سرعت پردازش اطلاعات دچار چالش بزرگی می شوند. در صورتیکه ذخیره سازی نیز به این مجموعه اضافه گردد در نتیجه هزینه کل سامانه افزایش می یابد. فرمت Smart H265+ این موضوع را بصورت هوشمندانه تشخیص می‏دهد.

برای حل این مسأله تولید کنندگان صنایع، فن آوری و نوآوری را ارائه می دهند تا هزینه سامانه کاهش یابد. به عبارت دیگر تولیدکنندگان محصولات خود را بر اساس آخرین استانداردِ کدگذاری (شامل MGPEG و H264 و H265 و غیره)، به روز رسانی و بهینه می کنند در این صورت محصولات آنها آخرین فن آوری‏ها را پشتیبانی کرده و اثر مطلوبی در کدگذاری استاندارد ایجاد می‏شود.

به روز رسانی و بهینه سازی را می توان در توسعه سخت افزار ملاحظه کرد. از آنجایی که H265  به صورت گسترده در محصولات حفاظتی مورد استفاده قرار گرفت، چگونگی بهبود محدوده فشرده سازی با نرم افزار به روز رسانی شده بر اساس استاندارد H265 یک پیشرفت جدید در صنعت شده است.

در مقایسه با سایر تصاویر، تصاویر حفاظتی دارای مشخصات زیر می باشد:

  • در یک بازه زمانی مشخص، زمینۀ تصویر ثابت است یا دارای حرکت کمی است.
  • در تصاویر حفاظتی، اکثر اوقات تصویر ثابت است و حرکت شیء در یک بازه زمانی واقعی ایجاد می‏شود.
  • محیط ‏‏های حفاظتی معمولاً نیاز به ضبط تصویر به صورت شبانه روزی دارند، در این صورت مقدار نویز بالا است، بویژه این نویز در شب مقدارش بسیار زیادتر است.
  • کاربران معمولاً به شیء متحرک در تصویر توجه بیشتری دارند.

فن آوری ‏‏های اصلی

همانطور که گفتیم فن آوری H265+ مجموعه ای از الگوریتم ‏‏های هوشمند است و شامل تکنیک ‏‏های زیادی در فن آوری کدگذاری است. فن آوری توسعه یافته داهوا شامل موارد مهم زیر می‏شود:

  • الگوریتم پیشرفتۀ کنترل سرعت پردازش
  • کد گذاری تصویر بر اساس تجزیه و تحلیل جزئیات تصویر ( ROI، GOP، ساختار فریم مرجع )
  • فن آوری حذف نویز

سیاست کد گذاری تطبیق صحنه

صحنه ‏‏های حفاظتی ثابت نیستند، طبق مدل GND (فقط تفاوت ‏‏های قابل ملاحظه)، دیدگاه افراد در مورد یک شیء متفاوت است برای مثال از دیدگاه فرد بررسی شیءای در داخل ساختمان مهم تر از بررسی آن در خارج از ساختمان است. برای تطبیق سیاست متفاوت کدگذاری بر اساس صحنه ‏‏های متفاوت می توان این دیدگاه را تغییر داد. بنابراین اثر کدگذاری بهبود می یابد.

برای مثال بیت ریت 4M برای شیء داخل ساختمان و بیت ریت برابر با 1-2M برای شیءای در خارج از ساختمان و فضای باز دیدگاه مشابهی را برای افراد بوجود می آورد. تطبیق سیاست کدگذاری در صحنه برای تجزیه و تحلیل صحنه ‏‏های هوشمند ایجاد شده است که این تحلیل شامل نور، صدا و حرکت است، بنابراین این سیاست نه تنها دیدگاه فرد را بهبود می بخشد بلکه تأثیر کدگذاری را آشکار می سازد.

کدگذاری تصویر بر اساس تجزیه و تحلیل تصویر

منطقه مورد نظر ( ROI )

به طور کلی عوامل سامانه ‏‏های حفاظتی بیشتر به حرکت اجسام در تصویر حفاظتی توجه می کنند و تمایل کمتری به جزئیات پس زمینه در تصویر دارند، بنابراین فرمت Smart H265+، بصورت اتوماتیکی و بر اساس حرکت تصویر در صحنه و از طریق فن آوری تجزیه و تحلیل تصویر، اجسام متحرک را از پس زمینه جدا می سازد.

بعد از جدا سازی، فرمت Smart H265+ سطح فشرده سازی برای پس زمینه را بالا می برد و برای تصویر متحرک کم می کند. در تصویر حفاظتی، به دلیل اینکه جسم متحرک در زمان مشخص و کوتاهی دیده می‏شود، فرمت Smart H265+، می‏تواند سطح فشرده سازی را به شکل مؤثری بالا ببرد.

همانطور که در شکل بالا ملاحظه می‏شود، خط قرمز جسم متحرک را نشان می‏دهد ( F) و سایر نقاط به عنوان پس زمینه مشخص شده اند ( B) فقط جسم متحرک ( F) منطقه قابل توجه از نظر کاربر است و بنابراین کیفیت تصویرِ جسم متحرک باید تضمین شود.

سیاست ‏‏های کدگذاری مختلف در شکل 2 توضیح داده شده که مجموعه عملکردها را می‏تواند پوشش دهد:

مجموعه عملکردها شامل کیفیت تصویر متحرک است که باید تضمین شود در این صورت کیفیت منطقه پس زمینه می‏تواند کاهش یابد، بنابراین کاهش بیت ریت در منطقه پس زمینه باعث کاهش انتقال بیت ریت کل سامانه می‏شود.

گروه تصاویر ( GOP )

در پردازش تصویر، اندازه فریم I معمولاً از اندازه فریم P به جهت تضمین کیفیت بالاتر تصویر است. فریم I ذخیره سازی بیشتری را در مقایسه با فریم P انجام می‏دهد. ار آنجائیکه تصویر حفاظتی ثابت است و یا تغییرات بســـیار کمی را در مدت زمان طولانی دارد، فرمت H265+ Smart، گروه تصاویر ( GOP) را ایجاد می کند و فقط وقتی که به فریم I نیاز است و تغییرات بزرگی وجود دارد فریم I را وارد می کند.

طول GOP (گروه تصاویر) می‏تواند به صورت پویا بر اساس یک برنامه واقعی در تصویر ایجاد شود.

با وجود ساختار GOP که باعث کاهش مقدار فریم I در پردازش تصویر می‏شود، اثر فشرده سازی بهبود می یابد.

در شکل 3 نمونه ای از سامانه حفاظتی با پیاده سازی GOP ثابت ملاحظه می‏شود که فاصله دو فریم I ثابت است.

به خاطر داشته باشید تصویر در یک زمان طولانی ثابت است و حرکت شیء در یک زمان خاص مشاهده می‏شود. برای توسعه GOP مقدار فریم I  در یک بازه زمانی کاهش می یابد.

فقط زمانیکه شیء متحرک دید می‏شود، فریم I برای اطمینان از کیفیت تصویر در صحنه وارد خواهد شد که در این صورت  GOP دینامیک نامیده می‏شود.

در شکل 4، مقدار فریم I کاهش می یابد که باعث می‏شود انتقال بیت ریت در کل سامانه کاهش یابد.

فقط زمانیکه شیء متحرک دید می‏شود، فریم I برای اطمینان از کیفیت تصویر در صحنه وارد خواهد شد که در این صورت  GOP دینامیک نامیده می‏شود.

در شکل 4، مقدار فریم I کاهش می یابد که باعث می‏شود انتقال بیت ریت در کل سامانه کاهش یابد.

ساختار فریم مرجع

برای کاهش بیت ریت و اطمینان از کیفیت تصویر، در مقایسه استاندارد H265 ، فرمت Smart H265+، فریم مرجع را افزایش می‏دهد و همچنین این فرمت دو فریم مرجع (دوآل فریم) و تکنیک I فریم واقعی را با یکدیگر همسو می کند.

تکنیک دوآل فریم مرجع

تصویر حفاظتی فقط یک فریم را به عنوان فریم مرجع به کار می گیرد (فریم I و یا فریم قبل) در تکنیک دوآل فریم مرجع، 2 فریم I به عنوان مرجع بکار گرفته می‏شود. در کنار فریم قبلی، فریم IDR (فریم صفر) نیز به عنوان مرجع گرفته می‏شود.

در شکل بالا دومین فریم P ، مرجع فریم IDR (فریم صفر) و اولین فریم P است.

در صحنه متحرک، یک فریم مرجع در مقایسه با ساختار دوال فریم می‏تواند مرجع بهتری برای حفاظت ناحیه پس زمینه باشد و در این صورت باعث می‏شود دقت بالا رود و سطح فشرده سازی افزایش یابد.

تکنیک فریم I مجازی

فقط فریم I می‏تواند عملکرد وارد کردن و یا اضافه کردن فریم را به صورت تصادفی انجام دهد. پیاده سازی فریم I مجازی این اطمینان را برای فریم P بوجود می آورد که بتواند مرجع فریم IDR قبلی باشد. در شکل بالا، پنجمین فریم P مرجع فریم صفر IDR است بنابراین می‏تواند در صورت لزوم به جای فریم P قبلی برای رمز گشایی وارد و یا اضافه شود.

حذف نویز

مقدار نویز در مبحث تصاویر حفاظتی در فضا‏‏های نامطمئن و جایی که نور کم باشد بالاست. نویز فقط بر روی کیفیت تصویر تأثیر نمی گذارد بلکه بیت ریت بیشتری نیز مصرف می کند بنابراین برای کنترل نویز لازم است راهکار بهتری برای کنترل کدگذاری تصویر ایجاد شود. روش ‏‏های قدیمی کاهش نویز، از صحنه، تصویر کلی می گیرند اما جزئیات را در طول پدید آمدن نویز حذف  می کنند، بنابراین ایجاد تعادل بین این دو مقوله کاری دشوار است. بر اساس فن آوری تجزیه و تحلیل تصویر، فن آوری Smart H265+ ناحیه متحرک را از پس زمینه جدا می کند و کاهش نویز را در سطوح متفاوت در قسمت متحرک و پس زمینۀ تصویر ایجاد می کند. در این روش علاوه بر کاهش نویز کیفیت تصویر در منطقه مورد نظر تضمین می‏شود. مخصوصاً در جایی که نویز بسیار زیاد است مانند گرفتن تصویر در شب، این روش می‏تواند بیت ریت را بهبود بخشد.

آزمایش اثر رمز گذاری

جدول زیر نتیجه این آزمایش را در حالت فعال بودن فرمت H265+ Smartو غیر فعال بودنش نشان می‏دهد:

کاهش میزان بیت ریت

میانگین بیت ریت در H265+

میانگین بیت ریت در H265

میانگین بیت ریت در H264

صحنه

%89 در H264

%78 در H265

469 کیلو بایت بر ثانیه

2092 کیلو بایت بر ثانیه

4135 کیلو بایت بر ثانیه

محیط بیرون ساختمان در طول روز

%90 در H264

%80 در H265

426  کیلو بایت بر ثانیه

2130  کیلو بایت بر ثانیه

4218  کیلو بایت بر ثانیه

محیط داخل ساختمان در طول روز

%95 در H265

%97 در H264

94  کیلو بایت بر ثانیه

2012  کیلو بایت بر ثانیه

3576  کیلو بایت بر ثانیه

رنگ در اتاق تاریک

%98 در H264

%97 در H265

68  کیلو بایت بر ثانیه

2012  کیلو بایت بر ثانیه

3342  کیلو بایت بر ثانیه

رنگ مشکی در اتاق تاریک

مناطق کاربردی

فرمت H265+ مجموعه ای از الگوریتم ‏‏های کدگذاری شدۀ هوشمند است و شامل بسیاری از روش ‏‏های کدگذاری است. برای اطمینان از اینکه فرمت Smart H265+ می‏تواند در محصولات مختلف با برنامه ‏‏های مختلف استفاده گردد، کافی است بدانیم تکنیک ‏‏های اصلی می‏توانند طبق دستور العمل واقعی به محصولات و یا برنامه ‏‏های گوناگون اضافه، حذف و یا با آنها ترکیب شوند. در تصاویر مختلفِ متحرک Smart H265+ می‏تواند سطح فشرده سازی را افزایش دهد. به طور کلی زمانی سطح فشرده سازی بهبود یافته و افزایش می یابد که صحنه‏ها ساده باشند و تحرک شیء زیاد نباشد.

فرمت H265+ در واقع همان فرمت H265 استاندارد است که بهبود یافته و محدودۀ فشرده سازی آن به خوبی H265 حتی در شرایط محیطی نا مساعد می باشد.

بسیاری از نرم افزارها و سخت افزار‏‏های موجود، پردازش پخش تصویر با فرمت H265+ را نمایش می دهند. برای درک بهتر این موضوع، باید بدانیم دیکدر، پردازش تصویر Smart H265+ را با تغییرات بسیار جزئی پشتیبانی می کند.

همانطور که ذکر شد فرمت H265+ مجموعه ای از الگوریتم ‏‏های هوشمند است.

این فرمت در هیچ یک از استاندارد‏‏های جدید کدگذاری تصاویر وجود ندارد اما یک فرمت توسعه یافته از H265 است. بسیاری از تکنیک ‏‏های Smart H265+ فراتر از استاندارد‏‏های کدگذاری تصویرند و این اطمینان را بوجود می آورند که H265+ و H265 هیچگونه تناقضی با یکدیگر ندارند. به عبارت دیگر، تکنیک ‏‏های H265+ برای H265 نیز کاربردی است.

نتیجه

طبق استاندارد H265 ، فرمت H265+ تکنیک ‏‏هایی را برای کد گذاری تصویر ایجاد کرده است که با فن آوری پیشرفته تحلیل تصویر داهوا یکپارچه هستند، در این صورت تصویر بهبود یافته و کیفیت آن نیز تضمین می‏شود. فن آوری H265+  نیاز به بروز رسانی و یا راه اندازی سخت افزار ندارد اما نیاز است یک سخت افزار بروزرسانی شده که باعث افزایش ویژگی ‏‏های محصول می‏شود بدون صرف هزینه وجود داشته باشد.