دوشنبه 07 خرداد 1397
بازدید: 2705 بار
باز هم افتخاری دیگر برای خانواده داهوا، کسب مقام اول در ICDAR 2017 فن آوری تشخیص متن هوشمند داهوا، توانست در ۲ چالش از سری رقابت های ICDAR، مقام اول را کسب کند...
داهوا در ۲ چالش از سری رقابت های ICDAR (کنفرانس بین المللی تشخیص و تجزیه تحلیل اسناد) مقام اول را کسب کرد.
همانطور که در متن سایت رسمی ICDAR مشاهده می کنید، در ۱۷ اکتبر سال ۲۰۱۷، شرکت فن آوری های داهوا، در موضوع تشخیص حروف در چالش تصاویر متنی تصادفی (Incidental Scene Text Challenge) و در چالش تصویر Born-Digital، با دقت ۸۲٫۷۶% و ۹۷٫۴۳%، مقام اول را کسب کرد.
کنفرانس بین المللی تشخیص و تجزیه تحلیل اسناد (ICDAR)، یک کنفرانس بین المللی آکادمیک می باشد که هر دو سال یک بار و هر بار در یک شهر متفاوت برگذار می شود. رقابتهای ICDAR، تا به حال ۵ بار و در سال های ۲۰۰۳، ۲۰۰۵، ۲۰۱۱ و ۲۰۱۵ برگذار شده است. این رقابت ها در راستای بررسی توان خواندن، در کاربردهای خاصی برگذار می شود.
صحنه های تصادفی دارای متن، یک چالش جدید در ویرایش ۲۰۱۵ این رقابت ها و سخت ترین چالش می باشد. این چالش به متونی اشاره دارد که به طور تصادفی در تصویر نمایش داده شده و کاربر هیچ دخالتی در نمایش، بهبود و یا تغییر موقعیت یا کیفیت آن نداشته است. صحنه های تصادفی، در زمینه های زیادی همچون دوربین های مخصوص اتصال به لباس یا تصویر برداری های عظیم شهری که کنترل ضبط در این شرایط بسیار سخت می باشد، کاربرد دارد.
تصاویر Born-Digital، یکی از ۲ چالشی است که از سال ۲۰۱۱ در سری رقابت های ICDAR وجود داشته است. این چالش، مربوط به تصاویری است که توسط دستگاه های دیجیتالی در اینترنت یا ایمیل ذخیره شده اند. استخراج خودکار متن از تصاویر دیجیتالی، به نظر بسیار جالب می آید، چرا که با استفاده از این فن آوری می توان عملکرد فن آوری های دیگر را بهبود بخشید، فن آوری هایی همچون فهرست بندی و بازیابی محتویات وب، بهبود دسترسی به محتویات، فیلتر کردن محتویات (تبلیغات یا ایمیل های ناخواسته) و غیره.
Robust Reading و ICDAR 2015
“Robust Reading” به پژوهشی اشاره دارد که به تفسیر ارتباطات نوشتاری، با تنظیمات بدون محدودیت می پردازد. این پژوهش در برخی سامانه های نظارت تصویری، بسیار حائز اهمیت می باشد، این سامانه ها عبارت اند از سامانه های تشخیص پلاک خودرو (LPR)، تشخیص شماره سریال کانتینر، تشخیص متن برچسب های حمل و نقل و تشخیص متون داخل فیلم های ضبط شده توسط سامانه های نظارت معمولی و دیگر سامانه هایی که در زمینه تشخیص متن کاربرد دارند.
تشخیص متن داهوا (OCR)
گروه هوش مصنوعی تشخیص متن داهوا (AI OCR Team) از موسسه پژوهش های پیشرفته داهوا، در رقابت های ICDAR Robust Reading شرکت کرد. گروه داهوا، بر مبنای فن آوری فرا گیری عمیق و مزایای ساختار شبکه های SENet و ResNet، یک استراتژی منحصر به فرد در یک پارچه سازی چند-خاصیتی و چند-کانالی توسعه داده است. این استراتژی به همراه فن آوری چند-مدلی توسعه داده شد و به طور شگفت انگیزی دقت را در نتایج به دست آمده بهبود بخشید.
فن آوری هایی که در این رقابت به کار گرفته شده اند، به طور گسترده ای در راه کار های حمل و نقل هوشمند داهوا استفاده می شوند. دقت تشخیص این فن آوری، در شرایط خواندن پلاک خودرو، ۹۹٫۹۹% می باشد
در سال های اخیر، فن آوری فراگیری عمیق، دستاوردهای عظیمی در زمینه فن آوری های تجزیه تحلیل تصویری بجای گذاشته است. دقت تشخیص این فن آوری در بسیاری از شرایط، بهتر از تشخیص انسان می باشد. اکنون این امکان وجود دارد که با هزینه ای کمتر، بسیاری از کارها به صورت خودکار (Automatic) انجام شود. از هوش مصنوعی به طور گسترده در زمینه های امنیت عمومی، حمل و نقل و بانک داری، برای محافظت از مردم و اموال آنها استفاده می شود. داهوا با ماوریت “جامعه ایمن تر و زندگی هوشمند تر ” بر روی ” نوآوری ، کیفیت ، خدمات ” تمرکز داشته و به تمام مشتریان و همکاران خود در سرتاسر جهان خدمت رسانی خواهد کرد.