Find us on Google+ سییتم های تعاملی - رسانه های تعاملی - پیور دیتا

۷ آذر ۱۳۹۱


تئوری تصاویر :

چشم انسان :
چشم ما رنگ با طول موج نوری که محرک روی شبکیه چشم  ایجاد میکند،را از رنگ قرمز (بالاترین طول موج)  تا نارنجی، زرد، سبز، آبی، بنفش میتواند ببیند.
طیف مرئی  از ۳۸۰  تا ۷۸۰  نانومتر می باشد.
چشم ما دارای ۱۲۰ میلیون یاخته استوانه ای حساس به نور میباشد.و همچنین دارای حدود ۸ میلیون یاخته‌های مخروطی حساس به طول موج های مختلف میباشد.

**یاخته‌های استوانه‌ای نوعی از یاخته‌های گیرندهٔ نور هستند که در انتهای چشم و در شبکیه قرار دارند. این یاخته‌ها همراه با یاخته‌های مخروطی جریانالکترومغناطیسی نور خورشید را به پیام عصبی تبدیل کرده و از طریق عصب بینایی به لوب پس‌سری مغز منتقل می‌کنند.
یاخته‌های استوانه‌ای بیشتر در نور ضعیف تحریک می‌شوند و به مغز توانایی دیدن در تاریکی را می‌دهند و آسیب به آن موجب بیماری شب کوری می شود.این یاخته‌ها به رنگ‌ها حساسیت نشان نمی‌دهند؛ به همین دلیل بینایی در تاریکی به رنگ سیاه، سفید و طیفی از خاکستری است. یاخته‌های استوانه‌ای همچنین در تشخیص حرکات توسط مغز نقش دارند.
بیشترین تمرکز یاخته‌های استوانه‌ای در بخش‌های پیرامونی شبکیه، و کمترین تمرکز آن‌ها در لکهٔ زرد است.**

دید انسان
دید انسان 
درک رنگ از طریق ترکیب ۳ رنگ اصلی امکان پذیر میباشد.روی شبکیه چشم سیگنال های رنگی به ۳ فیلتر ابی،قرمز،سبز تبدیل میشوند.

تعیین کمیت رنگ :
چشم ما برخلاف گوش،قابلیت تجزیه و تحلیل کردن طیفی ندارد،اما از طریق ترکیب طول موج های مریی درک رنگ را برای
ما امکان پذیر میکند.
ما میتوانیم ۳ نوع رنگ تعریف کنیم :
  رنگ های طیفی : تولید شده توسط تابش حاوی یک باند باریک طول موج.
  رنگ ارغوانی(magenta) : تابشی حاوی ترکیبی بی نهایتی از طیف رنگی با طول موج مریی یعنی ابی،بنفش،قرمز-زرد.
  رنگ  سفید : تابش در طیف مداوم.

بر طبق نظریه  توماس یانگ، فیزیکدان انگلیسی، که در سال 1802 ارائه شد، با استفاده از سه رنگ قرمز، سبز و آبی می‌توان تمام رنگ‌های طیف رنگی را تولید کرد.
اولین شواهد تجربی  به دست آمده از آزمایش بر روی چشم در سال  ۱۹۶۴  رخ داده است.

بازتولید رنگ :
یک رنگ را میتوان با ۳ روش اساسی باز تولید کرد:
  -additive synthesis : سنتز افزودنی، مخلوطی از چراغ های مختلف کروماتیکی (فام‌داری*)
additive synthesis
additive synthesis
*در دانش رنگ‌شناسی، به کیفیت یک رنگ که نه بر اساس روشنای بل‌که بر پایهٔ فام (پرده یِ رنگ) و اشباع تعریف شود، فام‌داری گفته می‌شود.*

   -subtractive synthesis : سنتز کاهشی،انطباق یا همپوشانی بخشی که طیفهای مختلف را جذب میکند.

subtractive synthesis
subtractive synthesi
یکپارچه سازی فضایی :
نقاط رنگی مختلف و نزدیک بهم به چشم انسان به صورت نقاط رنگی همپوشان به نظر میرسد و  تولید یک نتیجه مشابه به سنتزافزودنی میکند. 


Integrazione spaziale
Integrazione spaziale
additive synthesis (سنتز افزودنی) :
 سنتز افزودنی رنگ همان روشی است که چشم انسان و بسیاری از وسایلی که از چشم انسان تقلید میکنند (مثل دوربین های دیجیتال،دوربین های فیلمبرداری،مانیتورها) که باترکیب نقاط رنگی کنار هم تصویر را تشکیل میدهند،استفاده میکنند. 


additive synthesis
additive synthesis

در عمل یک عکس به تعداد بسیار زیادی از نقاط (پیکسل) قرمز،سبزو ابی تجزیه میشود.




به لحاظ تاریخی اولین دستگاه سنتز افزودنی همان دیسک نیوتون بود که روی ان بخش های دایره ای زیادی از رنگ های مختلف طراحی شده بود.با چرخاندن سریع این دیسک رنگ ها ترکیب میشدند و یک رنگ واحد بنظر میامد و اگر رنگ ها به صورت به اندازه مناسب دوز بندی میشدند،ان رنگ سفید به نظر میامد.  
۳ رنگ اصلی سنتز افزودنی که چشم انسان به ان حساس است قرمز،سبز و ابی است (در انگلیسی به ان RGB می گویند.)

subtractive synthesis (سنتز کاهشی) :
۳ رنگ اصلی سنتز کاهشی(در انگلیسی به ان YMC می گویند.)،درواقع مکمل ۳ رنگ اصلی سنتز افزایشی اند :
   
  - زرد مکمل ابی
  - سرخابی مکمل سبز
  - ابی فیروزه ای مکمل قرمز 

ساده ترین مثال از سنتز کاهشی قراردادن فیلترهای رنگی روی هم است.هر فیلتر مانع عبور یک نور میشود ودر نهایت بخش کمی از نور میتواند از فیلترها عبور کند به همین دلیل به این روش سنتز کاهشی گفته میشود. 


subtractive synthesis
subtractive synthesis 
طراحان و نقاشان هم با ترکیب کردن لایه هایی از رنگ های مختلف روی کاغذ یا روی بوم نقاشی یک سری فیلتررنگی ایجاد میکنند .مثال دیگر از سنفز کاهشی لنز دوربین های رنگی عکاسی و سینمایی است. 

مانیتور CRT :
سیستم طراحی شده روی صفحه تلویزیون بر اساس اشعه کاتدی (CRT) است،که با ترکیب  رنگ  از طریق یکپارچه سازی فضایی نقاط رنگی RGB تصویر را روی صفحه تلویزیون نمایش میدهد.
بنابراین فضای رنگی که استفاده میکنیم بر اساس نورهای کروماتیکی ساطع شده از چراغ هایی با سه نوع رنگ فوسفری  ساخته شده اند .
دریک فضای رنگی RGB مکعب شکل که دران فقط نور محسور درمکعب قابل دیدن باشد رئوس مکعب نشان دهندمختصات رنگ های کورماتیکی است.  


MONITOR CRT
MONITOR CRT

در تصویر بالا تقاطع این فضا با صفحه R+G+B=1 مثلثی را ایجاد میکند که قابل نمایش در فضای CIEXYZ میباشد و gamut monitor نامیده میشود.   


تصحیح گاما (gamma Correction) :
تصحیح گاما،برای جبران غیر خطی بودن اشعه های کاتدی (CRT) در تبدیل یک سیگنال ویدیویی به نور به دلیل خطی نبودن رابطه الکترون جاری با شتاب،طراحی شده است. 
تصحیح گاما در نظر گرفته شده برای انحراف های این چنینی که اشعه های کاتدی(CRT) ایجاد میکنند وباعث ایجاد بیشترین نور 
یکنواخت از نقطه نظر ادراکی میشود.





فرق بین یک مقیاس با یک ورودی خطی (به عنوان مثال مقیاس ارزش درخشندگی با کد گذاری خطی) و یک مقیاس با یک  خروجی خطی (یک شدت خطی افزایشی) :

تصحیح گاما
تصحیح گاما
یک مقیاس کد گذاری شده خطی که یک شدت غیر خطی دارد فاراینده نور را منظم تر نشان میدهد.



پرتو ساطع شده از مانیتور CRT  بامقدار سیگنال  پرتو الکترونی یک رابطه خطی ندارد بلکه رابطه تشریحی دارد :

از آنجایی که مدار لازم برای ایجاد رابطه خطی بسیار گران بود سیگنال قبل از منتقل شدن،از طریق همان به اصطلاح gamma correction تصحیح میشد.
بر اساس استاندارد NTSC مقدار  γ = 2.2  انتخاب شد. 
مقادیر واقع بینانه برای گاما بین ۲.۳۵ تا ۲.۵۵ است اما در استاندارد های تلویزیونی برای شرایطی که صفحه نمایش تلویزیون در نور کم دیده میشود،یک مارجین برای افزایش کنتراست تصویر در نظر گرفته شده است.



فضاهای رنگی RGB در دستگاه های محاسباتی :
نمایش رنگ در دستگاه های الکترونیکی به طور معمول متناسب با عملکرد کارتهای گرافیکی مانیتورهای CRT در نظر گرفته شده است. 
برای هر۳ سیگنالی که به مانیتور فرستاده میشود،۳ مقدار ۸ بیتی برای هر پیکسل تعریف میشود.

RGB

کارت گرافیکی هم درنمایش تصاویرنقش به سزایی دارد .
عکس و فیلم دیجیتال :

عکسدیجیتال درواقع یک تابع ۲ بعدی است که به وسیله سنسور های بصری روی یک صفحه خارجی قابل مشاهده است.عکس های دیجیتال یک ماتریکس محدود بین مقادیر (N,M) میباشد،که پیکسل(عناصر تشکیل دهنده عکس) نامیده میشوند. 



ویدئو دیجیتال در واقع از یکسری عکس (فریم) که به صورت متوالی و پشت سر هم قرار میگیرند وهر عکس تا عکس بعدی  فاصله ∆ t را طی میکند ،تشکیل میشود.
مقیاس اندازه گیری : FPS (فریم در ثانیه)

دقت (Resolution) :
-وضوح فضایی *(N,M),به تعداد پیکسل در صفحه نمایش عکس و کارت گرافیکی سیستم بستگی دارد.برای مثال به پارامتر های زیر دقت کنید :


Resolution
Resolution
(سطر،ستون)= (N,M)*
-وضوح زمانی در ویدیو به تناوب زمانی مناسب تصاویر دارد که همان (frame rate) نامیده میشود.
-وضوح سطوح خاکستری،یعنی قدرت تشخیص سطوح خاکستری : .k  n
   برای مثال : به عنوان مثال 256 با K = 8
وضوح فضایی بیشتر با جزییات خیلی کوچک تصویر در ارتباط است.(dpi) و درواقع به پارامتر های زیر بستگی دارد :
   - دوربین 
  - دوری و نزدیکی سوژه 
  - صفحه نمایش 


عکس هایی با اندازه های یکسان اما تعداد پیکسل متفاوت
عکس هایی با اندازه های یکسان اما تعداد پیکسل متفاوت
عکس هایی با تعداد پیکسل یکسان اما اندازه های متفاوت
عکس هایی با تعداد پیکسل یکسان اما اندازه های متفاوت
عکس ها :
تصاویر عمدتا 
     رنگی (24bit*pixel /  3channel / 8 bit *channel: RGB)
     در مقیاس خاکستری (1channel / 8 bit*channel)
     باینری (1bit*channel, whiate& black)

**توجه داشته باشد یک عکس 24bit*pixel  میتواند عکس های سیاه و سفید و خاکستری را هم نمایش دهد،فقط کافی است که مقادیر RGB را یکسان قرار دهیم تا بتواند تمام لایه های خاکستری را نمایش دهد.یک پیکسل خاکستری دارای مقادیر (RGB  = (128, 128, 128 میباشد.**  

عکس در bit :
یک عکس تشکیل شده از :
● تعدادی کانال : 
یک تصویر به سیاه و سفید دارای یک کانال (کانالروشنایی) /یک تصویر RGB دارای سه کانال (قرمز، سبز و آبی)

● تعدادی کانال در هر بیت :
bpc یعنی چند بیت اطلاعات مربوط به یک کانال را نمایش میدهد.(۱،۸،۱۶،۳۲) 
● تعداد بیت در کل پیکسل ها که برابر است با تعداد بیت در کانال ضربدر تعداد کانال :
bpp = bpc * nc

-بنابراین یک تصویرسیاه و سفید ویک تصویر رنگی،به طور کلی هر دودارای 8 بیت در هر کانال هستند،اما در مجموع عمق متفاوتی دارند به این ترتیب که  تصویر سیاه و سفید 8 بیت درهرپیکسل، در حالی که  تصویر رنگی 24 بیت در هر پیکسل دارد!
-عکس رنگی یک ویژگی دیگری هم دارد و ان این است که به صورت معمول کانال ها به این شکل ......RGB RGB RGB دخیره میشوند اما میتواند آنها رو به صورت جداگانه ......RRRR.... GGGG.....BBBB نیز ذخیره کند. 

مصرف حافظه  :
اشغال حافظه یک عکس RGB که دارای ۳ کانال و اندازه n x m میباشد،به صورت زیراست  :
   n * m * 3 bytes 
   برای مثال یک عکس rgb 640x480 به اندازه 640*480*3 = 921600 byte حافظه دستگاه را اشغال میکند.

تهیه تصویر :
تصاویر،حاصل دیجیتالی کردن سیگنال هایی است که ازسنسوردستگاه های مختلف مثل : دوربین فیلمبرداری،عکسبرداری و یا   اسکنر،بدست میایند.

Input/output process of images
Input/output process of images
منبع همیشه یک سنسور دیجیتالی است.تصویرهای دیجیتالی با سنسور هایی گرفته میشوند که قابلیت اندازه گیری و ضبط نورهای فوتنی که به آنها میرسند را دارند.سطح سنسور تشکیل شده از photosites کوچکی که روی یک شبکه فضایی منظم قرار گرفته اند.این photosites میکرو سنسورهای هایی که تبدیل فوتون به الکترون را انجام میدهند. 
تراشه های سیلیکونی در ابتدا به عنوان حافظه های دائمی و بعد ها به عنوان  photoreceptors استفاده میشد .این تراشه ها به ۲ دسته تقسیم میشوند :
      – CCD 
      – CMO

انواع خاکستری :

Gray levels
Gray levels

gray levels
Gray levels

Image processing :

Image processing به پروسه تبدیل یک عکس به عکسی دیگر می گویند.عکس یک نمایش مجزا از یک فرایند ۲ بعدی مداوم است .Image processing به ۲ روش صورت میگیرد : 
 ۱- پردازش سیگنال‌ها یا پردازش علائم به فرایند تجزیه، تحلیل و تفسیر سیگنال‌ها اطلاق می‌شود. سیگنال مورد نظر می‌تواند صدا، تصویر، فیلم و یا هر سیگنال دیگری باشد. این علم دارای دو شاخه اصلی می‌باشد:


در سیگنال‌های پیوسته در زمان متغیر مستقل، پیوسته است و این سیگنال‌ها در تمام مقادیر پیوسته‌ای که متغیر مستقل اختیار می‌کند تعریف می‌شوند. حال آنکه سیگنال‌های گسسته در زمان تنها در زمان‌های گسسته تعریف شده‌اند و در نتیجه این سیگنال‌ها تنها در مقادیر گسسته متغیر مستقل تعریف می‌شوند. 

۲-عکس ها در واقع ماتریکسی از پیکسل ها هستند؛رفتار عکس ها به عنوان ماتریکس نقاطی که میتوان روی آنها عملیات محاسباتی انجام داد. 
مثال :
عکس زیربه عنوان یک سیگنال ۲ بعدی بررسی و نمونه برداری شده است.

p:= (x,y, I(x,y))
two-dimensional image
two-dimensional image

عکس ۵۰ * ۵۰ پیکسلی خاکستری ۸ بیتی
عکس ۵۰ * ۵۰ پیکسلی خاکستری ۸ بیتی 

Quantization Chromatic :
همیشه لازم نیست که همه رنگ های موجود در تصویریعنی  *truecolor را داشته باشیم،بنابرین کم کردن رنگ عکسموجب فضای حافظه کمتراشغال  شود. 
برای کاهش لایه های رنگی : 
  با استفاده بیت های کمتر در گروه برای مثال :
    (۵-۵-۵ یا ۵-۶-۵ در رنگهای Hicolor از ۱۵ یا ۱۶ بیت صرفه جویی میشود.)
  با استفاده از lookup table یک مقدار بی نهایت از رنگها رو انتخاب میکند (برای مثال ۲۵۶) روی یک جدول ذخیره میکند  
و ارزش هر پیکسل برابر با مکان اشاره گر بروی جدول RGB است.لیست رنگ های موجود پالت نامیده میشود.از لحاظ تاریخی CGA دارای پالتی با ۴ رنگ و EGA  دارای ۱۶ رنگ بود. در واقع انقلابی با کارت VGA که دارای پالتی با ۲۵۶ رنگ بود،ایجاد شد. 


 (۲۴ بیت در هر پیکسل و ۸بیت برای هر کانال) = * truecolor

انتخاب پالت :
در تعیین میزان رنگ،پالت نقش اساسی دارد.شما می توانید ازیک پالت استاندارد که شامل زیر مجموعه ای از رنگ های ممکن است،استفاده کنید.این انتخاب از طریق مکعب RGB که دارای تعداد استانداردی از تونالیته های رنگی برای هر کانال است انجام میشود.این عمل از طریق فرمول زیر انجام میشود.
Elem : تعداد رنگهایی که میخواهیم در پالت باشد.

بهینه سازی پالت های رنگ :
 -میتوان از طریق انتخاب پالتی که فضای رنگی عکس را بهتر نمایش دهد،بدون از دست دادن کیفیت،عکس را فشرده سازی کرد. یک راه برای بهینه سازی پالت رنگی،روشی است که Paul Heckbert در سال ۱۹۸۰ پیشنهاد کرد که به Median Cut Algorithm مشهور است.
-همچنین میتوان از طریق روش تشابه رنگی عکس را فشرده سازی کرد به این ترتیب که نقاط رنگی مشابه را یکی میکند.
-معمولا برنامه های گرافیکی برای سنجش در فضای RGB از فاصله اقلیدسی استفاده میکنند. 
مثال :

استاندارد تلویزیونی :
عکسهایی که ازطریق دوربین های دیجیتالی گرفته میشوند معمولا دارای استاندارد های ویدیویی هستند. 
NTSC،(مخفف کمیته سامانه تلویزیون ملی)، سامانه تلویزیون آنالوگ است که در ایالات متحده، کانادا، ژاپن، مکزیک، فیلیپین، کره جنوبی، تایوان و تعدادی دیگر از کشورها از آن استفاده می‌شود. (رجوع شود به نقشه)
ان‌تی‌اس‌سی بیشترین استفاده را در امریکای شمالی و ژاپن دارد. این استاندارد از نسبت درازا به پهنای ۴:۳ برای اندازه صفحه تصویر استفاده می‌کند و هر فریم تصویر تشکیل شده‌است از ۵۲۵ خط و تعداد فریم‌ها در ثانیه ۳۰ فریم است.
سکام، (به فرانسوی Séquentiel couleur à mémoire به معنای رنگ متوالی همراه با حافظه) سامانه تلویزیون رنگی آنالوگ است که اولین بار در فرانسه ابداع شد. این سامانه را تیمی به سرپرستی هنری دو فرانس که در شرکت تلویزیونی فرانسه که بعدها توسط تامسون خریداری شد، ابداع کردند. این سامانه از جهت تاریخی اولین سامانه رنگی استاندارد اروپایی به شمار می‌رود.
پال مخفف «خط فاز متناوب» (به انگلیسیPhase Alternating Line)، سیستم فرستنده رنگی است که در سامانه فرستنده تلویزیونی در بیشتر نقاط جهان از آن استفاده می‌شود. سامانه‌های رایج دیگر تلویزیون آنالوگ سکام یا ان تی اس سی می‌باشند.

Interlaced video :
 سیستمهای پخش قدیمی NTSC دارای 525 خط افقی تصویر میباشند. در سیستم PAL تصاویر با کیفیت اندکی بهتر و با 625 خط افقی پخش میگردد. اما تمام این خطوط برای نمایش تصویر بکار نمیروند. خطوطی که اطلاعات تصویری را نمایش میدهند خطوط فعال نام دارند و تعدادشان 486 برای سیستم NTSC و 576 برای PAL میباشد. بعلاوه ، در سیستمهای PAL و NTSC از پویش شانه ای (interlaced) استفاده میشود یعنی هر قاب به دو بخش تقسیم شده و یک بخش شامل خطوط فرد ، و بخش دیگر شامل خطوط زوج میباشد. هر بخش بصورت یک در میان نمایش داده میشود و مغز ما با ترکیب آنها تصویر کامل هر قاب را میسازد. پویش شانه ای کیفیت تصویر را پایین می آورد.
به مثال زیر دقت کنید :
interlacing
interlacing

اسکن پیشرونده :
اسکن پیشرونده (Progressive scanning) یک راه برای نمایش، ذخیره‌سازی، و یا انتقال تصاویر متحرک است که در آن تمام خطوط هر فریم به ترتیب کشیده شده‌اند.

اسکن پیشرونده
اسکن پیشرونده
-سیستمی برای دستیابی به رزولوشن کامل،فقط با یک بار اسکن.
-رزولوشن عمودی تصویر را بالا میبرد.  
-مصنوعات ایجاد شده توسط پویش شانه ای را از بین میبرد. 
-در دوربین های عکاسی به کار میرود. 
-این تکنولوژی در ۱۰ سال اخیر به وجود آمده است. 

دوربین فیلمبردای :
به روند انتقال تصاویر متحرک به فیلم وهمسان سازی رنگ های ان به یک مجموعه رنگ واحد Telecine میگویند.این اصطلاح  برای اشاره به تجهیزات مورد استفاده در فرایند تولید نیزمورد استفاده قرار گیرد است.
Telecine
Telecine 
فرمت های دوربین های فیلمبردای :
► DVD -> 720x576, 704x576 PAL – 720x480, 704x480 NTSC
► HDTV (720p) 1280x728
► FULL HD (1080p) 1920x1080
► (720i, 1080i)   .بعد از رزولوشن عمودی نشان میدهد که منبع  ویدییو پویش شانه ای بوده است,I

Video Camera Formats
Video Camera Formats
Image Formats :
Color data mode  -bits per pixel
Color data mode  -bits per pixel

Best file types for these general purposes

Best file types for these general purposes


مثال ها : 
Help->Browser...
● GEM \ pix_resize
● GEM \ pix_reducecolor
● GEM \ pix_dot
● GEM \ pix_histo
● GEM \ pix_motionblur


منابع :
►Wikipedia
► http://imagelab.ing.unimore.it/imagelab/
►Rita Cucchiara, Dispense del corso di Visione Artificiale, a.a. 2004-05, Università degli studi di Modena e Reggio Emilia,       marzo 2005.  
►Rita Cucchiara, Dispense del corso di Sistemi di Elaborazione, a.a. 2004-05, Università degli studi di Modena e Reggio Emilia, marzo 2005.

هیچ نظری موجود نیست:

ارسال یک نظر