Find us on Google+ سییتم های تعاملی - رسانه های تعاملی - پیور دیتا: 2012

۲۰ آذر ۱۳۹۱

انجام یک پروژه Installation


Installation art :
مقدمه : هنر چیدمان یا هنر اینستالیشن (به انگلیسیInstallation art) استفاده کردن از عناصر مختلف است برای بیان تجربه هنرمند از «فضا»یی مشخص آنچه این هنرمندان در آن شریکند، نه موضوع خام، مواد خام، یا روش‌های خاکار، بلکه، علاقه آنها و تعهدشان به دیدگاهی گسترده تر از آفرینش هنری واز این راه کشف خود است.
از خصوصیات هنر اینستالیشن، فعال سازی یک محیط یا یک مفهوم با برخوردهای ظاهرا هنری است که باعث می‌شد اثر معنا و مفهوم و ارزش هنری پیدا کند. 
موادی که در چیدمان استفاده می‌شوند شامل طیف وسیعی هستند: از مواد و اشیاء زندگی روزمره و طبیعت گرفته تا رسانه‌های جدید نظیر ویدئو، صدا، پرفورمانس(هنر اجرا)، کامپیوتر و حتی اینترنت. هنر چیدمان لزوماً در نگارخانه‌های هنری اجرا نمی‌شود، بلکه ممکن است در هر فضای عمومی یا شخصی اجرا شود. بعضی از چیدمان‌ها فقط برای فضای خاصی طراحی شده‌اند.
سبک‌های استفاده شده در هنر چیدمان بسیار متنوع هستند؛ از انتزاعی (آبستره) گرفته تا روایی، از سیاسی تا صرفا نظری، اثری موقتی یا ماندگار.
از کجا شروع کنیم ؟
در روش اول به یک ابزار برنامه نویسی ویژوال برای کامپیوتر و یک ایده برای  انجام یک پروژه تعاملی احتیاج داریم :
برای تبدیل یک ایده به یک پروژه راه های تکنیکی ان,غیر قابل پیشبینی است.اولین چیزی که برای  آغاز کار لازم است،تقسیم بندی کردن بخش تئوریک پروژه به مراحل گام به گام و مشخص کردن اینکه چه بخشی از پروژه  قبل وچه بخشی بعد اتفاق بیفتد.بنابر آنچه گفته شد در واقع ما برای شروع باید نکات زیر را بررسی کنیم:
۱-پروژه چه تعاملی قرار است با بیننده (یا بلعکس) داشته باشد،یا به عبارتی دیگر بیننده چگونه در کار هنری دخالت خواهد داشت.
۲-محلی که پروژه قرار است در آنجا اجرا شود.
۳-حرکات در نقاط حساس.
۴-صدا ها .(سر و صدا های محیط هم شامل میشوند)   
۱-چه تعاملی با بیننده خواهیم داشت  ؟
لازم است به طور دقیق نوع تعامل کار با بیننده مشخص شود.برای مثال :
اگر قرار است بازدیدکننده وارد اتاق شود و با هر تکانی که میخورد ویدیویی پخش شود،باید سوالات زیر به صورت  دقیق پاسخ 
دهیم:
-بازدید کننده چگونه باید خود را تکان دهد ؟
-آیا باید از جایی بجایی دیگر رود ؟
-در چه محدوده ای دقیقا باید تکان بخورد؟   
-چه سخت افزاری احتیاج داریم ؟(دوربین ،میکروفون ،سنسور،....) 
-چه اطلاعاتی باید بگیریم (مختصات حرکت بازدیدکننده ؟فاصله ؟مقداری برای اندازه گیری صدا ؟مقداری برای اندازه گیری حساست سنسور ؟،.... )
-کجا باید سنسور(audio/video) را برای دریافت اطلاعات از بازدیدکننده ، قرار دهیم ؟
آنچه در بالا گفته شد قدم های اولیه برای انجام یک پروژه Installation است.
 اولین قدم :
برای انجام پروژه های کوچک میتوان از وب کم هم استفاده کرد اما برای Installation های حرفه ای باید از دوربین های حرفه ای بهره برد.همچین میتوان از یک دوربین dv با خروجی firewire استفاده کرد.همینطور برای میکروفون.
دومین قدم :
پردازش تعامل پروژه 
-تعین داده های عددی لازم برای طراحی پروژه ی تعاملی 
-انتخاب بهترین تکنیک برای پردازش و پیشبرد پروژه 
-تشخیص حضور فیزیکی ---> background suppression
-تشخیص حرکت ---> single/double difference
-تشخیص رنگ ---> color tracking  
برای به دست آوردن اطلاعات لازم باید ماسک ایجاد کنیم و ان را پردازش کنیم (محاسبه مساحت، مرکز ثقل موقعیت، فاصله، سرعت(= فضا / زمان) ....)
 در صورت وجود میکروفن بایدسیگنال دریافتی را  جهت به دست آوردن مقادیر عددی لازم پردازش کنیم(صدا،...) 
نتایج حاصل از این مرحله  نشان دهنده مقدار تعامل خواهد بود که ازان باید برای مرحله بعدی استفاده می شود.

سومین قدم :
قرار دادن سخت افزار پخش کننده ویدئو 
دوربین یا پروژکتور نمیتوانند در هرحالتی یا هرجایی قرار بگیرند،برای هر دیتایی که قرار است استخراج شود،قرار دادن تمام اجزا در جای مناسب ضروری است.برای داشتن یک خرجی مناسب مکان قرارگیری دوربین امری به شدت مهم است .
مختصات x,y دریک اتاق :
در پروژه اینتراکتیوی که قرار است تعامل به حرکات بازدید کننده وابسته باشد مختصات مکان بازدیدکننده از اصلی ترین داده ها میباشد.
Detection vs Display :  
دوربین را کجا قرار دهیم ؟---> بستگی داره چه دایتایی قراره از مختصات بازدیدکننده در اتاق،بگیریم.
مختصات X,Y :
بهتر که دوربین را بالا و مرکزسقف اتاق قراردهیم،به صورتی که دوربین در حالتی عمودی مخاطب رو هدف قرار بدهد.در ضمن برای این کار باید سقف به اندازه کافی بلند باشد.برای مثال در عکس زیر نقاط سیاه تیره مکان های پیش بینی شده برای مخاطب است.و خط های خاکستری مسیر حرکت مخاطب را نشان میدهد.
فاصله از دوربین باید مناسب باشد روی سقف های خیلی کوتاه نمیتوان کار کرد.راه دیگربرای تشخیص مختصات X,Y این است 
که دوربینی در وسط سقف،بالای صفحه نمایش قرار بدهیم.  

در این مورد شما احتیاج دارد که مختصات پای بازدیدکننده را ردیابی کنید نه مرکز ثقل را،چون در این مورد به ارتفاع بازدیدکننده  
 بستگی ندارد.
موقعیت فقط عمودی یا افقی  :
محل فیلمبرداری به سادگی موازی با حرکت بازدیدکننده خواهد بود.به عکس زیردقت فرمایید :
تعامل با صفحه نمایش :
برای مثال مختصات X,Y دست,این تعامل پیچیده تر است و می تواند در 2 روش متفاوت انجام می شود:
Rear Projection : با قرار دادن یک دوربین و یک نورافکن با مادون قرمز پشت و بالای پرده نمایش،دستها نورانی و قابل دیدن برای دوربین میشوند.این روش همچین امکان تشخیص نمای کلی از بازدیدکننده را به دوربین میدهد.نکته قابل توجه در این روش این است که صفحه نمایش باید به اندازه ترانسپرنت باشد که اشعه از ان به راحتی عبور کند.
Rear Projection
Rear Projection


بالای صفحه نمایش چراغ های مادون قرمز قرار میدهم. 







تقسیم بندی و استخراج silhouette

تقسیم بندی : 
تقسیم بندی تصآویر یکی از  قدم های  بسیار مهم در جهت پردازش تصاویر و پروسه  ضروری برای تجزیه و تحلیل آنها میباشد.

بخش بندی یا تقسیم بندی تصویر به چه معنی میباشد ؟
تقسیم بندی کردن ، پارتیشن بندی کردن معنی میدهد به عبارتی بخش بندی کردن تکنیکی است که  اجازه می دهد تا تصویر را به دو منطقه تقسیم کرد که حضور یا عدم حضور یک ویژگی خاص را شناسایی میکنند.

به عنوان مثال : تقسیم بندی انجام شده روی تصاویر شناسایی شده اشیاء در حال حرکت در ۲ بخش تعیین میشوند :
در حال حرکت و غیرحرکتی  (ساکن)

هدف از تقسیم بندی ، به دست آوردن یک تصویر باینری است ، که با یک رنگ (سفید) مجموعه  نقاط  تصویر در حال حرکت شناسایی میشود ، و با رنگ دیگر (سیاه) مجموعه نقاط از تصویر  که در حال حرکت نمیباشند (ساکن) میباشد.

در اینجا از مجموعه نقاط صحبت میشود و نه object ها (اشیاء)، برای اینکه بخش بندی در سطح پیکسل انجام میشود ،
و پس از شناسایی مناطقی از تصویر در حال حرکت و گروه بندی می شوند، توانایی این را خواهد داشت که در سطح object کار کند و blob نامیده میشود.
نتیجه حاصل از یک تقسیم بندی یک تصویر باینری خواهد بود که آنرا ماسک نیز مینامیم .
انواع مختلفی از تقسیم بندی وجود دارد .
تقسیم بندی یک تصویر "عادی"، از پیش پردازش نشده، بر اساس تغییرات درخشندگی ان است .
برای به دست آوردن اطلاعات مربوط به حرکت ،  پردازش بیش از یک تصویر لازم است.

آستانه تصویر : 
انتخاب یک مقدار از شدت نور T (آستانه) ، که اجازه جدا کردن تصویر به دو منطقه،بالاترین  و پایین ترین با توجه شدت نور میدهد .
تبدیل تصویر در سطح خاکستری به یک تصویر باینری
برای هر نقطه از از تصویر مبدا؛ 
 f(i,j)
نقطه مشخص شده
g(i, j) 
در تصویر ، تبدیل میشود .

اگر  f(i,j)>=T) g(i,j)=1; 
درغیر این صورت  g(i,j)=0; 
آستانه استاتیک : آستانه ثابت در ابتدا انتخاب میشود.
آستانه پویا : آستانه یی که در طول اجرای یک patch متناسب با یک مقدار دیگر تغییر میکند.
(بطور مثال : مقدار متوسط روشنایی صحنه تغییر میکند)



آستانه : 

جعبه ای که کار تقسیم بندی آستانه را انجام میدهد pix_duotone نامیده میشود.

دومین inlet آستانه RGB ست ، و سومین inlet ، رنگیست  
که پیکسل ست میشه، اگر پایین تر از آستانه باشد .
چهارمین ، رنگ RGB ست اگر بالاتر یا برابر آستانه باشد .

در مثال نشان داده شده ، یک پیکسل به عنوان سفید دسته بندی می شود ،اگر مقدار بزرگتر یا برابر با آستانه داشته باشد، در غیراینصورت مشکی دسته بندی میشود. 

بنابرین آستانه همانند یک نقطه برش عمل میکند .









چه آستانه ای استفاده شود؟
انتخاب آستانه بستگی دارد به object های مورد علاقه :


در مورد آستانه استاتیک ، آستانه باید پس از تجزیه و تحلیل دقیق از صحنه انتخاب شود.
در مورد آستانه پویا (که در طول اجرا تغییر میکند) میتوان از روشنایی تصویر برای تغییر آستانه استفاده کرد. 

تشخیص اشیاء و حرکت : 
اساسا سه روش برای تشخیص اشیاء و / یا حرکت در یک صحنه وجود دارد:

Background suppression
Single difference
Double difference


Background suppression یا مهار پس زمینه :
تشخیص حضور اشیاء را در صحنه با انجام مقایسه پیکسل به پیکسل بین فریم های جاری و یک فریم که آنرا پس زمینه مینامیم یا  تصویر مرجع یا تصویر background که شامل یک تصویر از پس زمینه "تمیز" (یعنی بدون اشیاء)
این روش فقط زمانی کاربرد دارد که دوربین کاملا ثابت و بدون حرکت باشد.
تفاوت با تصویر پس زمینه یک تصویر متفاوت تولید خواهد کرد.
تفاوت در سطح پیکسل انجام میشود ، اگر I تصویر فعلی، B تصویر پس زمینه و تصویرD  مقدار تفاوت باشد بنابراین داریم :
    D(x,y) = | max(I(x,y).R-B(x,y).R, I(x,y).G-B(x,y).G, I(x,y).B-B(x,y).B) |  
که در آن (x,y) نقطه ای در مختصات x و y  مربوط به تصویر میباشد ، و R .G .B. مؤلفه رنگ قرمز، سبز و یا آبی است.
-- تفاوت در ارزش مطلق است .
-- ایجاد یک تغییر در RGB ضروری نیست
        D(x,y) = | I(x,y) – B(x,y) |

تفاوت های برجسته تصویر در نمایش داده نمیشوند در تصویر پس زمینه .

تصویر اول : ویدئو ارجینال  تصویر دوم : پس زمینه ذخیره شده
تصویر اول : ویدئو ارجینال  تصویر دوم : پس زمینه ذخیره شده 

تصویر تفاوت با پس زمینه
تصویر تفاوت با پس زمینه   


تفاوت بین ۲ تصویر : 
یک مثال ریاضی از تفاوت بین تصاویر در مقیاس خاکستری :



تصویر A

تصویر B

تصویر تفاوت  D = |A-B|
به اعدادسه گانه ۳۹ دقت کنید ، با اعمال عملیات آستانه با مقدار 20 ماسک زیر بدست میاید


PureData - Audio

: Audio
 [osc~]ماژول که سیگنال های صدا را پردازش میکنند به “~” ختم میشوند. مثال 
سیگنال های صوتی floating point 32 bit هستند ، با محدوده 1- , 1
اغلب سخت افزار محدود به ۱۶ یا ۲۴ بیت است .
I/O Audio: objects adc~ e dac~
همیشه در قسمت پایین یک patch قرار دارند 
Audio on/off : در شروع همیشه به صورت پیش فرض خاموش (off) میباشد. 
شروع و پایان پردازش 
از رابط  کاربری ، منوی  (MEDIA->audio ON/OFF) و یا از یک patch با پیغام pd dsp 1 و pd dsp 0
پیش فرض  44100Hz، قابلیت ویرایش توسط GUI
ذخیره در ۱۶/۲۴/۳۲ بیت  wav, aiff, au
با سیگنال های صوتی  نمی توان  cycles / loop انجام داد .
شما فقط میتوانید آنرا با اتصالات غیر local انجام دهید (تاخیر به اندازه یک audio buffer size)
اجازه روشن و خاموش کردن صدا را میدهد  switch~  
 اندازه بلوک های پردازش را کنترل میکند    block~
برای sottopatch های واحد .
 بر روی تمامی پنجره کار میکند 

Audio 2 :
انتخاب کانال صوتی I / O
  -- Flag -inchannels, -outchannels
  -- default 2

 writesf~, readsf~, soundfiler~, tabwrite~, tabread4~ :  objects  نوشتن / خواندن 

Objects MIDI
  -- اگر لازم باشد، فعال کردن   دستگاه هایMIDI IO  در رسانه ها → MIDI Settings...
Notein, noteout, ctlin, ctlout, pgmin, pgnout, bendin, bendout, touchin, touchout,sysexin, sysexout, . . .  

  -- مباحث: canal number, ctl number
  -- ببینید : PureData/ → 5.reference/ → midi-help
چپ ترین inlet  در یک  object audio میتواند هرگونه سیگنالی از نوع audio و message بقیه inlet ها ، audio , message را دریافت کند ،   

صدا و پیام ها (Audio and messages) :
پردازش صوت و پیام لایه ای

سیگنال های کنترل پردازش در آغاز هر چرخه DSP
  -- 64/44.1kHz → 1.45 ms
پیغام های هرگز عبور نکرده در طول یک tick از dsp (جبرگرایی)
تبدیل سیگنال های صوتی و کنترل:
Objects sig~ , snapshot~

مشکلات :
نمیتوان sample-rat را کنترل کرد 
رویداد های در سطح audio (به عنوان مثال zero-crossing) به عنوان trigger استفاده نمیشوند.
در Browser examle ببینید : 


•Pure Data/ → 2.audio.examples/ → A04.line2, A05.output.subpatch, B07.sampler, G01.delay
•Manuals/ → 1.Sound/ → 01.controlling_dsp_processing, 01.hello_world, 02.audio_data, 02.make_some_noise, 03.dsp_processing

File audio : 
object هایی وجود دارند که میتوانند فایل های صوتی را باز کنند . (هرکدام از آنها با ویژگی مختلفی )
[soundfiler] یک فایل wav را باز میکند و محتویات آنرا در یک array کپی میکند.
  -- اندازه یک آرایه را حد اکثر محتوای کپی شده تعیین خواهد کرد .
  -- object های [tabplay~] و  [tabread~] برای باز خوانی محتویات آرایه لازم میباشد. 

[~readsf] فایل های wav و  aiff را باز میکند 
  -- پیغام [open] و  متقائب آن نام فیل لازم میباشد .
  -- پیغام [start]برای آغاز بازخوانی لازم میباشد . 

[~mp3play] کتابخانه خارجی iemlib فایل mp3 را باز میکند .
  -- پیغام [open] و  متقائب آن نام فیل لازم میباشد .
  -- پیغام [start]برای آغاز بازخوانی لازم میباشد . 


Detection volume :
[~env] تشخیص دامنه در دسی بل از سیگنال های ورودی صوتی
[~fiddle]تشخیص دامنه در DB، اوج، و دیگر سیگنال ورودی های صوتی


منابع : 
Pd Documentation, www.puredata.info
Federico Avanzini, “Corso di Sistemi di elaborazione per la musica”, DIE,
Università di Padova


۷ آذر ۱۳۹۱


تئوری تصاویر :

چشم انسان :
چشم ما رنگ با طول موج نوری که محرک روی شبکیه چشم  ایجاد میکند،را از رنگ قرمز (بالاترین طول موج)  تا نارنجی، زرد، سبز، آبی، بنفش میتواند ببیند.
طیف مرئی  از ۳۸۰  تا ۷۸۰  نانومتر می باشد.
چشم ما دارای ۱۲۰ میلیون یاخته استوانه ای حساس به نور میباشد.و همچنین دارای حدود ۸ میلیون یاخته‌های مخروطی حساس به طول موج های مختلف میباشد.

**یاخته‌های استوانه‌ای نوعی از یاخته‌های گیرندهٔ نور هستند که در انتهای چشم و در شبکیه قرار دارند. این یاخته‌ها همراه با یاخته‌های مخروطی جریانالکترومغناطیسی نور خورشید را به پیام عصبی تبدیل کرده و از طریق عصب بینایی به لوب پس‌سری مغز منتقل می‌کنند.
یاخته‌های استوانه‌ای بیشتر در نور ضعیف تحریک می‌شوند و به مغز توانایی دیدن در تاریکی را می‌دهند و آسیب به آن موجب بیماری شب کوری می شود.این یاخته‌ها به رنگ‌ها حساسیت نشان نمی‌دهند؛ به همین دلیل بینایی در تاریکی به رنگ سیاه، سفید و طیفی از خاکستری است. یاخته‌های استوانه‌ای همچنین در تشخیص حرکات توسط مغز نقش دارند.
بیشترین تمرکز یاخته‌های استوانه‌ای در بخش‌های پیرامونی شبکیه، و کمترین تمرکز آن‌ها در لکهٔ زرد است.**

دید انسان
دید انسان 
درک رنگ از طریق ترکیب ۳ رنگ اصلی امکان پذیر میباشد.روی شبکیه چشم سیگنال های رنگی به ۳ فیلتر ابی،قرمز،سبز تبدیل میشوند.

تعیین کمیت رنگ :
چشم ما برخلاف گوش،قابلیت تجزیه و تحلیل کردن طیفی ندارد،اما از طریق ترکیب طول موج های مریی درک رنگ را برای
ما امکان پذیر میکند.
ما میتوانیم ۳ نوع رنگ تعریف کنیم :
  رنگ های طیفی : تولید شده توسط تابش حاوی یک باند باریک طول موج.
  رنگ ارغوانی(magenta) : تابشی حاوی ترکیبی بی نهایتی از طیف رنگی با طول موج مریی یعنی ابی،بنفش،قرمز-زرد.
  رنگ  سفید : تابش در طیف مداوم.

بر طبق نظریه  توماس یانگ، فیزیکدان انگلیسی، که در سال 1802 ارائه شد، با استفاده از سه رنگ قرمز، سبز و آبی می‌توان تمام رنگ‌های طیف رنگی را تولید کرد.
اولین شواهد تجربی  به دست آمده از آزمایش بر روی چشم در سال  ۱۹۶۴  رخ داده است.

بازتولید رنگ :
یک رنگ را میتوان با ۳ روش اساسی باز تولید کرد:
  -additive synthesis : سنتز افزودنی، مخلوطی از چراغ های مختلف کروماتیکی (فام‌داری*)
additive synthesis
additive synthesis
*در دانش رنگ‌شناسی، به کیفیت یک رنگ که نه بر اساس روشنای بل‌که بر پایهٔ فام (پرده یِ رنگ) و اشباع تعریف شود، فام‌داری گفته می‌شود.*

   -subtractive synthesis : سنتز کاهشی،انطباق یا همپوشانی بخشی که طیفهای مختلف را جذب میکند.

subtractive synthesis
subtractive synthesi
یکپارچه سازی فضایی :
نقاط رنگی مختلف و نزدیک بهم به چشم انسان به صورت نقاط رنگی همپوشان به نظر میرسد و  تولید یک نتیجه مشابه به سنتزافزودنی میکند. 


Integrazione spaziale
Integrazione spaziale
additive synthesis (سنتز افزودنی) :
 سنتز افزودنی رنگ همان روشی است که چشم انسان و بسیاری از وسایلی که از چشم انسان تقلید میکنند (مثل دوربین های دیجیتال،دوربین های فیلمبرداری،مانیتورها) که باترکیب نقاط رنگی کنار هم تصویر را تشکیل میدهند،استفاده میکنند. 


additive synthesis
additive synthesis

در عمل یک عکس به تعداد بسیار زیادی از نقاط (پیکسل) قرمز،سبزو ابی تجزیه میشود.




به لحاظ تاریخی اولین دستگاه سنتز افزودنی همان دیسک نیوتون بود که روی ان بخش های دایره ای زیادی از رنگ های مختلف طراحی شده بود.با چرخاندن سریع این دیسک رنگ ها ترکیب میشدند و یک رنگ واحد بنظر میامد و اگر رنگ ها به صورت به اندازه مناسب دوز بندی میشدند،ان رنگ سفید به نظر میامد.  
۳ رنگ اصلی سنتز افزودنی که چشم انسان به ان حساس است قرمز،سبز و ابی است (در انگلیسی به ان RGB می گویند.)

subtractive synthesis (سنتز کاهشی) :
۳ رنگ اصلی سنتز کاهشی(در انگلیسی به ان YMC می گویند.)،درواقع مکمل ۳ رنگ اصلی سنتز افزایشی اند :
   
  - زرد مکمل ابی
  - سرخابی مکمل سبز
  - ابی فیروزه ای مکمل قرمز 

ساده ترین مثال از سنتز کاهشی قراردادن فیلترهای رنگی روی هم است.هر فیلتر مانع عبور یک نور میشود ودر نهایت بخش کمی از نور میتواند از فیلترها عبور کند به همین دلیل به این روش سنتز کاهشی گفته میشود. 


subtractive synthesis
subtractive synthesis 
طراحان و نقاشان هم با ترکیب کردن لایه هایی از رنگ های مختلف روی کاغذ یا روی بوم نقاشی یک سری فیلتررنگی ایجاد میکنند .مثال دیگر از سنفز کاهشی لنز دوربین های رنگی عکاسی و سینمایی است. 

مانیتور CRT :
سیستم طراحی شده روی صفحه تلویزیون بر اساس اشعه کاتدی (CRT) است،که با ترکیب  رنگ  از طریق یکپارچه سازی فضایی نقاط رنگی RGB تصویر را روی صفحه تلویزیون نمایش میدهد.
بنابراین فضای رنگی که استفاده میکنیم بر اساس نورهای کروماتیکی ساطع شده از چراغ هایی با سه نوع رنگ فوسفری  ساخته شده اند .
دریک فضای رنگی RGB مکعب شکل که دران فقط نور محسور درمکعب قابل دیدن باشد رئوس مکعب نشان دهندمختصات رنگ های کورماتیکی است.  


MONITOR CRT
MONITOR CRT

در تصویر بالا تقاطع این فضا با صفحه R+G+B=1 مثلثی را ایجاد میکند که قابل نمایش در فضای CIEXYZ میباشد و gamut monitor نامیده میشود.   


تصحیح گاما (gamma Correction) :
تصحیح گاما،برای جبران غیر خطی بودن اشعه های کاتدی (CRT) در تبدیل یک سیگنال ویدیویی به نور به دلیل خطی نبودن رابطه الکترون جاری با شتاب،طراحی شده است. 
تصحیح گاما در نظر گرفته شده برای انحراف های این چنینی که اشعه های کاتدی(CRT) ایجاد میکنند وباعث ایجاد بیشترین نور 
یکنواخت از نقطه نظر ادراکی میشود.





فرق بین یک مقیاس با یک ورودی خطی (به عنوان مثال مقیاس ارزش درخشندگی با کد گذاری خطی) و یک مقیاس با یک  خروجی خطی (یک شدت خطی افزایشی) :

تصحیح گاما
تصحیح گاما
یک مقیاس کد گذاری شده خطی که یک شدت غیر خطی دارد فاراینده نور را منظم تر نشان میدهد.



پرتو ساطع شده از مانیتور CRT  بامقدار سیگنال  پرتو الکترونی یک رابطه خطی ندارد بلکه رابطه تشریحی دارد :

از آنجایی که مدار لازم برای ایجاد رابطه خطی بسیار گران بود سیگنال قبل از منتقل شدن،از طریق همان به اصطلاح gamma correction تصحیح میشد.
بر اساس استاندارد NTSC مقدار  γ = 2.2  انتخاب شد. 
مقادیر واقع بینانه برای گاما بین ۲.۳۵ تا ۲.۵۵ است اما در استاندارد های تلویزیونی برای شرایطی که صفحه نمایش تلویزیون در نور کم دیده میشود،یک مارجین برای افزایش کنتراست تصویر در نظر گرفته شده است.



فضاهای رنگی RGB در دستگاه های محاسباتی :
نمایش رنگ در دستگاه های الکترونیکی به طور معمول متناسب با عملکرد کارتهای گرافیکی مانیتورهای CRT در نظر گرفته شده است. 
برای هر۳ سیگنالی که به مانیتور فرستاده میشود،۳ مقدار ۸ بیتی برای هر پیکسل تعریف میشود.

RGB

کارت گرافیکی هم درنمایش تصاویرنقش به سزایی دارد .
عکس و فیلم دیجیتال :

عکسدیجیتال درواقع یک تابع ۲ بعدی است که به وسیله سنسور های بصری روی یک صفحه خارجی قابل مشاهده است.عکس های دیجیتال یک ماتریکس محدود بین مقادیر (N,M) میباشد،که پیکسل(عناصر تشکیل دهنده عکس) نامیده میشوند. 



ویدئو دیجیتال در واقع از یکسری عکس (فریم) که به صورت متوالی و پشت سر هم قرار میگیرند وهر عکس تا عکس بعدی  فاصله ∆ t را طی میکند ،تشکیل میشود.
مقیاس اندازه گیری : FPS (فریم در ثانیه)

دقت (Resolution) :
-وضوح فضایی *(N,M),به تعداد پیکسل در صفحه نمایش عکس و کارت گرافیکی سیستم بستگی دارد.برای مثال به پارامتر های زیر دقت کنید :


Resolution
Resolution
(سطر،ستون)= (N,M)*
-وضوح زمانی در ویدیو به تناوب زمانی مناسب تصاویر دارد که همان (frame rate) نامیده میشود.
-وضوح سطوح خاکستری،یعنی قدرت تشخیص سطوح خاکستری : .k  n
   برای مثال : به عنوان مثال 256 با K = 8
وضوح فضایی بیشتر با جزییات خیلی کوچک تصویر در ارتباط است.(dpi) و درواقع به پارامتر های زیر بستگی دارد :
   - دوربین 
  - دوری و نزدیکی سوژه 
  - صفحه نمایش 


عکس هایی با اندازه های یکسان اما تعداد پیکسل متفاوت
عکس هایی با اندازه های یکسان اما تعداد پیکسل متفاوت
عکس هایی با تعداد پیکسل یکسان اما اندازه های متفاوت
عکس هایی با تعداد پیکسل یکسان اما اندازه های متفاوت
عکس ها :
تصاویر عمدتا 
     رنگی (24bit*pixel /  3channel / 8 bit *channel: RGB)
     در مقیاس خاکستری (1channel / 8 bit*channel)
     باینری (1bit*channel, whiate& black)

**توجه داشته باشد یک عکس 24bit*pixel  میتواند عکس های سیاه و سفید و خاکستری را هم نمایش دهد،فقط کافی است که مقادیر RGB را یکسان قرار دهیم تا بتواند تمام لایه های خاکستری را نمایش دهد.یک پیکسل خاکستری دارای مقادیر (RGB  = (128, 128, 128 میباشد.**  

عکس در bit :
یک عکس تشکیل شده از :
● تعدادی کانال : 
یک تصویر به سیاه و سفید دارای یک کانال (کانالروشنایی) /یک تصویر RGB دارای سه کانال (قرمز، سبز و آبی)

● تعدادی کانال در هر بیت :
bpc یعنی چند بیت اطلاعات مربوط به یک کانال را نمایش میدهد.(۱،۸،۱۶،۳۲) 
● تعداد بیت در کل پیکسل ها که برابر است با تعداد بیت در کانال ضربدر تعداد کانال :
bpp = bpc * nc

-بنابراین یک تصویرسیاه و سفید ویک تصویر رنگی،به طور کلی هر دودارای 8 بیت در هر کانال هستند،اما در مجموع عمق متفاوتی دارند به این ترتیب که  تصویر سیاه و سفید 8 بیت درهرپیکسل، در حالی که  تصویر رنگی 24 بیت در هر پیکسل دارد!
-عکس رنگی یک ویژگی دیگری هم دارد و ان این است که به صورت معمول کانال ها به این شکل ......RGB RGB RGB دخیره میشوند اما میتواند آنها رو به صورت جداگانه ......RRRR.... GGGG.....BBBB نیز ذخیره کند. 

مصرف حافظه  :
اشغال حافظه یک عکس RGB که دارای ۳ کانال و اندازه n x m میباشد،به صورت زیراست  :
   n * m * 3 bytes 
   برای مثال یک عکس rgb 640x480 به اندازه 640*480*3 = 921600 byte حافظه دستگاه را اشغال میکند.

تهیه تصویر :
تصاویر،حاصل دیجیتالی کردن سیگنال هایی است که ازسنسوردستگاه های مختلف مثل : دوربین فیلمبرداری،عکسبرداری و یا   اسکنر،بدست میایند.

Input/output process of images
Input/output process of images
منبع همیشه یک سنسور دیجیتالی است.تصویرهای دیجیتالی با سنسور هایی گرفته میشوند که قابلیت اندازه گیری و ضبط نورهای فوتنی که به آنها میرسند را دارند.سطح سنسور تشکیل شده از photosites کوچکی که روی یک شبکه فضایی منظم قرار گرفته اند.این photosites میکرو سنسورهای هایی که تبدیل فوتون به الکترون را انجام میدهند. 
تراشه های سیلیکونی در ابتدا به عنوان حافظه های دائمی و بعد ها به عنوان  photoreceptors استفاده میشد .این تراشه ها به ۲ دسته تقسیم میشوند :
      – CCD 
      – CMO

انواع خاکستری :

Gray levels
Gray levels

gray levels
Gray levels

Image processing :

Image processing به پروسه تبدیل یک عکس به عکسی دیگر می گویند.عکس یک نمایش مجزا از یک فرایند ۲ بعدی مداوم است .Image processing به ۲ روش صورت میگیرد : 
 ۱- پردازش سیگنال‌ها یا پردازش علائم به فرایند تجزیه، تحلیل و تفسیر سیگنال‌ها اطلاق می‌شود. سیگنال مورد نظر می‌تواند صدا، تصویر، فیلم و یا هر سیگنال دیگری باشد. این علم دارای دو شاخه اصلی می‌باشد:


در سیگنال‌های پیوسته در زمان متغیر مستقل، پیوسته است و این سیگنال‌ها در تمام مقادیر پیوسته‌ای که متغیر مستقل اختیار می‌کند تعریف می‌شوند. حال آنکه سیگنال‌های گسسته در زمان تنها در زمان‌های گسسته تعریف شده‌اند و در نتیجه این سیگنال‌ها تنها در مقادیر گسسته متغیر مستقل تعریف می‌شوند. 

۲-عکس ها در واقع ماتریکسی از پیکسل ها هستند؛رفتار عکس ها به عنوان ماتریکس نقاطی که میتوان روی آنها عملیات محاسباتی انجام داد. 
مثال :
عکس زیربه عنوان یک سیگنال ۲ بعدی بررسی و نمونه برداری شده است.

p:= (x,y, I(x,y))
two-dimensional image
two-dimensional image

عکس ۵۰ * ۵۰ پیکسلی خاکستری ۸ بیتی
عکس ۵۰ * ۵۰ پیکسلی خاکستری ۸ بیتی 

Quantization Chromatic :
همیشه لازم نیست که همه رنگ های موجود در تصویریعنی  *truecolor را داشته باشیم،بنابرین کم کردن رنگ عکسموجب فضای حافظه کمتراشغال  شود. 
برای کاهش لایه های رنگی : 
  با استفاده بیت های کمتر در گروه برای مثال :
    (۵-۵-۵ یا ۵-۶-۵ در رنگهای Hicolor از ۱۵ یا ۱۶ بیت صرفه جویی میشود.)
  با استفاده از lookup table یک مقدار بی نهایت از رنگها رو انتخاب میکند (برای مثال ۲۵۶) روی یک جدول ذخیره میکند  
و ارزش هر پیکسل برابر با مکان اشاره گر بروی جدول RGB است.لیست رنگ های موجود پالت نامیده میشود.از لحاظ تاریخی CGA دارای پالتی با ۴ رنگ و EGA  دارای ۱۶ رنگ بود. در واقع انقلابی با کارت VGA که دارای پالتی با ۲۵۶ رنگ بود،ایجاد شد. 


 (۲۴ بیت در هر پیکسل و ۸بیت برای هر کانال) = * truecolor

انتخاب پالت :
در تعیین میزان رنگ،پالت نقش اساسی دارد.شما می توانید ازیک پالت استاندارد که شامل زیر مجموعه ای از رنگ های ممکن است،استفاده کنید.این انتخاب از طریق مکعب RGB که دارای تعداد استانداردی از تونالیته های رنگی برای هر کانال است انجام میشود.این عمل از طریق فرمول زیر انجام میشود.
Elem : تعداد رنگهایی که میخواهیم در پالت باشد.

بهینه سازی پالت های رنگ :
 -میتوان از طریق انتخاب پالتی که فضای رنگی عکس را بهتر نمایش دهد،بدون از دست دادن کیفیت،عکس را فشرده سازی کرد. یک راه برای بهینه سازی پالت رنگی،روشی است که Paul Heckbert در سال ۱۹۸۰ پیشنهاد کرد که به Median Cut Algorithm مشهور است.
-همچنین میتوان از طریق روش تشابه رنگی عکس را فشرده سازی کرد به این ترتیب که نقاط رنگی مشابه را یکی میکند.
-معمولا برنامه های گرافیکی برای سنجش در فضای RGB از فاصله اقلیدسی استفاده میکنند. 
مثال :

استاندارد تلویزیونی :
عکسهایی که ازطریق دوربین های دیجیتالی گرفته میشوند معمولا دارای استاندارد های ویدیویی هستند. 
NTSC،(مخفف کمیته سامانه تلویزیون ملی)، سامانه تلویزیون آنالوگ است که در ایالات متحده، کانادا، ژاپن، مکزیک، فیلیپین، کره جنوبی، تایوان و تعدادی دیگر از کشورها از آن استفاده می‌شود. (رجوع شود به نقشه)
ان‌تی‌اس‌سی بیشترین استفاده را در امریکای شمالی و ژاپن دارد. این استاندارد از نسبت درازا به پهنای ۴:۳ برای اندازه صفحه تصویر استفاده می‌کند و هر فریم تصویر تشکیل شده‌است از ۵۲۵ خط و تعداد فریم‌ها در ثانیه ۳۰ فریم است.
سکام، (به فرانسوی Séquentiel couleur à mémoire به معنای رنگ متوالی همراه با حافظه) سامانه تلویزیون رنگی آنالوگ است که اولین بار در فرانسه ابداع شد. این سامانه را تیمی به سرپرستی هنری دو فرانس که در شرکت تلویزیونی فرانسه که بعدها توسط تامسون خریداری شد، ابداع کردند. این سامانه از جهت تاریخی اولین سامانه رنگی استاندارد اروپایی به شمار می‌رود.
پال مخفف «خط فاز متناوب» (به انگلیسیPhase Alternating Line)، سیستم فرستنده رنگی است که در سامانه فرستنده تلویزیونی در بیشتر نقاط جهان از آن استفاده می‌شود. سامانه‌های رایج دیگر تلویزیون آنالوگ سکام یا ان تی اس سی می‌باشند.

Interlaced video :
 سیستمهای پخش قدیمی NTSC دارای 525 خط افقی تصویر میباشند. در سیستم PAL تصاویر با کیفیت اندکی بهتر و با 625 خط افقی پخش میگردد. اما تمام این خطوط برای نمایش تصویر بکار نمیروند. خطوطی که اطلاعات تصویری را نمایش میدهند خطوط فعال نام دارند و تعدادشان 486 برای سیستم NTSC و 576 برای PAL میباشد. بعلاوه ، در سیستمهای PAL و NTSC از پویش شانه ای (interlaced) استفاده میشود یعنی هر قاب به دو بخش تقسیم شده و یک بخش شامل خطوط فرد ، و بخش دیگر شامل خطوط زوج میباشد. هر بخش بصورت یک در میان نمایش داده میشود و مغز ما با ترکیب آنها تصویر کامل هر قاب را میسازد. پویش شانه ای کیفیت تصویر را پایین می آورد.
به مثال زیر دقت کنید :
interlacing
interlacing

اسکن پیشرونده :
اسکن پیشرونده (Progressive scanning) یک راه برای نمایش، ذخیره‌سازی، و یا انتقال تصاویر متحرک است که در آن تمام خطوط هر فریم به ترتیب کشیده شده‌اند.

اسکن پیشرونده
اسکن پیشرونده
-سیستمی برای دستیابی به رزولوشن کامل،فقط با یک بار اسکن.
-رزولوشن عمودی تصویر را بالا میبرد.  
-مصنوعات ایجاد شده توسط پویش شانه ای را از بین میبرد. 
-در دوربین های عکاسی به کار میرود. 
-این تکنولوژی در ۱۰ سال اخیر به وجود آمده است. 

دوربین فیلمبردای :
به روند انتقال تصاویر متحرک به فیلم وهمسان سازی رنگ های ان به یک مجموعه رنگ واحد Telecine میگویند.این اصطلاح  برای اشاره به تجهیزات مورد استفاده در فرایند تولید نیزمورد استفاده قرار گیرد است.
Telecine
Telecine 
فرمت های دوربین های فیلمبردای :
► DVD -> 720x576, 704x576 PAL – 720x480, 704x480 NTSC
► HDTV (720p) 1280x728
► FULL HD (1080p) 1920x1080
► (720i, 1080i)   .بعد از رزولوشن عمودی نشان میدهد که منبع  ویدییو پویش شانه ای بوده است,I

Video Camera Formats
Video Camera Formats
Image Formats :
Color data mode  -bits per pixel
Color data mode  -bits per pixel

Best file types for these general purposes

Best file types for these general purposes


مثال ها : 
Help->Browser...
● GEM \ pix_resize
● GEM \ pix_reducecolor
● GEM \ pix_dot
● GEM \ pix_histo
● GEM \ pix_motionblur


منابع :
►Wikipedia
► http://imagelab.ing.unimore.it/imagelab/
►Rita Cucchiara, Dispense del corso di Visione Artificiale, a.a. 2004-05, Università degli studi di Modena e Reggio Emilia,       marzo 2005.  
►Rita Cucchiara, Dispense del corso di Sistemi di Elaborazione, a.a. 2004-05, Università degli studi di Modena e Reggio Emilia, marzo 2005.