سییتم های تعاملی - رسانه های تعاملی - پیور دیتا
Accademia di belle arti di bera Corso sistemi interattivi - Prof. Rudy Melli
۱۳ اسفند ۱۳۹۱
۲۰ آذر ۱۳۹۱
انجام یک پروژه Installation
Installation art :
مقدمه : هنر چیدمان یا هنر اینستالیشن (به انگلیسی: Installation art) استفاده کردن از عناصر مختلف است برای بیان تجربه هنرمند از «فضا»یی مشخص آنچه این هنرمندان در آن شریکند، نه موضوع خام، مواد خام، یا روشهای خاکار، بلکه، علاقه آنها و تعهدشان به دیدگاهی گسترده تر از آفرینش هنری واز این راه کشف خود است.
از خصوصیات هنر اینستالیشن، فعال سازی یک محیط یا یک مفهوم با برخوردهای ظاهرا هنری است که باعث میشد اثر معنا و مفهوم و ارزش هنری پیدا کند.
موادی که در چیدمان استفاده میشوند شامل طیف وسیعی هستند: از مواد و اشیاء زندگی روزمره و طبیعت گرفته تا رسانههای جدید نظیر ویدئو، صدا، پرفورمانس(هنر اجرا)، کامپیوتر و حتی اینترنت. هنر چیدمان لزوماً در نگارخانههای هنری اجرا نمیشود، بلکه ممکن است در هر فضای عمومی یا شخصی اجرا شود. بعضی از چیدمانها فقط برای فضای خاصی طراحی شدهاند.
سبکهای استفاده شده در هنر چیدمان بسیار متنوع هستند؛ از انتزاعی (آبستره) گرفته تا روایی، از سیاسی تا صرفا نظری، اثری موقتی یا ماندگار.
از کجا شروع کنیم ؟
در روش اول به یک ابزار برنامه نویسی ویژوال برای کامپیوتر و یک ایده برای انجام یک پروژه تعاملی احتیاج داریم :
برای تبدیل یک ایده به یک پروژه راه های تکنیکی ان,غیر قابل پیشبینی است.اولین چیزی که برای آغاز کار لازم است،تقسیم بندی کردن بخش تئوریک پروژه به مراحل گام به گام و مشخص کردن اینکه چه بخشی از پروژه قبل وچه بخشی بعد اتفاق بیفتد.بنابر آنچه گفته شد در واقع ما برای شروع باید نکات زیر را بررسی کنیم:
۱-پروژه چه تعاملی قرار است با بیننده (یا بلعکس) داشته باشد،یا به عبارتی دیگر بیننده چگونه در کار هنری دخالت خواهد داشت.
۲-محلی که پروژه قرار است در آنجا اجرا شود.
۳-حرکات در نقاط حساس.
۴-صدا ها .(سر و صدا های محیط هم شامل میشوند)
۱-چه تعاملی با بیننده خواهیم داشت ؟
لازم است به طور دقیق نوع تعامل کار با بیننده مشخص شود.برای مثال :
اگر قرار است بازدیدکننده وارد اتاق شود و با هر تکانی که میخورد ویدیویی پخش شود،باید سوالات زیر به صورت دقیق پاسخ
دهیم:
-بازدید کننده چگونه باید خود را تکان دهد ؟
-آیا باید از جایی بجایی دیگر رود ؟
-در چه محدوده ای دقیقا باید تکان بخورد؟
-چه سخت افزاری احتیاج داریم ؟(دوربین ،میکروفون ،سنسور،....)
-چه اطلاعاتی باید بگیریم (مختصات حرکت بازدیدکننده ؟فاصله ؟مقداری برای اندازه گیری صدا ؟مقداری برای اندازه گیری حساست سنسور ؟،.... )
-کجا باید سنسور(audio/video) را برای دریافت اطلاعات از بازدیدکننده ، قرار دهیم ؟
آنچه در بالا گفته شد قدم های اولیه برای انجام یک پروژه Installation است.
اولین قدم :
برای انجام پروژه های کوچک میتوان از وب کم هم استفاده کرد اما برای Installation های حرفه ای باید از دوربین های حرفه ای بهره برد.همچین میتوان از یک دوربین dv با خروجی firewire استفاده کرد.همینطور برای میکروفون.
دومین قدم :
پردازش تعامل پروژه
-تعین داده های عددی لازم برای طراحی پروژه ی تعاملی
-انتخاب بهترین تکنیک برای پردازش و پیشبرد پروژه
-تشخیص حضور فیزیکی ---> background suppression
-تشخیص حرکت ---> single/double difference
-تشخیص رنگ ---> color tracking
برای به دست آوردن اطلاعات لازم باید ماسک ایجاد کنیم و ان را پردازش کنیم (محاسبه مساحت، مرکز ثقل موقعیت، فاصله، سرعت(= فضا / زمان) ....)
در صورت وجود میکروفن بایدسیگنال دریافتی را جهت به دست آوردن مقادیر عددی لازم پردازش کنیم(صدا،...)
نتایج حاصل از این مرحله نشان دهنده مقدار تعامل خواهد بود که ازان باید برای مرحله بعدی استفاده می شود.
سومین قدم :
قرار دادن سخت افزار پخش کننده ویدئو
دوربین یا پروژکتور نمیتوانند در هرحالتی یا هرجایی قرار بگیرند،برای هر دیتایی که قرار است استخراج شود،قرار دادن تمام اجزا در جای مناسب ضروری است.برای داشتن یک خرجی مناسب مکان قرارگیری دوربین امری به شدت مهم است .
مختصات x,y دریک اتاق :
در پروژه اینتراکتیوی که قرار است تعامل به حرکات بازدید کننده وابسته باشد مختصات مکان بازدیدکننده از اصلی ترین داده ها میباشد.
Detection vs Display :
دوربین را کجا قرار دهیم ؟---> بستگی داره چه دایتایی قراره از مختصات بازدیدکننده در اتاق،بگیریم.
مختصات X,Y :
بهتر که دوربین را بالا و مرکزسقف اتاق قراردهیم،به صورتی که دوربین در حالتی عمودی مخاطب رو هدف قرار بدهد.در ضمن برای این کار باید سقف به اندازه کافی بلند باشد.برای مثال در عکس زیر نقاط سیاه تیره مکان های پیش بینی شده برای مخاطب است.و خط های خاکستری مسیر حرکت مخاطب را نشان میدهد.
فاصله از دوربین باید مناسب باشد روی سقف های خیلی کوتاه نمیتوان کار کرد.راه دیگربرای تشخیص مختصات X,Y این است
که دوربینی در وسط سقف،بالای صفحه نمایش قرار بدهیم.
در این مورد شما احتیاج دارد که مختصات پای بازدیدکننده را ردیابی کنید نه مرکز ثقل را،چون در این مورد به ارتفاع بازدیدکننده
بستگی ندارد.
موقعیت فقط عمودی یا افقی :
محل فیلمبرداری به سادگی موازی با حرکت بازدیدکننده خواهد بود.به عکس زیردقت فرمایید :
تعامل با صفحه نمایش :
برای مثال مختصات X,Y دست,این تعامل پیچیده تر است و می تواند در 2 روش متفاوت انجام می شود:
Rear Projection : با قرار دادن یک دوربین و یک نورافکن با مادون قرمز پشت و بالای پرده نمایش،دستها نورانی و قابل دیدن برای دوربین میشوند.این روش همچین امکان تشخیص نمای کلی از بازدیدکننده را به دوربین میدهد.نکته قابل توجه در این روش این است که صفحه نمایش باید به اندازه ترانسپرنت باشد که اشعه از ان به راحتی عبور کند.
Rear Projection |
بالای صفحه نمایش چراغ های مادون قرمز قرار میدهم.
تقسیم بندی و استخراج silhouette
تقسیم بندی :
تقسیم بندی تصآویر یکی از قدم های بسیار مهم در جهت پردازش تصاویر و پروسه ضروری برای تجزیه و تحلیل آنها میباشد.
بخش بندی یا تقسیم بندی تصویر به چه معنی میباشد ؟
تقسیم بندی کردن ، پارتیشن بندی کردن معنی میدهد به عبارتی بخش بندی کردن تکنیکی است که اجازه می دهد تا تصویر را به دو منطقه تقسیم کرد که حضور یا عدم حضور یک ویژگی خاص را شناسایی میکنند.
به عنوان مثال : تقسیم بندی انجام شده روی تصاویر شناسایی شده اشیاء در حال حرکت در ۲ بخش تعیین میشوند :
در حال حرکت و غیرحرکتی (ساکن)
هدف از تقسیم بندی ، به دست آوردن یک تصویر باینری است ، که با یک رنگ (سفید) مجموعه نقاط تصویر در حال حرکت شناسایی میشود ، و با رنگ دیگر (سیاه) مجموعه نقاط از تصویر که در حال حرکت نمیباشند (ساکن) میباشد.
در اینجا از مجموعه نقاط صحبت میشود و نه object ها (اشیاء)، برای اینکه بخش بندی در سطح پیکسل انجام میشود ،
و پس از شناسایی مناطقی از تصویر در حال حرکت و گروه بندی می شوند، توانایی این را خواهد داشت که در سطح object کار کند و blob نامیده میشود.
نتیجه حاصل از یک تقسیم بندی یک تصویر باینری خواهد بود که آنرا ماسک نیز مینامیم .
انواع مختلفی از تقسیم بندی وجود دارد .
تقسیم بندی یک تصویر "عادی"، از پیش پردازش نشده، بر اساس تغییرات درخشندگی ان است .
برای به دست آوردن اطلاعات مربوط به حرکت ، پردازش بیش از یک تصویر لازم است.
آستانه تصویر :
انتخاب یک مقدار از شدت نور T (آستانه) ، که اجازه جدا کردن تصویر به دو منطقه،بالاترین و پایین ترین با توجه شدت نور میدهد .
تبدیل تصویر در سطح خاکستری به یک تصویر باینری
Background suppression
Single difference
Double difference
Background suppression یا مهار پس زمینه :
تشخیص حضور اشیاء را در صحنه با انجام مقایسه پیکسل به پیکسل بین فریم های جاری و یک فریم که آنرا پس زمینه مینامیم یا تصویر مرجع یا تصویر background که شامل یک تصویر از پس زمینه "تمیز" (یعنی بدون اشیاء)
این روش فقط زمانی کاربرد دارد که دوربین کاملا ثابت و بدون حرکت باشد.
تفاوت با تصویر پس زمینه یک تصویر متفاوت تولید خواهد کرد.
تفاوت در سطح پیکسل انجام میشود ، اگر I تصویر فعلی، B تصویر پس زمینه و تصویرD مقدار تفاوت باشد بنابراین داریم :
-- تفاوت در ارزش مطلق است .
-- ایجاد یک تغییر در RGB ضروری نیست
D(x,y) = | I(x,y) – B(x,y) |
تفاوت های برجسته تصویر در نمایش داده نمیشوند در تصویر پس زمینه .
تفاوت بین ۲ تصویر :
یک مثال ریاضی از تفاوت بین تصاویر در مقیاس خاکستری :
به اعدادسه گانه ۳۹ دقت کنید ، با اعمال عملیات آستانه با مقدار 20 ماسک زیر بدست میاید
تقسیم بندی کردن ، پارتیشن بندی کردن معنی میدهد به عبارتی بخش بندی کردن تکنیکی است که اجازه می دهد تا تصویر را به دو منطقه تقسیم کرد که حضور یا عدم حضور یک ویژگی خاص را شناسایی میکنند.
به عنوان مثال : تقسیم بندی انجام شده روی تصاویر شناسایی شده اشیاء در حال حرکت در ۲ بخش تعیین میشوند :
در حال حرکت و غیرحرکتی (ساکن)
هدف از تقسیم بندی ، به دست آوردن یک تصویر باینری است ، که با یک رنگ (سفید) مجموعه نقاط تصویر در حال حرکت شناسایی میشود ، و با رنگ دیگر (سیاه) مجموعه نقاط از تصویر که در حال حرکت نمیباشند (ساکن) میباشد.
در اینجا از مجموعه نقاط صحبت میشود و نه object ها (اشیاء)، برای اینکه بخش بندی در سطح پیکسل انجام میشود ،
و پس از شناسایی مناطقی از تصویر در حال حرکت و گروه بندی می شوند، توانایی این را خواهد داشت که در سطح object کار کند و blob نامیده میشود.
نتیجه حاصل از یک تقسیم بندی یک تصویر باینری خواهد بود که آنرا ماسک نیز مینامیم .
انواع مختلفی از تقسیم بندی وجود دارد .
تقسیم بندی یک تصویر "عادی"، از پیش پردازش نشده، بر اساس تغییرات درخشندگی ان است .
برای به دست آوردن اطلاعات مربوط به حرکت ، پردازش بیش از یک تصویر لازم است.
آستانه تصویر :
انتخاب یک مقدار از شدت نور T (آستانه) ، که اجازه جدا کردن تصویر به دو منطقه،بالاترین و پایین ترین با توجه شدت نور میدهد .
تبدیل تصویر در سطح خاکستری به یک تصویر باینری
برای هر نقطه از از تصویر مبدا؛
f(i,j)
نقطه مشخص شده
g(i, j)
در تصویر ، تبدیل میشود .
اگر f(i,j)>=T) g(i,j)=1;
درغیر این صورت g(i,j)=0;
آستانه استاتیک : آستانه ثابت در ابتدا انتخاب میشود.
آستانه پویا : آستانه یی که در طول اجرای یک patch متناسب با یک مقدار دیگر تغییر میکند.
(بطور مثال : مقدار متوسط روشنایی صحنه تغییر میکند)
آستانه :
جعبه ای که کار تقسیم بندی آستانه را انجام میدهد pix_duotone نامیده میشود.
دومین inlet آستانه RGB ست ، و سومین inlet ، رنگیست
که پیکسل ست میشه، اگر پایین تر از آستانه باشد .
چهارمین ، رنگ RGB ست اگر بالاتر یا برابر آستانه باشد .
در مثال نشان داده شده ، یک پیکسل به عنوان سفید دسته بندی می شود ،اگر مقدار بزرگتر یا برابر با آستانه داشته باشد، در غیراینصورت مشکی دسته بندی میشود.
بنابرین آستانه همانند یک نقطه برش عمل میکند .
چه آستانه ای استفاده شود؟
انتخاب آستانه بستگی دارد به object های مورد علاقه :
در مورد آستانه استاتیک ، آستانه باید پس از تجزیه و تحلیل دقیق از صحنه انتخاب شود.
در مورد آستانه پویا (که در طول اجرا تغییر میکند) میتوان از روشنایی تصویر برای تغییر آستانه استفاده کرد.
تشخیص اشیاء و حرکت :
اساسا سه روش برای تشخیص اشیاء و / یا حرکت در یک صحنه وجود دارد:
Single difference
Double difference
Background suppression یا مهار پس زمینه :
تشخیص حضور اشیاء را در صحنه با انجام مقایسه پیکسل به پیکسل بین فریم های جاری و یک فریم که آنرا پس زمینه مینامیم یا تصویر مرجع یا تصویر background که شامل یک تصویر از پس زمینه "تمیز" (یعنی بدون اشیاء)
این روش فقط زمانی کاربرد دارد که دوربین کاملا ثابت و بدون حرکت باشد.
تفاوت با تصویر پس زمینه یک تصویر متفاوت تولید خواهد کرد.
تفاوت در سطح پیکسل انجام میشود ، اگر I تصویر فعلی، B تصویر پس زمینه و تصویرD مقدار تفاوت باشد بنابراین داریم :
D(x,y) = | max(I(x,y).R-B(x,y).R, I(x,y).G-B(x,y).G, I(x,y).B-B(x,y).B) |
که در آن (x,y) نقطه ای در مختصات x و y مربوط به تصویر میباشد ، و R .G .B. مؤلفه رنگ قرمز، سبز و یا آبی است. -- تفاوت در ارزش مطلق است .
-- ایجاد یک تغییر در RGB ضروری نیست
D(x,y) = | I(x,y) – B(x,y) |
تفاوت های برجسته تصویر در نمایش داده نمیشوند در تصویر پس زمینه .
تصویر اول : ویدئو ارجینال تصویر دوم : پس زمینه ذخیره شده |
تصویر تفاوت با پس زمینه |
تفاوت بین ۲ تصویر :
یک مثال ریاضی از تفاوت بین تصاویر در مقیاس خاکستری :
تصویر A |
تصویر B |
تصویر تفاوت D = |A-B| |
PureData - Audio
: Audio
[osc~]ماژول که سیگنال های صدا را پردازش میکنند به “~” ختم میشوند. مثال
سیگنال های صوتی floating point 32 bit هستند ، با محدوده 1- , 1
اغلب سخت افزار محدود به ۱۶ یا ۲۴ بیت است .
I/O Audio: objects adc~ e dac~
همیشه در قسمت پایین یک patch قرار دارند
Audio on/off : در شروع همیشه به صورت پیش فرض خاموش (off) میباشد.
شروع و پایان پردازش
از رابط کاربری ، منوی (MEDIA->audio ON/OFF) و یا از یک patch با پیغام pd dsp 1 و pd dsp 0
پیش فرض 44100Hz، قابلیت ویرایش توسط GUI
ذخیره در ۱۶/۲۴/۳۲ بیت wav, aiff, au
با سیگنال های صوتی نمی توان cycles / loop انجام داد .
شما فقط میتوانید آنرا با اتصالات غیر local انجام دهید (تاخیر به اندازه یک audio buffer size)
اجازه روشن و خاموش کردن صدا را میدهد switch~
اندازه بلوک های پردازش را کنترل میکند block~
برای sottopatch های واحد .
بر روی تمامی پنجره کار میکند
Audio 2 :
انتخاب کانال صوتی I / O
-- Flag -inchannels, -outchannels
-- default 2
writesf~, readsf~, soundfiler~, tabwrite~, tabread4~ : objects نوشتن / خواندن
Objects MIDI
-- اگر لازم باشد، فعال کردن دستگاه هایMIDI IO در رسانه ها → MIDI Settings...
Notein, noteout, ctlin, ctlout, pgmin, pgnout, bendin, bendout, touchin, touchout,sysexin, sysexout, . . .
-- مباحث: canal number, ctl number
-- ببینید : PureData/ → 5.reference/ → midi-help
چپ ترین inlet در یک object audio میتواند هرگونه سیگنالی از نوع audio و message بقیه inlet ها ، audio , message را دریافت کند ،
صدا و پیام ها (Audio and messages) :
پردازش صوت و پیام لایه ای
سیگنال های کنترل پردازش در آغاز هر چرخه DSP
-- 64/44.1kHz → 1.45 ms
سیگنال های کنترل پردازش در آغاز هر چرخه DSP
-- 64/44.1kHz → 1.45 ms
پیغام های هرگز عبور نکرده در طول یک tick از dsp (جبرگرایی)
تبدیل سیگنال های صوتی و کنترل:
Objects sig~ , snapshot~
مشکلات :
نمیتوان sample-rat را کنترل کرد
نمیتوان sample-rat را کنترل کرد
رویداد های در سطح audio (به عنوان مثال zero-crossing) به عنوان trigger استفاده نمیشوند.
در Browser examle ببینید :
در Browser examle ببینید :
•Pure Data/ → 2.audio.examples/ → A04.line2, A05.output.subpatch, B07.sampler, G01.delay
•Manuals/ → 1.Sound/ → 01.controlling_dsp_processing, 01.hello_world, 02.audio_data, 02.make_some_noise, 03.dsp_processing
File audio :
object هایی وجود دارند که میتوانند فایل های صوتی را باز کنند . (هرکدام از آنها با ویژگی مختلفی )
[soundfiler] یک فایل wav را باز میکند و محتویات آنرا در یک array کپی میکند.
-- اندازه یک آرایه را حد اکثر محتوای کپی شده تعیین خواهد کرد .
-- object های [tabplay~] و [tabread~] برای باز خوانی محتویات آرایه لازم میباشد.
[~readsf] فایل های wav و aiff را باز میکند
-- پیغام [open] و متقائب آن نام فیل لازم میباشد .
-- پیغام [start]برای آغاز بازخوانی لازم میباشد .
[~mp3play] کتابخانه خارجی iemlib فایل mp3 را باز میکند .
-- پیغام [open] و متقائب آن نام فیل لازم میباشد .
-- پیغام [start]برای آغاز بازخوانی لازم میباشد .
Detection volume :
[~env] تشخیص دامنه در دسی بل از سیگنال های ورودی صوتی
[~fiddle]تشخیص دامنه در DB، اوج، و دیگر سیگنال ورودی های صوتی
منابع :
Federico Avanzini, “Corso di Sistemi di elaborazione per la musica”, DIE,
Università di Padova
۷ آذر ۱۳۹۱
تئوری تصاویر :
چشم انسان :
چشم ما رنگ با طول موج نوری که محرک روی شبکیه چشم ایجاد میکند،را از رنگ قرمز (بالاترین طول موج) تا نارنجی، زرد، سبز، آبی، بنفش میتواند ببیند.
طیف مرئی از ۳۸۰ تا ۷۸۰ نانومتر می باشد.
چشم ما دارای ۱۲۰ میلیون یاخته استوانه ای حساس به نور میباشد.و همچنین دارای حدود ۸ میلیون یاختههای مخروطی حساس به طول موج های مختلف میباشد.
**یاختههای استوانهای نوعی از یاختههای گیرندهٔ نور هستند که در انتهای چشم و در شبکیه قرار دارند. این یاختهها همراه با یاختههای مخروطی جریانالکترومغناطیسی نور خورشید را به پیام عصبی تبدیل کرده و از طریق عصب بینایی به لوب پسسری مغز منتقل میکنند.
یاختههای استوانهای بیشتر در نور ضعیف تحریک میشوند و به مغز توانایی دیدن در تاریکی را میدهند و آسیب به آن موجب بیماری شب کوری می شود.این یاختهها به رنگها حساسیت نشان نمیدهند؛ به همین دلیل بینایی در تاریکی به رنگ سیاه، سفید و طیفی از خاکستری است. یاختههای استوانهای همچنین در تشخیص حرکات توسط مغز نقش دارند.
بیشترین تمرکز یاختههای استوانهای در بخشهای پیرامونی شبکیه، و کمترین تمرکز آنها در لکهٔ زرد است.**
دید انسان |
درک رنگ از طریق ترکیب ۳ رنگ اصلی امکان پذیر میباشد.روی شبکیه چشم سیگنال های رنگی به ۳ فیلتر ابی،قرمز،سبز تبدیل میشوند.
تعیین کمیت رنگ :چشم ما برخلاف گوش،قابلیت تجزیه و تحلیل کردن طیفی ندارد،اما از طریق ترکیب طول موج های مریی درک رنگ را برای
ما امکان پذیر میکند.
ما میتوانیم ۳ نوع رنگ تعریف کنیم :
رنگ های طیفی : تولید شده توسط تابش حاوی یک باند باریک طول موج.
رنگ ارغوانی(magenta) : تابشی حاوی ترکیبی بی نهایتی از طیف رنگی با طول موج مریی یعنی ابی،بنفش،قرمز-زرد.
رنگ سفید : تابش در طیف مداوم.
رنگ سفید : تابش در طیف مداوم.
بر طبق نظریه توماس یانگ، فیزیکدان انگلیسی، که در سال 1802 ارائه شد، با استفاده از سه رنگ قرمز، سبز و آبی میتوان تمام رنگهای طیف رنگی را تولید کرد.
اولین شواهد تجربی به دست آمده از آزمایش بر روی چشم در سال ۱۹۶۴ رخ داده است.
یک رنگ را میتوان با ۳ روش اساسی باز تولید کرد:
-additive synthesis : سنتز افزودنی، مخلوطی از چراغ های مختلف کروماتیکی (فامداری*)
additive synthesis |
-subtractive synthesis : سنتز کاهشی،انطباق یا همپوشانی بخشی که طیفهای مختلف را جذب میکند.
یکپارچه سازی فضایی :
نقاط رنگی مختلف و نزدیک بهم به چشم انسان به صورت نقاط رنگی همپوشان به نظر میرسد و تولید یک نتیجه مشابه به سنتزافزودنی میکند.
نقاط رنگی مختلف و نزدیک بهم به چشم انسان به صورت نقاط رنگی همپوشان به نظر میرسد و تولید یک نتیجه مشابه به سنتزافزودنی میکند.
Integrazione spaziale |
additive synthesis (سنتز افزودنی) :
سنتز افزودنی رنگ همان روشی است که چشم انسان و بسیاری از وسایلی که از چشم انسان تقلید میکنند (مثل دوربین های دیجیتال،دوربین های فیلمبرداری،مانیتورها) که باترکیب نقاط رنگی کنار هم تصویر را تشکیل میدهند،استفاده میکنند.
additive synthesis |
به لحاظ تاریخی اولین دستگاه سنتز افزودنی همان دیسک نیوتون بود که روی ان بخش های دایره ای زیادی از رنگ های مختلف طراحی شده بود.با چرخاندن سریع این دیسک رنگ ها ترکیب میشدند و یک رنگ واحد بنظر میامد و اگر رنگ ها به صورت به اندازه مناسب دوز بندی میشدند،ان رنگ سفید به نظر میامد.
۳ رنگ اصلی سنتز افزودنی که چشم انسان به ان حساس است قرمز،سبز و ابی است (در انگلیسی به ان RGB می گویند.)
۳ رنگ اصلی سنتز افزودنی که چشم انسان به ان حساس است قرمز،سبز و ابی است (در انگلیسی به ان RGB می گویند.)
subtractive synthesis (سنتز کاهشی) :
۳ رنگ اصلی سنتز کاهشی(در انگلیسی به ان YMC می گویند.)،درواقع مکمل ۳ رنگ اصلی سنتز افزایشی اند :
- زرد مکمل ابی
- سرخابی مکمل سبز
- ابی فیروزه ای مکمل قرمز
ساده ترین مثال از سنتز کاهشی قراردادن فیلترهای رنگی روی هم است.هر فیلتر مانع عبور یک نور میشود ودر نهایت بخش کمی از نور میتواند از فیلترها عبور کند به همین دلیل به این روش سنتز کاهشی گفته میشود.
ساده ترین مثال از سنتز کاهشی قراردادن فیلترهای رنگی روی هم است.هر فیلتر مانع عبور یک نور میشود ودر نهایت بخش کمی از نور میتواند از فیلترها عبور کند به همین دلیل به این روش سنتز کاهشی گفته میشود.
طراحان و نقاشان هم با ترکیب کردن لایه هایی از رنگ های مختلف روی کاغذ یا روی بوم نقاشی یک سری فیلتررنگی ایجاد میکنند .مثال دیگر از سنفز کاهشی لنز دوربین های رنگی عکاسی و سینمایی است.
سیستم طراحی شده روی صفحه تلویزیون بر اساس اشعه کاتدی (CRT) است،که با ترکیب رنگ از طریق یکپارچه سازی فضایی نقاط رنگی RGB تصویر را روی صفحه تلویزیون نمایش میدهد.
بنابراین فضای رنگی که استفاده میکنیم بر اساس نورهای کروماتیکی ساطع شده از چراغ هایی با سه نوع رنگ فوسفری ساخته شده اند .
دریک فضای رنگی RGB مکعب شکل که دران فقط نور محسور درمکعب قابل دیدن باشد رئوس مکعب نشان دهندمختصات رنگ های کورماتیکی است.
MONITOR CRT |
در تصویر بالا تقاطع این فضا با صفحه R+G+B=1 مثلثی را ایجاد میکند که قابل نمایش در فضای CIEXYZ میباشد و gamut monitor نامیده میشود.
تصحیح گاما،برای جبران غیر خطی بودن اشعه های کاتدی (CRT) در تبدیل یک سیگنال ویدیویی به نور به دلیل خطی نبودن رابطه الکترون جاری با شتاب،طراحی شده است.
تصحیح گاما در نظر گرفته شده برای انحراف های این چنینی که اشعه های کاتدی(CRT) ایجاد میکنند وباعث ایجاد بیشترین نور
یکنواخت از نقطه نظر ادراکی میشود.
یکنواخت از نقطه نظر ادراکی میشود.
فرق بین یک مقیاس با یک ورودی خطی (به عنوان مثال مقیاس ارزش درخشندگی با کد گذاری خطی) و یک مقیاس با یک خروجی خطی (یک شدت خطی افزایشی) :
تصحیح گاما |
یک مقیاس کد گذاری شده خطی که یک شدت غیر خطی دارد فاراینده نور را منظم تر نشان میدهد.
پرتو ساطع شده از مانیتور CRT بامقدار سیگنال پرتو الکترونی یک رابطه خطی ندارد بلکه رابطه تشریحی دارد :
پرتو ساطع شده از مانیتور CRT بامقدار سیگنال پرتو الکترونی یک رابطه خطی ندارد بلکه رابطه تشریحی دارد :
از آنجایی که مدار لازم برای ایجاد رابطه خطی بسیار گران بود سیگنال قبل از منتقل شدن،از طریق همان به اصطلاح gamma correction تصحیح میشد.
فضاهای رنگی RGB در دستگاه های محاسباتی :
نمایش رنگ در دستگاه های الکترونیکی به طور معمول متناسب با عملکرد کارتهای گرافیکی مانیتورهای CRT در نظر گرفته شده است.
کارت گرافیکی هم درنمایش تصاویرنقش به سزایی دارد .
عکس و فیلم دیجیتال :
عکسدیجیتال درواقع یک تابع ۲ بعدی است که به وسیله سنسور های بصری روی یک صفحه خارجی قابل مشاهده است.عکس های دیجیتال یک ماتریکس محدود بین مقادیر (N,M) میباشد،که پیکسل(عناصر تشکیل دهنده عکس) نامیده میشوند.
ویدئو دیجیتال در واقع از یکسری عکس (فریم) که به صورت متوالی و پشت سر هم قرار میگیرند وهر عکس تا عکس بعدی فاصله ∆ t را طی میکند ،تشکیل میشود.
مقیاس اندازه گیری : FPS (فریم در ثانیه)
-وضوح فضایی *(N,M),به تعداد پیکسل در صفحه نمایش عکس و کارت گرافیکی سیستم بستگی دارد.برای مثال به پارامتر های زیر دقت کنید :
Resolution |
(سطر،ستون)= (N,M)*
-وضوح زمانی در ویدیو به تناوب زمانی مناسب تصاویر دارد که همان (frame rate) نامیده میشود.
-وضوح سطوح خاکستری،یعنی قدرت تشخیص سطوح خاکستری : .k n
برای مثال : به عنوان مثال 256 با K = 8
وضوح فضایی بیشتر با جزییات خیلی کوچک تصویر در ارتباط است.(dpi) و درواقع به پارامتر های زیر بستگی دارد :
- دوربین
- دوری و نزدیکی سوژه
- صفحه نمایش
عکس ها :
تصاویر عمدتا
رنگی (24bit*pixel / 3channel / 8 bit *channel: RGB)
در مقیاس خاکستری (1channel / 8 bit*channel)
باینری (1bit*channel, whiate& black)
**توجه داشته باشد یک عکس 24bit*pixel میتواند عکس های سیاه و سفید و خاکستری را هم نمایش دهد،فقط کافی است که مقادیر RGB را یکسان قرار دهیم تا بتواند تمام لایه های خاکستری را نمایش دهد.یک پیکسل خاکستری دارای مقادیر (RGB = (128, 128, 128 میباشد.**
عکس در bit :
یک عکس تشکیل شده از :
یک تصویر به سیاه و سفید دارای یک کانال (کانالروشنایی) /یک تصویر RGB دارای سه کانال (قرمز، سبز و آبی)
● تعدادی کانال در هر بیت :
bpc یعنی چند بیت اطلاعات مربوط به یک کانال را نمایش میدهد.(۱،۸،۱۶،۳۲)
● تعداد بیت در کل پیکسل ها که برابر است با تعداد بیت در کانال ضربدر تعداد کانال :
bpp = bpc * nc
-عکس رنگی یک ویژگی دیگری هم دارد و ان این است که به صورت معمول کانال ها به این شکل ......RGB RGB RGB دخیره میشوند اما میتواند آنها رو به صورت جداگانه ......RRRR.... GGGG.....BBBB نیز ذخیره کند.
مصرف حافظه :
اشغال حافظه یک عکس RGB که دارای ۳ کانال و اندازه n x m میباشد،به صورت زیراست :
n * m * 3 bytes
n * m * 3 bytes
برای مثال یک عکس rgb 640x480 به اندازه 640*480*3 = 921600 byte حافظه دستگاه را اشغال میکند.
تصاویر،حاصل دیجیتالی کردن سیگنال هایی است که ازسنسوردستگاه های مختلف مثل : دوربین فیلمبرداری،عکسبرداری و یا اسکنر،بدست میایند.
Input/output process of images |
تراشه های سیلیکونی در ابتدا به عنوان حافظه های دائمی و بعد ها به عنوان photoreceptors استفاده میشد .این تراشه ها به ۲ دسته تقسیم میشوند :
– CCD – CMO
انواع خاکستری :
Gray levels |
Gray levels |
Image processing به پروسه تبدیل یک عکس به عکسی دیگر می گویند.عکس یک نمایش مجزا از یک فرایند ۲ بعدی مداوم است .Image processing به ۲ روش صورت میگیرد :
۱- پردازش سیگنالها یا پردازش علائم به فرایند تجزیه، تحلیل و تفسیر سیگنالها اطلاق میشود. سیگنال مورد نظر میتواند صدا، تصویر، فیلم و یا هر سیگنال دیگری باشد. این علم دارای دو شاخه اصلی میباشد:
در سیگنالهای پیوسته در زمان متغیر مستقل، پیوسته است و این سیگنالها در تمام مقادیر پیوستهای که متغیر مستقل اختیار میکند تعریف میشوند. حال آنکه سیگنالهای گسسته در زمان تنها در زمانهای گسسته تعریف شدهاند و در نتیجه این سیگنالها تنها در مقادیر گسسته متغیر مستقل تعریف میشوند.
۲-عکس ها در واقع ماتریکسی از پیکسل ها هستند؛رفتار عکس ها به عنوان ماتریکس نقاطی که میتوان روی آنها عملیات محاسباتی انجام داد.
مثال :
عکس زیربه عنوان یک سیگنال ۲ بعدی بررسی و نمونه برداری شده است.
p:= (x,y, I(x,y))
two-dimensional image |
عکس ۵۰ * ۵۰ پیکسلی خاکستری ۸ بیتی |
Quantization Chromatic :
همیشه لازم نیست که همه رنگ های موجود در تصویریعنی *truecolor را داشته باشیم،بنابرین کم کردن رنگ عکسموجب فضای حافظه کمتراشغال شود. برای کاهش لایه های رنگی :
با استفاده بیت های کمتر در گروه برای مثال :
(۵-۵-۵ یا ۵-۶-۵ در رنگهای Hicolor از ۱۵ یا ۱۶ بیت صرفه جویی میشود.)
با استفاده از lookup table یک مقدار بی نهایت از رنگها رو انتخاب میکند (برای مثال ۲۵۶) روی یک جدول ذخیره میکند
و ارزش هر پیکسل برابر با مکان اشاره گر بروی جدول RGB است.لیست رنگ های موجود پالت نامیده میشود.از لحاظ تاریخی CGA دارای پالتی با ۴ رنگ و EGA دارای ۱۶ رنگ بود. در واقع انقلابی با کارت VGA که دارای پالتی با ۲۵۶ رنگ بود،ایجاد شد.
(۲۴ بیت در هر پیکسل و ۸بیت برای هر کانال) = * truecolor
انتخاب پالت :
در تعیین میزان رنگ،پالت نقش اساسی دارد.شما می توانید ازیک پالت استاندارد که شامل زیر مجموعه ای از رنگ های ممکن است،استفاده کنید.این انتخاب از طریق مکعب RGB که دارای تعداد استانداردی از تونالیته های رنگی برای هر کانال است انجام میشود.این عمل از طریق فرمول زیر انجام میشود.
Elem : تعداد رنگهایی که میخواهیم در پالت باشد.
بهینه سازی پالت های رنگ :
-میتوان از طریق انتخاب پالتی که فضای رنگی عکس را بهتر نمایش دهد،بدون از دست دادن کیفیت،عکس را فشرده سازی کرد. یک راه برای بهینه سازی پالت رنگی،روشی است که Paul Heckbert در سال ۱۹۸۰ پیشنهاد کرد که به Median Cut Algorithm مشهور است.
-همچنین میتوان از طریق روش تشابه رنگی عکس را فشرده سازی کرد به این ترتیب که نقاط رنگی مشابه را یکی میکند.
-معمولا برنامه های گرافیکی برای سنجش در فضای RGB از فاصله اقلیدسی استفاده میکنند.
استاندارد تلویزیونی :
عکسهایی که ازطریق دوربین های دیجیتالی گرفته میشوند معمولا دارای استاندارد های ویدیویی هستند.
عکسهایی که ازطریق دوربین های دیجیتالی گرفته میشوند معمولا دارای استاندارد های ویدیویی هستند.
NTSC،(مخفف کمیته سامانه تلویزیون ملی)، سامانه تلویزیون آنالوگ است که در ایالات متحده، کانادا، ژاپن، مکزیک، فیلیپین، کره جنوبی، تایوان و تعدادی دیگر از کشورها از آن استفاده میشود. (رجوع شود به نقشه)
انتیاسسی بیشترین استفاده را در امریکای شمالی و ژاپن دارد. این استاندارد از نسبت درازا به پهنای ۴:۳ برای اندازه صفحه تصویر استفاده میکند و هر فریم تصویر تشکیل شدهاست از ۵۲۵ خط و تعداد فریمها در ثانیه ۳۰ فریم است.
سکام، (به فرانسوی Séquentiel couleur à mémoire به معنای رنگ متوالی همراه با حافظه) سامانه تلویزیون رنگی آنالوگ است که اولین بار در فرانسه ابداع شد. این سامانه را تیمی به سرپرستی هنری دو فرانس که در شرکت تلویزیونی فرانسه که بعدها توسط تامسون خریداری شد، ابداع کردند. این سامانه از جهت تاریخی اولین سامانه رنگی استاندارد اروپایی به شمار میرود.
پال مخفف «خط فاز متناوب» (به انگلیسی: Phase Alternating Line)، سیستم فرستنده رنگی است که در سامانه فرستنده تلویزیونی در بیشتر نقاط جهان از آن استفاده میشود. سامانههای رایج دیگر تلویزیون آنالوگ سکام یا ان تی اس سی میباشند.
Interlaced video :
سیستمهای پخش قدیمی NTSC دارای 525 خط افقی تصویر میباشند. در سیستم PAL تصاویر با کیفیت اندکی بهتر و با 625 خط افقی پخش میگردد. اما تمام این خطوط برای نمایش تصویر بکار نمیروند. خطوطی که اطلاعات تصویری را نمایش میدهند خطوط فعال نام دارند و تعدادشان 486 برای سیستم NTSC و 576 برای PAL میباشد. بعلاوه ، در سیستمهای PAL و NTSC از پویش شانه ای (interlaced) استفاده میشود یعنی هر قاب به دو بخش تقسیم شده و یک بخش شامل خطوط فرد ، و بخش دیگر شامل خطوط زوج میباشد. هر بخش بصورت یک در میان نمایش داده میشود و مغز ما با ترکیب آنها تصویر کامل هر قاب را میسازد. پویش شانه ای کیفیت تصویر را پایین می آورد.
به مثال زیر دقت کنید :
interlacing |
اسکن پیشرونده :
اسکن پیشرونده (Progressive scanning) یک راه برای نمایش، ذخیرهسازی، و یا انتقال تصاویر متحرک است که در آن تمام خطوط هر فریم به ترتیب کشیده شدهاند.
اسکن پیشرونده |
-رزولوشن عمودی تصویر را بالا میبرد.
-مصنوعات ایجاد شده توسط پویش شانه ای را از بین میبرد.
-در دوربین های عکاسی به کار میرود.
-این تکنولوژی در ۱۰ سال اخیر به وجود آمده است.
دوربین فیلمبردای :
به روند انتقال تصاویر متحرک به فیلم وهمسان سازی رنگ های ان به یک مجموعه رنگ واحد Telecine میگویند.این اصطلاح برای اشاره به تجهیزات مورد استفاده در فرایند تولید نیزمورد استفاده قرار گیرد است.
Telecine |
► DVD -> 720x576, 704x576 PAL – 720x480, 704x480 NTSC
► HDTV (720p) 1280x728
► FULL HD (1080p) 1920x1080
► (720i, 1080i) .بعد از رزولوشن عمودی نشان میدهد که منبع ویدییو پویش شانه ای بوده است,I
Video Camera Formats |
Color data mode -bits per pixel |
Video Formats :
مثال ها :
● GEM \ pix_resize
● GEM \ pix_reducecolor
● GEM \ pix_dot
● GEM \ pix_histo
● GEM \ pix_motionblur
Help->Browser...
● GEM \ pix_reducecolor
● GEM \ pix_dot
● GEM \ pix_histo
● GEM \ pix_motionblur
منابع :
►Wikipedia
► http://imagelab.ing.unimore.it/imagelab/
►Rita Cucchiara, Dispense del corso di Visione Artificiale, a.a. 2004-05, Università degli studi di Modena e Reggio Emilia, marzo 2005.
►Rita Cucchiara, Dispense del corso di Sistemi di Elaborazione, a.a. 2004-05, Università degli studi di Modena e Reggio Emilia, marzo 2005.
►Rita Cucchiara, Dispense del corso di Sistemi di Elaborazione, a.a. 2004-05, Università degli studi di Modena e Reggio Emilia, marzo 2005.
اشتراک در:
پستها (Atom)