دسته‌بندی نشده

پایان نامه ارشد : استگانوگرافی در صدا

۲-۱۲-۲-۵- الگوریتم ها و تبدیلات

بدلیل اینکه عکس های JPEG دارای کیفیت بالا و فشرده سازی خوب هستند بسیار مناسب است که از آنها برای استفاده در شبکه ها و اینترنت استفاده کنیم. در حقیقت JPEG متداول ترین فرمت بر روی اینترنت است.

عکس JPEG از تبدیل کسینوسی گسسته (DCT) برای فشرده سازی استفاده می کنند. DCT یک تبدیل با اتلاف برای فشرده سازی است. بدلیل اینکه مقدار کسینوس به دقت کامل محاسبه نمی شود همیشه احتمال خطا وجود دارد و اطلاعاتی که بازیابی می شود با توجه به مقادیری که DCT محاسبه کرده ممکن است با مقدار اولیه تفاوت داشته باشد.

همچنین عکس را می توان توسط تبدیل فوریه یا تبدیل موجک پردازش کرد. از روشنایی عکس ها هم
می توان استفاده کرد، سیستم بینایی انسان حساسیت کمی نسبت به تغییرات کم در روشنایی دارد.

از معروف ترین روش های مبتنی بر کاهش بعد، آنالیز مولفه های اصلی و تبدیل کسینوسی گسسته است. تحلیل مولفه های اصلی یک تبدیل خطی است که از واریانس داده های ورودی استفاده می کند. این روش ابزار قدرتمندی برای تجزیه و تحلیل داده های ورودی در حضور تغییرات خطی می باشد.[۲۶]

تبدیل کسینوسی یکی از تبدیلهایی است که در پردازش سیگنالهای دیجیتال و پردازش تصویر کاربرد بسیاری دارد. تبدیل کسینوسی دو بعدی یک تکنیک استاندارد برای فشرده سازی و کدینگ تصاویر است که در استاندارد هائی همانندMPEG- 2 ،MPEG-1 ، JPEGو … از این تبدیل استفاده می شود.[۳]

بقیه تکنیک ها اطلاعات مخفی شده را کدگذاری می کند. آنها فرض می کنند که اگر بیت های پیغام کشف شد اگر الگوریتم و کلمه رمز وجود نداشته باشد پیغام را نتوان رمزگشایی کرد. با اینکه این
تکنیک ها در محافظت از پیغام در برابر کشف شدن کمک می کند ولی در مقابل دستکاری عکس مصونیت ندارند.

پایان نامه بهبود الگوریتم های پنهان نگاری در تصاویر دیجیتال با بهره گرفتن از تجزیه مقدار منفرد

 

۲-۱۲-۳- استگانوگرافی در صدا

بدلیل محدوده سیستم شنوایی انسان مخفی کردن اطلاعات در صدا نیز می تواند مورد استفاده قرار گیرد. سیستم شنوایی انسان می تواند قدرتی بین یک تا یک میلیون و فرکانسی بیشتر یک هزار تا یک را درک کند. همچنین نسبت به پارازیت هایی که اضافه می شود بسیار حساس است. هر گونه مزاحمتی در یک فایل صوتی قابل درک است حتی اگر به کمی یک قسمت از ده میلیون باشد. به هر حال با اینکه سیستم شنوایی انسان حساسیت زیادی دارد ولی در برابر بعضی تغییرات حساسیت خود را از دست
می دهد مثلا ً صداهای بلند صداهای آرام را در خود جای می دهند.

برای استفاده از صدا برای مخفی کردن اطلاعات دو نکته را باید در نظر داشت، اول، باید از ضعف سیستم شنوایی انسان سوء استفاده کرد و دوم توجه خاصی به حساسیت فوق العاده آن داشت.


۲-۱۲-۳-۱- محیط های صدا

وقتی سیگنال های صدا فرستاده می شود دو نکته مد نظر است، یکی وسیله ذخیره صدا و دیگری وسیله پخش آن.

۲-۱۲-۳-۲- ذخیره صدا

فایلهای صدای دیجیتالی دارای دو خصوصیت هستند:

  • الگوی کوانتیزاسیون[۱]: معمول ترین فرمت های ذخیره صدا با کیفیت بالا استفاده از فرمت های ۱۶ بیتی خطی کوانتیزاسیون است مانند آن چیزی که در [۲]WAV یا AIFF[3] استفاده می شود. مقداری از سیگنال ها بوسیله این فرمت دچار اعوجاج می شود.
  • تمپورال[۴] نرخ نمونه گیری: پر استفاده ترین تمپورال نرخ نمونه گیری ها برای صدا عبارتند از ۸KHz, 9.6KHz, 10KHz, 12KHz, 16KHz, 22.05KHz و ۱KHz می باشد. نرخ نمونه گیری یک حد بالا برای استفاده از فرکانس های مختلف در صدا ایجاد می کند. به طور کلی فضای قابل استفاده نسبت خطی با نرخ نمونه گیری دارد.

یکی دیگر از روش های ذخیره که باید به آن توجه کرد ISO MPEG است. در این فرمت خصوصیات
سیگنال ها بوسیله کد کردن بخش قابل شنیدن آن تغییر می یابد، اینگونه که صدا را حفظ می کند ولی سیگنال را تغییر می دهد.

۲-۱۲-۳-۳- وسایل پخش

وسیله پخش یا محیط پخش در یک سیگنال صدا به محیطی گفته می شود که سیگنال در آن از رمزگذاری به رمزگشاییمی رود.

چهار محیط پخش عبارتند از:

  • محیط Digital End-to-End: وقتی یک فایل صوتی مستقیماً از یک ماشین به ماشین دیگر کپی شود اما تغییری در آن اعمال نشود آنگاه آن فایل از طریق Digital end to end منتقل شده است. در نتیجه نمونه گیری بین رمزگذاری و رمزگشایی تغییر نخواهد کرد. در این محیط اطلاعات خیلی کمی
    می توان مخفی کرد.
  • محیطی با بهره گرفتن از کم یا زیاد کردن و نمونه گیری مجدد: در این محیط یک سیگنال دوباره نمونه گیری می شود تا به یک سطح بالاتر یا پایین تری از نرخ نمونه گیری برسد اما همچنان دارای خروجی یکسان باشد. اما همچنان بزرگی و فاز سیگنال ها حفظ می شود و فقط خاصیت های تمپورال سیگنال تغییر می کند.
  • پخش آنالوگ و نمونه گیری مجدد: این وقتی اتفاق می افتد که سیگنال به آنالوگ تغییر می کند و آن بر روی یک خط آنالوگ پخش می شود. بزرگی سیگنال، نمونه کوانتیزاسیون و نرخ نمونه گیری تمپورال حفظ نمی شود. به طور کلی فقط فاز سیگنال حفظ می شود.
  • محیط هوا: این وقتی اتفاق می افتد که سیگنال در هوا پخش شود و دوباره بوسیله میکروفن از آن نمونه برداری کنند. در این حالت سیگنال تغییرات غیر خطی زیادی می کند مانند تغییر در فاز، دامنه، فرکانس و غیره.

هر دوی محیط پخش و وسیله ذخیره سینگال در نوع الگوریتم هایی که برای مخفی کردن اطلاعات به کار می رود اهمیت دارند.

۲-۱۲-۳-۴- روش های مخفی کردن اطلاعات در صدا

حالا بعضی از روش های مخفی کردن اطلاعات در صدا را بررسی می کنیم.

۱) Low-Bit encoding:

مشابه روش LSB در عکس ها، اطلاعات دودویی نیز می توانند با روش LSB در فایلهای صوتی ذخیره شوند. در بهترین حالت حجم کانال یک کیلوبیت بر ثانیه برای هر کیلوهرتز است بنابراین ظرفیت کانال برای ۴۴KHz معادل ۴۴Kbps است. متاسفانه این یک پارازیت قابل شنیدن ایجاد می کند. البته مهمترین ضعف این سیستم مقاومت نکردن در برابر تغییرات است، هر گونه تغییری می تواند منجر به از دست رفتن اطلاعات مخفی شده باشد.

روش دیگر تغییر کمی در دامنه سیگنالهای نمونه است به قسمی که تغییرات آنها قابل ملاحظه نباشد. از این روش در فرمت های MPEG می توان استفاده کرد.

 

آدرس سایت برای متن کامل پایان نامه ها

۲) Phase Coding:

در phase coding فاز بخشی از سیگنال را با اطلاعات مورد نظر تعویض می کنند. روش این کار بدین شرح است:

  • دنباله صدای اصلی به N قسمت کوچک تقسیم می شود.
  • از تبدیل گسسته فوریه برای پیدا کردن ماتریس فاز و اندازه هر قسمت استفاده می شود.
  • تفاوت فاز بین هر دو قسمت مجاور محاسبه می شود.
  • برای بخش آغازین، S0 یک فاز مطلق برابر P0 در نظر گرفته می شود.
  • برای هر بخش دیگر قاب فازهایشان ساخته می شود.
  • فاز جدید و بزرگی اصلی هر کدام با هم ترکیب می شوند و بخش جدید Sn را می سازند.
  • در آخر، بخش های جدید به هم متصل می شوند تا خروجی کد شده را بسازند.

برای پردازش رمز گشایی، ابتدا دنباله همزمان می شود. طول هر بخش، نقاط DFT و وقفه ها باید به رمزگشایی داده شود. محتوای فاز بخش اول یک یا صفر در نظر می گیرد که نشان دهنده متن کد شده دودویی است.

۲-۱۲-۳-۵- مخفی کردن اطلاعات در Echo

در روش مخفی کردن اطلاعات با اکو، اطلاعات بوسیله یک اکوی صدا در سیگنال میزبان جاسازی می شود. اطلاعات بوسیله تغییر در این سه مشخصه مخفی می شود، دامنه آغازین، پایین آوردن سرعت و تاخیر. وقتی فاصله بین سیگنال اصلی و اکو کم شود هر دو سیگنال با هم مخلوط می شود. در یک نقطه مشخص، گوش انسان نمی تواند تفاوتی بین این دو سیگنال قائل شود، در این حالت اکو به عنوان یک تشدید در سیگنال اصلی شنیده می شود. این نکته به عواملی مانند کیفیت ضبط صدای اصلی و کیفیت گوش دهنده بستگی دارد.

بوسیله استفاده از دو متغییر برای تاخیر زمانی که هر دو کمتر از قدرت تشخیص گوش انسان باشد
می توان اطلاعات دودویی صفر و یک را رمزگذاری کرد. پایین آوردن نرخ سرعت و دامنه می تواند در حد پایین تر از آستانه شنوایی انسان باشد تا اینکه مطمئن باشیم صدا قابل تشخیص نیست. برای اینکه بیشتر از یک بیت را رمزگذاری کنیم سیگنال اصلی را به قسمت های کوچکتری تقسیم می کنیم. هر کدام از آنها را می توان با اکو رمزگذاری کرد، در نهایت سیگنال خروجی از به هم پیوستن همه این تکه ها خواهد بود. در این روش از تاخیری به مدت y برای عدد یک و تاخیر دیگری به مدت x برای صفر استفاده می کنند.

[۱] . Quantization

[۲] . Windows Audio Visual

[۳] . Audio Interchange File Format

[۴] . Temporal

Leave a Reply

Your email address will not be published.Required fields are marked *