جلسه دفاع از پایاننامه: آقای اسماعیل حسن زاده ، گروه مهندسی نرم افزار
خلاصه خبر: چارچوب فرامکاشفهای محور جهت تحلیل یکپارچه دادههای مولتیامیکس
چکیده: مولتیامیکس نام یک رویکرد جدید در تحلیل و بررسی دادههای بیولوژیکی است که از دادههایی مانند ژنوم، پروتئوم، ترنسکریپتم (دادههای بیان ژن)، اپیژنوم و به طور کلی مجموعه دادههای پزشکی که به «اوم» ختم میشوند، استفاده میکند. این رویکرد با ترکیب این نوع دادهها در یک مجموعه داده، میتواند به صورت موثر و آسان، کلانداده پیچیدهی حاصل را برای پیدا کردن نشانگرهای زیستی به منظور تشخیص و درک روابط بین فنوتایپ یا همان نشانههای پدیداری و ژنوتایپ تحلیل و بررسی کند. انتخاب نشانگرهای زیستی مهم و مفهومی از دادههای مولتیامیکس کار بسیار دشواری است. علت این دشواری میتواند تنوع دادهها، چالشهایی که در استفاده همزمان از انواع این دادهها وجود دارد، ابعاد بالای هر کدام از دادههای امیکس، کمبود تعداد نمونهها و در برخی موارد وجود مقادیر گم شده و نویز باشد. اما به دلیل استفاده همزمان از انواع دادهها و همافزایی که به وجود میآورند نتایج بهتر، قابلاعتمادتر و پایدارتری تولید میشود که با اطمینان بالاتری میتوان نشانگرهای پیداشده را به عنوان عوامل موثر در بروز یک فنوتایپ معرفی کرد. همچنین در این روش تنها بر اساس محصول نهایی یعنی بیان ژن تصمیمگیری نمیشود بلکه به عوامل اپی ژنتیکی موثر در بیان ژن و سطوح مختلف ژنی توجه میشود. یکی از چالشهایی که در تحلیل و بررسی دادههای مولتیامیکس وجود دارد یکپارچهسازی این نوع دادهها است. یکپارچهسازی در تحلیل دادههای مولتی امیکس در سه سطح داده، سطح مدل و سطح میانی انجام میشود که هر کدام نقاط قوت و ضعف مربوط به خود را دارند. اکثر پژوهشهای انجام شده در این حوزه تحقیقاتی، از یکی از این رویکردهای یکپارچهسازی استفاده میکنند. در این پژوهش از یک روش ترکیبی بهمنظور یکپارچهسازی دادههای مولتیامیکس استفاده شده است. بدین صورت که هم از رویکرد یکپارچهسازی مبتنی براتصال داده و هم از رویکرد یکپارچه سازی مبتنی بر مدل بهصورت همزمان استفاده شده است تا از مزایای هر دو رویکرد استفاده شود. همچنین با استفاده از یک چارچوب مبتنی بر الگوریتم تکاملی، نشانگرهای زیستی موثر در یک فنوتایپ خاص پیدا میشوند. بهمنظور ارزیابی الگوریتم پیشنهادی خود از مجموعه دادگان مربوط به سرطان پستان که در پژوهشهای متعددی استفاده شده، استفاده کردیم. در این دادگان مسئله اصلی پیشبینی پنج زیرنوع سرطان پستان میباشد و یک نوع مسئله دستهبندی محسوب میشود. نتایج به دست آمده نشان میدهد که روش ما توانسته با ترکیب رویکردهای یکپارچهسازی دادههای مولتیامیکس با دقت 84.53 درصد زیرنوعهای سرطان پستان پیشبینی کند. 22 شهریور 1399 / تعداد نمایش : 1091
|