بیوانفورماتیک (Bioinformatics)
بیوانفورماتیک یک دانش بین رشته ای است که شامل روشها و نرم افزارهایی برای فهم اطلاعات زیستی است. بیوانفورماتیک به عنوان یک دانش بین رشته ای، به منظور تجزیه و تحلیل و تفسیر اطلاعات زیست شناسی، از ترکیب علوم کامپیوتر، آمار، ریاضی و مهندسی استفاده میکند. به عبارتی دیگر از بیوانفورماتیک برای تجزیه و تحلیل درون کامپیوتریِ مسائل زیست شناسی با استفاده از تکنیک های ریاضی و آمار استفاده می شود.
بیوانفورماتیک از برنامه ریزی های کامپیوتری برای تجزیه و تحلیل اختصاصی ژنومیکس استفاده می کند. از دیگر کاربردهای متداول بیوانفورماتیک، شناسایی چند شکلی های تک نوکلئوتیدی (SNPs) و ژن های کاندید است. چنین شناسایی هایی اغلب، با هدف فهم بهتر پایه ژنتیکی بیماری ها، تطابق و ایجاد خواص مطلوب (خصوصا در گونه های کشاورزی) یا شناخت تفاوت های میان جمعیت ها انجام می شود. بیوانفورماتیک همچنین به دنبال فهم بیشتری از اصول ساختاری نوکلئیک اسیدها و توالی پروتئین ها در قالب علم پروتومیکس می باشد.
در زیست شناسی مولکولی تجربی، تکنیک های بیوانفورماتیک مانند پردازش سیگنال و تصویرسازی سه بعدی منجر می شود مقادیر بالایی از اطلاعات خام بدست بیاید. تفسیر این اطلاعات نتایج جالبی را به ما ارائه می کند. برای مثال در زمینه ژنتیک و ژنومیکس، بیوانفورماتیک به تعیین توالی، تفسیر اطلاعات ژنومی و جهش های مشاهده شده در انسان کمک می کند.
بیوانفورماتیک همچنین نقش مهمی در تجزیه و تحلیل تنظیم و بیان ژن و پروتئین ایفا می کند. در حالت کلی بیوانفورماتیک به مقایسه ژنتیک و اطلاعات ژنومیکس و به دنبال آن به فهم چگونگی تکامل زیست مولکولی کمک میکند. این علم همچنین در شبیه سازی و مدلسازی DNA (1)، RNA(1-2) و پروتئین ها (۳) و تعاملات زیست مولکولی کمک کننده است (۴-۶).
تاریخچه:
از لحاظ تاریخی، اصطلاح بیوانفورماتیک به معنای امروزی آن نیست. پائولین هوگوگ و بن هسپر بیوانفورماتیک را در سال ۱۹۷۰ برای اشاره به مطالعه در زمینه پردازش اطلاعات و سیستم های زنده اختراع کردند (۷-۹). این تعریف از بیوانفورماتیک این علم را به عنوان یک حوضه در موازات با بیوفیزیک (مطالعه فرآیندهای فیزیک در سیستم های زیستی) یا بیوشیمی ( مطالعه فرآیندهای شیمی در سیستم های زیستی) قرار میدهد (۷).
توالیها:
پس از اینکه توالی انسولین در اوایل ۱۹۵۰ توسط فریدریک سانگر مشخص شد، وجود کامپیوترها در زیست مولکولی ضرورت پیدا کرد. چرا که مقایسه ی توالیهای متعدد به صورت دستی طاقت فرسا بود. در این زمینه مارگارت دایهوف پیشگام شد (۱۰) و اولین پایگاه داده توالی پروتئینی را گردآوری و به عنوان کتاب (۱۱) و روش های پیشگام در هم ترازی (alignment) توالی و ارزیابی مولکولی منتشر کرد (۱۲). از جمله افراد دیگر در حوضه شکل گیری بیوانفورماتیک الوین کابات بود که در تجزیه و تحلیل توالی زیستی در سال ۱۹۷۰ پیشقدم شد (۱۳).
توالی ژن ها و پروتئین های مختلف ممکن است پهلو به پهلو برای اندازه گیری شباهت هایشان هم تراز شوند.
این ترازبندی توالی پروتئین حاوی دومین های WPP را مقایسه میکند.
اهداف:
به منظور درک بهتر از چگونگی تغییر فعالیت های سلولی نرمال در بیماری های مختلف، باید اطلاعات زیستی ترکیب شوند تا تصویری جامع از این فعالیت ها شکل بگیرد.از اینرو بیوانفورماتیک در زمینه تجزیه و تحلیل و تفسیر انواع مختلفی از داده ها به کمک ما می آید. این داده ها شامل توالی نوکلئوتیدها و اسیدهای آمینه، دومین ها و ساختارهای پروتئینی است (۱۴). فرآیند تجزیه و تحلیل و تفسیر اطلاعات شامل:
-
توسعه و پیاده سازی برنامه های کامپیوتری به منظور دسترسی کارآمد، استفاده و مدیریت از انواع مختلفی از اطلاعات
-
توسعه ی الگوریتم های جدید ( فرمول های ریاضی) و مقیاس های آماری به منظور ارزیابی ارتباطات میان اعضای مجموع داده های حجیم
به عنوان مثال می توان در شرایط کامپیوتری، یک ژن را در داخل یک توالی خاص قرار داد و ساختار یا عملکرد پروتئین آن را پیش بینی کرد.
هدف اولیه بیوانفورماتیک افزایش سطح فهم و درک از فرآیندهای زیستی است و تمرکز آن در توسعه و کاربرد تکنیکهای محاسباتی جامع به منظور کسب این هدف است برای مثال میتوان به تشخیص الگو، داده کاوی، الگوریتم های یادگیری و تصویرسازی اشاره کرد. تلاش های تحقیقاتی گسترده ای در این زمینه (شامل هم ترازی توالی، ژن یابی، گردآوری ژنوم، طراحی و کشف دارو، پیش بینی ساختار پروتئین، پیش بینی بیان ژن، برهم کنش پروتئین-پروتئین، مطالعات مربوط به ژنوم، مدلسازی تکامل و تقسیم سلولی) در حال انجام است.
در چند دهه گذشته، پیشرفت سریع در علم ژنومیک و دیگر تکنیک های تحقیقات مولکولی با تکنیک های تجمیع اطلاعات (به منظور تولید مقادیر بسیار بالای از اطلاعات مرتبط با زیست مولکولی)، ترکیب شده اند. فعالیت های متداول در بیوانفورماتیک شامل نقشه کشی و آنالیز توالی های DNA و پروتئین، هم ترازی توالی های DNA و پروتئین به منظور مقایسه آنها و ایجاد مدلهای سه بعدی از ساختارهای پروتئین است.
کاربردهای بیوانفورماتیک:
-
تجزیه و تحلیل توال ها: از زمان توالی یابی فاژ Φ-X174در سال ۱۹۷۷ (۱۵) توالی DNA هزاران موجود تعیین و در پایگاههای داده ذخیره شد. این اطلاعات توالی به منظور تعیین ژن های کدکننده پروتئین، RNA، توالیهای تنظیمی، موتیف های ساختاری و توالی های تکرای تجزیه و تحلیل میشوند. مقایسه ژنها درون و میان گونه ها میتواند شباهت میان عملکرد پروتئین ها یا ارتباطات میان گونهها (درخت فیلوژنیک) را نشان دهد. امروزه برنامه های کامپیوتری مانند BLAST به صورت روزمره برای جستجوی توالی بیشتر از ۲۶۰۰۰۰ موجود زنده شامل بیشتر از ۱۹۰ میلیارد نوکلئوتید استفاده میشود (۱۶).
آنالیز توالی در بیوانفورماتیک برای توالی یابی، گردآوری ژنوم، تفسیر ژنوم و موارد دیگر به کار می رود.
-
تجزیه و تحلیل ساختار سلولی: روش های متعددی برای تجزیه و تحلیل موقعیت اندامکها، پروتئینها و دیگر اجزا داخل سلولی ایجاد شدهاند. این روشها به ما کمک میکند تا بتوانیم رفتارهای سیستم های زیستی را به درستی پیشبینی کنیم.
-
بیوانفورماتیک ساختاری: پیشبینی ساختار پروتئین یکی دیگر از کاربردهای بیوانفورماتیک است. توالی اسیدآمینهای پروتئین که ساختار اولیه نامیده می شود می تواند به راحتی توسط توالی ژن رمز کنندهاش تعیین شود. شناخت ساختار اولیه در فهم عملکر پروتئین حیاتی است. بیوانفورماتیک میتواند ساختار یک پروتئین را از طریق بررسی شباهت بین ژن رمز کنندهی پروتئین و ژنی که عملکرد آن مشخص شده است پیش بینی کند (۱۷).
منابع
-
Sim, Adelene YL; Minary, Peter; Levitt, Michael (2012-06-01). “Modeling nucleic acids”. Current Opinion in Structural Biology. Nucleic acids/Sequences and topology. ۲۲(۳): ۲۷۳–۲۷۸٫
doi:1016/j.sbi.2012.03.012. PMC ۴۰۲۸۵۰۹. PMID ۲۲۵۳۸۱۲۵.
-
Dawson, Wayne K.; Maciejczyk, Maciej; Jankowska, Elzbieta J.; Bujnicki, Janusz M. (2016-07-01). “Coarse-grained modeling of RNA 3D structure”. Methods. Advances in RNA Structure Determination. ۱۰۳: ۱۳۸–۱۵۶٫ doi:1016/j.ymeth.2016.04.026.
-
Kmiecik, Sebastian; Gront, Dominik; Kolinski, Michal; Wieteska, Lukasz; Dawid, Aleksandra Elzbieta; Kolinski, Andrzej (2016-06-22). “Coarse-Grained Protein Models and Their Applications”. Chemical Reviews. ۱۱۶: ۷۸۹۸–۹۳۶٫ doi:1021/acs.chemrev.6b00163. ISSN ۰۰۰۹-۲۶۶۵. PMID ۲۷۳۳۳۳۶۲.
-
Wong, KC (2016). Computational Biology and Bioinformatics: Gene Regulation. CRC Press (Taylor & Francis Group). ISBN9781498724975.
-
Jump up^Joyce, Adam P.; Zhang, Chi; Bradley, Philip; Havranek, James J. (2015-01-01). “Structure-based modeling of protein: DNA specificity”. Briefings in Functional Genomics. ۱۴ (۱): ۳۹–۴۹٫ doi:1093/bfgp/elu044. ISSN ۲۰۴۱-۲۶۴۹. PMC ۴۳۶۶۵۸۹. PMID ۲۵۴۱۴۲۶۹.
-
Spiga, Enrico; Degiacomi, Matteo Thomas; Dal Peraro, Matteo (2014-01-01). Karabencheva-Christova, Tatyana, ed. Chapter Three – New Strategies for Integrative Dynamic Modeling of Macromolecular Assembly. Biomolecular Modelling and Simulations. ۹۶. Academic Press. pp. ۷۷–۱۱۱٫ doi:1016/bs.apcsb.2014.06.008
-
Hogeweg P (2011). Searls, David B., ed. “The Roots of Bioinformatics in Theoretical Biology”. PLoS Computational Biology. ۷ (۳): e1002021. Bibcode:..7E0020H. doi:10.1371/journal.pcbi.1002021. PMC ۳۰۶۸۹۲۵. PMID ۲۱۴۸۳۴۷۹.
-
Hesper B, Hogeweg P (1970). “Bioinformatica: een werkconcept”. ۱ (۶). Kameleon: 28–۲۹٫
-
Hogeweg P (1978). “Simulating the growth of cellular forms”. Simulation. ۳۱ (۳): ۹۰–۹۶٫ doi:1177/003754977803100305
-
Moody, Glyn (2004). Digital Code of Life: How Bioinformatics is Revolutionizing Science, Medicine, and Business. ISBN978-0-471-32788-2.
-
Dayhoff, M.O. (1966) Atlas of protein sequence and structure. National Biomedical Research Foundation, 215 pp.
-
Eck RV, Dayhoff MO (1966). “Evolution of the structure of ferredoxin based on living relics of primitive amino Acid sequences”. Science. ۱۵۲ (۳۷۲۰): ۳۶۳–۶٫ Bibcode:..152..363E. doi:10.1126/science.152.3720.363. PMID ۱۷۷۷۵۱۶۹.
-
Johnson G, Wu TT (January 2000). “Kabat Database and its applications: 30 years after the first variability plot”. Nucleic Acids Res. ۲۸ (۱): ۲۱۴–۲۱۸٫ doi:1093/nar/28.1.214. PMC ۱۰۲۴۳۱. PMID ۱۰۵۹۲۲۲۹
-
Attwood TK, Gisel A, Eriksson NE, Bongcam-Rudloff E (2011). “Concepts, Historical Milestones and the Central Place of Bioinformatics in Modern Biology: A European Perspective”. Bioinformatics – Trends and Methodologies. InTech. Retrieved ۸ Jan ۲۰۱۲٫
-
Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, Hutchison CA, Slocombe PM, Smith M (February 1977). “Nucleotide sequence of bacteriophage phi X174 DNA”. Nature. ۲۶۵ (۵۵۹۶): ۶۸۷–۹۵٫ Bibcode:265..687S. doi:10.1038/265687a0. PMID ۸۷۰۸۲۸.
-
Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Wheeler DL (January 2008). “GenBank”. Nucleic Acids Res. ۳۶(Database issue): D25–۳۰٫ doi:1093/nar/gkm929. PMC ۲۲۳۸۹۴۲. PMID ۱۸۰۷۳۱۹۰
-
Hoy, JA; Robinson, H; Trent JT, 3rd; Kakar, S; Smagghe, BJ; Hargrove, MS (3 August 2007). “Plant hemoglobins: a molecular fossil record for the evolution of oxygen transport.”. Journal of Molecular Biology. ۳۷۱(۱): ۱۶۸–۷۹٫ doi:1016/j.jmb.2007.05.029. PMID ۱۷۵۶۰۶۰۱
.