محققان علاقه مند به بهبود یک ویژگی خاص در گیاهان اکنون می توانند ژن هایی را که بیان این صفت را تنظیم می کنند بدون انجام هیچ آزمایشی شناسایی کنند.
کرانتی وارالا از دانشگاه پردو و 10 نویسنده مشترک جزئیات ابزار جدید کشف ژن تنظیمی مبتنی بر وب را در شماره 23 آوریل مجموعه مقالات آکادمی ملی علوم منتشر کردند. وارالا یک پتنت در انتظار نتایج مربوط به بیوسنتز روغن دانه از نظر اقتصادی مهم دارد.
تیم Purdue-USDA به دنبال ساخت منبعی بود که از مقادیر زیادی دادههای در دسترس عموم یاد میگیرد تا به سرعت شناسایی کند که چه ژنهای خاصی به نام فاکتورهای رونویسی بیان یک صفت معین را در گونههای مختلف گیاهی تنظیم میکند.
وارالا، استادیار باغبانی و معماری منظر گفت: «هر مطالعه روی تعداد انگشت شماری از آنها متمرکز است. فرض ما این بود که اگر بتوانیم همه آن را در یک تحلیل واحد قرار دهیم، میتوانیم از این دادهها برای ساختن چیزی جهانی استفاده کنیم.
وارالا گفت: Arabidopsis به عنوان گیاه مدل مطالعه PNAS عمل کرد، “اما این رویکرد هیچ چیز خاصی برای Arabidopsis ندارد.” “رویکرد به اندازه کافی کلی است که میتوانید با مجموعه دادههای ذرت شروع کنید. میتوانید آن را با برنج، با گوجهفرنگی، هر محصولی که روی آن کار میکنید انجام دهید، به شرطی که هزاران اندازهگیری بیان ژنی را داشته باشید که مردم انجام دادهاند. و وجود دارد. در حال حاضر بیش از 12 گونه وجود دارد که ما ده ها هزار مطالعه بیان ژن داریم.”
برای اثبات کارکرد این سیستم، تیم بر روی یک مسیر ژنتیکی متمرکز شد که نحوه ساخت و ذخیره روغن گیاهان را در دانه های خود تنظیم می کند. تیم این ویژگی را به دلیل اهمیت آن در تولید مواد غذایی و سوخت زیستی و به دلیل اینکه بیش از 300 ژن درگیر از قبل شناخته شده است، انتخاب کردند.
با دستکاری ژنتیکی فاکتورهای رونویسی گیاه، محققان می توانند میزان روغن تولید شده در دانه های آن را افزایش یا کاهش دهند.
نهالهای آرابیدوپسیس برای تحقیقات به منظور بررسی اثرات ژنهای خاص بر صفاتی مانند سرعت رشد، اندازه گیاه و غیره کشت میشوند.
مانند سایر محققان، وارالا پروژه های زیادی را در طول سال ها دنبال کرده است که هدف او شناسایی ژن ها و تنظیم کننده های دخیل در حل یک مشکل بود. این به معنای انجام آزمایش های دقیق و وقت گیر بود. اما داده های تولید شده نتوانسته است تمام پاسخ هایی را که او به دنبال آن بود ارائه دهد. او آن را با معادله ای مقایسه کرد که فقط سه عامل از 10 عامل دخیل را می دانست.
او گفت: شما نمی توانید معادله را حل کنید. به همین ترتیب، وارالا اغلب میخواست بیشتر از آنچه دادهها میتوانستند سؤال کند. این انگیزه او را به ساخت چارچوبی برانگیخت که از تمام دادههای ممکن برای پرسیدن این سؤالات استفاده کند، بدون اینکه نیازی به انجام تمام آزمایشهای مربوطه برای به دست آوردن فهرستی از نامزدها باشد که سپس به تأیید ژنتیکی نیاز دارند.
وارالا گفت: «من سعی میکنم فاز جمعآوری دادههای اولیه را کوتاه کنم، تا دانشمندان بتوانند روی انجام تأییدیههای ژنتیکی تمرکز کنند. اما برای انجام این کار، تیم او باید با مجموعه داده ای بر اساس 18000 مطالعه فردی شروع می کرد.
وارالا و تیمش این مجموعه داده عظیم را با استفاده از بل و ابررایانههای براون که اکنون بازنشسته شدهاند در مرکز محاسبات پیشرفته روزن پوردو تجزیه و تحلیل کردند. این تیم یک چارچوب یادگیری ماشینی برای سرعت بخشیدن به فرآیند برای دیگران ایجاد کرد.
انجام این کار به صورت دستی برای یک نفر غیرممکن خواهد بود. یک تیم می تواند این کار را انجام دهد، اما این امر باعث ایجاد سوگیری در نحوه پردازش داده ها توسط اعضای گروه می شود. طبقه بندی کننده یادگیری ماشینی بدون تعصب عمل می کند.
تازگی این رویکرد این است که به جای جمعآوری دادههای مربوط به همه اندامها، بر مجموعه دادههای اندام خاص تمرکز میکند. شبکه های ژنی مستقل این اندام ها – برگ ها، ریشه ها، شاخه ها، گل ها و دانه ها را تنظیم می کنند.
گفتیم: “به جای استفاده از همه اندامها، در آزمایشهای بذری که مردم در طول سالها انجام دادهاند، آیا میتوانیم از همه دادهها برای یادگیری چیزی که در دانه اتفاق میافتد و نه لزوماً ریشه یا برگ یا گل استفاده کنیم؟ رویکرد ما بسیار است.”
این تیم از یک روش محاسباتی به نام رویکرد استنتاج برای پیشبینی اینکه چه فاکتورهای رونویسی قرار است فرآیند بیوسنتز روغن دانه را در Arabidopsis تنظیم کنند، استفاده کردند.
وارالا گفت: “کسانی که می شناسیم به ما کمک می کنند تا تشخیص دهیم که رویکردمان به درستی کار می کند. آن هایی که نمی دانیم کاندیدهای خوبی برای کشف زیست شناسی جدید هستند.” “این رویکرد محاسباتی محاسباتی چیزی در مورد دانهها یا روغن یا هر چیز دیگری نمیداند. ما فهرستی از ژنها را به آن ارائه کردیم و توانست ژنهای شناخته شده را بدون دانستن هیچ زمینه بیولوژیکی دوباره کشف کند.”
نویسنده اصلی، راجیو رانجان، محقق فوق دکتری در بخش باغبانی و معماری منظر در پوردو، 12 مورد دیگر از 20 مورد برتر را انتخاب کرد و پرسید که آیا این پیشبینیها درست است یا خیر. او گفت: “ما توانستیم برای 11 مورد از این 12 خط جهش یافته تولید کنیم. پنج مورد از این 11 مورد محتوای روغن دانه را تغییر می دهند.” علاوه بر این، ما همچنین نشان دادیم که بیان بیش از حد یک عامل باعث افزایش روغن دانه تا 12 درصد می شود.
راجیو رانجان، محقق فوق دکتری در باغبانی و معماری منظر، دانههای آرابیدوپسیس اصلاحشده ژنتیکی را که دارای محتوای روغن بالاتری هستند، تجزیه و تحلیل میکند تا تأیید کند که سایر صفات مهم زراعی، از جمله اندازه دانه و دانه در هر میوه، تحت تأثیر منفی قرار نمیگیرند.
هشت ژن تنظیم کننده شناخته شده، اضافه شده به هشت ژن جدید، نشان داد که رویکرد استنتاج به دقت 13 مورد از 20 نامزد برتر را شناسایی می کند. نقطه قوت این رویکرد فقط از روی فهرستی از ژنها کار میکند، میتواند با دقت بالایی پیشبینی کند که کدام یک ویژگی مورد علاقه را تنظیم میکنند.
وارالا در مورد این پروژه چهار ساله گفت: “این کار زمان زیادی را صرف کرد زیرا این یک فرآیند طولانی و پیچیده است و هیچ تضمینی وجود نداشت که کار کند.” هیچ چیزی در این مقیاس قبلاً تلاش نشده بود.»
وارالا این نوآوری را به دفتر تجاری سازی فناوری نوآوران پوردو فاش کرده است که برای محافظت از مالکیت معنوی او درخواست ثبت اختراع کرده است.
این تحقیق توسط اداره علوم وزارت انرژی ایالات متحده پشتیبانی شده است.
منبع: purdue.edu