مطالعه تأثیر طول بلوک‌های هاپلوتیپی در بهبود صحت پیش بینی ژنومی به کمک روش‌های بیزی در گوسفند DOR: 20.1001.1.17359880.1400.14.2.2.1

سید شریفی, رضا; علاء نوشهر, فاطمه; هدایت  ایوریق, نعمت; سیف دواتی, جمال

همایش سردبیران نشریات علمی دانشگاه آزاد اسلامی

سامانه یکپارچه نشریات علمی دانشگاه آزاد اسلامی

تعداد نشریات	418
تعداد شماره‌ها	10,013
تعداد مقالات	83,708
تعداد مشاهده مقاله	79,561,618
تعداد دریافت فایل اصل مقاله	56,269,017

مطالعه تأثیر طول بلوک‌های هاپلوتیپی در بهبود صحت پیش بینی ژنومی به کمک روش‌های بیزی در گوسفند DOR: 20.1001.1.17359880.1400.14.2.2.1

مجله پلاسما و نشانگرهای زیستی

دوره 14، شماره 2 - شماره پیاپی 53، اردیبهشت 1400، صفحه 25-36 اصل مقاله (1.01 M)

نوع مقاله: مقاله پژوهشی

نویسندگان

رضا سید شریفی^* ¹؛ فاطمه علاء نوشهر²؛ نعمت هدایت ایوریق³؛ جمال سیف دواتی⁴

¹دانشگاه محقق اردبیلی

²فارغ التحصیل دکتری اصلاح نژاد دام دانشگاه تبریز

³عضو هیات علمی، گروه علوم دامی، دانشکده کشاورزی، دانشگاه محقق اردبیلی

⁴گروه علوم دامی، دانشکده کشاورزی و منابع طبیعی، دانشگاه محقق اردبیلی، اردبیل، ایران

چکیده

زمینه و هدف: عدم تعادل پیوستگی(LD) و طرح ساختار بلوک‌های هاپلوتیپ سطح جمعیت پارامترهایی هستند که برای مدیریت مطالعات گسترده ژنومی(GWAS) و درک ماهیت رابطه غیر خطی بین فنوتیپ‌ها و ژنوتیپها مفید هستند. در مقایسه با چند شکلی تک نوکلئوتیدی(SNp )، استفاده از آللهای هاپلوتیپ در پیشبینی ژنومی و بهبود صحت پیش بینی کارآمدتر هستند. اما میزان افزایش صحت به چگونگی طراحی بلوکهای هاپلوتیپ بستگی دارد. این مطالعه با هدف آزمون اندازه بهینه برای طول هاپلوتیپ در پیش بینیهای ژنومی صورت گرفت.
روش کار: در این مطالعه آللهای هاپلوتیپ با توجه به آللهای SNp در بلوکهای kb 125، kb 250، kb 500 و Mb 1 تعریف و آللهای هاپلوتیپ با فرکانسهای کمتر از 1، 5/2، 5 یا 10 درصد حذف شدند. از دو روش بیزA و بیزB برای پیش بینی اثرات ژنومیSNp ها و هاپلوتیپها در سه صفت با سه سطح وراثتپذیری(تولید شیر (1/0=h2)، وزن لاشه (3/0=h2) و وزن بدن در بلوغ=h2) 45/0)استفاده شد.
یافته ها: بیشترین صحت پیش‌بینی ژنومی در صفت وزن بدن در زمان بلوغ توسط روش بیزB(652/0) در طول بلوک هاپلوتیپی kb 250 و کمترین توسط روش بیزA در صفت تولید شیر(407/0) در طول بلوک هاپلوتیپی Mb 1 حاصل گردید. بلوکهای هاپلوتیپی به طول kb 250 با آستانه فرکانس 1 درصد، بالاترین میزان صحت پیشبینی ژنومی را ارائه دادند. در مقایسه دو روش بیزA و بیزB، روش بیزB صحت برآورد بالاتری هم در مدلهای بر پایه SNp و هم بر پایه آللهای هاپلوتیپ ارائه داد.
نتیجهگیری: قرار دادن آللهای هاپلوتیپ به جایSNp ها در مدل آماری، درصورت تعریف مناسب طول هاپلوتیپ، سبب بهبود صحت پیشبینی ژنومی میشود.

کلیدواژه‌ها

مطالعات گسترده ژنومی؛ عدم تعادل پیوستگی؛ بلوک های هاپلوتیپ؛ SNP؛ بیزA؛ بیزB

اصل مقاله

مقدمه

دسترسی به ژنوتیپ های چند شکلی تک نوکلئوتیدی(SNP) امکان تخمین ارزش های اصلاحی را با صحت بالاتر در سنین جوانی نسبت به ارزش های اصلاحی بر اساس میانگین والدین فراهم ساخته است(22). پیش بینی ژنومی به طور معمول با استفاده از متغیرهایی که تراکم آلل های SNP را نشان می دهند با اتکا به عدم تعادل پیوستگی(LD) بینSNP ها و جایگاه صفات کمی(QTL) برای تخمین اثرات QTL اجرا می شود(16، 11). جمعیت دام ها معمولاً از تعداد زیادی برادر و خواهر ناتنی تشکیل می شود. این ساختار جمعیتی به ما امکان می دهد تا هاپلوتیپ‌ها به طور دقیق و سریع بازسازی شوند(6). یک بلوک هاپلوتیپ ناحیه ای از ژنوم است و مجموعه ای از نشانگرهای ژنتیکی مجاور را تشکیل میدهد(به عنوان مثال SNP ها) که آلل های فازی آن ها احتمالاً با هم به ارث می رسند. چنان چه میزان LD بین آلل های هاپلوتیپ و QTL درون بلوک هاپلوتیپی بیشتر از LD بین آلل های SNP افراد و QTL باشد، پیش بینی می شود. صحت پیش بینی های ژنومی حاصل از آلل های هاپلوتیپ نسبت به آلل هایSNP، بیشتر است. صحت پیش بینی مدل های هاپلوتیپ تحت تأثیر روش استفاده شده در تقسیم ژنوم در بلوک های هاپلوتیپی هم در سطح داده های شبیه سازی شده(24،25) و هم سطح داده های واقعی قرار دارد(13). انتخاب طول مطلوب هاپلوتیپ به مدل سازی مناسبSNP ها و-QTL ها بستگی دارد. تغییر طول هاپلوتیپ ها می تواند در مدل سازی LD بین SNPها و QTL کمک کننده باشد. از سویی دیگر، چنان چه شباهت هاپلوتیپ ها اساس تعیین روابط خویشاوندی باشد، افزایش تعداد آلل های هاپلوتیپ منجر به کاهش روابط خویشاوندی در هر قطعه می گردد. استفاده از قطعات کوتاه هاپلوتیپ می تواند روابط خویشاوندی بسیار دور را هم در ماتریس حفظ کند، اما این امکان نیز وجود دارد که با نادیده گرفتنLD، فازهای مختلفی را بینSNPها و QTL ایجاد کند. طول مطلوب هاپلوتیپ می تواند میزان روابط خویشاوندی دور و قدیمی شجره را در برابر خطاهایLD که بینSNPها و QTLها در کل جمعیت ممکن است رخ دهد، متعادل سازد(16). کیابانو و همکاران دریافتند که استفاده از آلل های هاپلوتیپ به جای SNPها، سبب افزایش صحت پیش بینی ژنومی در هنگام اجرای مدل بیزی مختلط می شود(4). در مدل بیزA اطلاعات تمام نشانگرها به طور هم زمان وارد شده و فرض می شود که اثرات نشانگر مستقل بوده و هر نشانگر واریانس خاص خود را دارد و انتظار نمی رود که تمام مناطق ژنومی با فنوتیپ مرتبط باشند. در مدل بیزB پارامتر π تعریف شده و اثرات نشانگر از توزیع مختلطی نمونه گیری می‌شود(17)، به موجب آن اثرات تقریباً π-1 نشانگر در هر تکرار از یک زنجیره مارکوف با همان فرضیات مدل بیزA نمونه برداری شده و بقیه اثرات صفر در نظر گرفته می گردند(17). موویسن و همکاران در سال 2001 پیشبینی کردند که اگر زمانی تکنولوژی پیشرفت نماید و هزینه های ژنوتیپ کردن کاهش یابد، می توانند تعداد زیادی نشانگر که روی کل ژنوم پراکنده شده‌اند را به طور هم زمان در حیوانات ژنوتیپ کرد و در نتیجه تمام جایگاه های مؤثر بر یک صفت را شناسایی و با برآورد اثرات هر یک از نشانگرها، ارزش اصلاحی حیوانات را تنها از روی اطلاعات نشانگری و بدون نیاز به اطلاعات فنوتیپی آن ها برآورد نمود که آن را ارزش اصلاحی ژنومی(GEBV) نامیدند(17). برای برآورد ارزش های اصلاحی در انتخاب ژنومی، دو دیدگاه ارائه شده است. ابتدا فرض بر این است که تمامی SNPها بر واریانس صفت مؤثر بوده و صفت دارای مدل ژنتیکی نامحدود می باشد روش بهترین پیش بینی کننده نااریب خطی ژنومی (GBLUP) بر پایه این دیدگاه طراحی شده است. در دیدگاه دوم فرض بر آن است که تنها برخی از SNPها بر صفت تأثیر داشته و صفت دارای مدل ژنتیکی ژن های عمده اثر می باشد. بر پایه این دیدگاه برخی روش های بیزی مانند بیزB، بیزC، بیز LASSO بنا نهاده شده اند(17). از عوامل مؤثر بر صحت پیش بینی ارزش های اصلاحی ژنومیک می توان به وراثت پذیری صفت، تعداد افراد و نسل های جمعیت مرجع و تأیید، نوع و تراکم نشانگرها، معماری ژنتیکی صفت کمی و روش استفاده شده در پیش بینی ارزش های اصلاحی ژنومیک اشاره کرد. در بین روش های بیزی روش بیزB و بیز LASSO در حالت توزیع گاما، تأثیرات ژنی بهترین عملکرد را نشان دادند، اما تفاوت آن ها از نظر آماری معنی دار نبود. یکی از ضعف های روش GBLUP این است که فرض می شود کلیه SNPها روی صفت مؤثر بوده و برای همه نشانگرها سهم یکسانی در پیش بینی ارزش اصلاحی در نظر گرفته می شود. در حالی که در روش های بیزی بر حسب توزیع پیشین، وزن های متفاوتی به SNPها اختصاص داده میشود(5). هدف از این مطالعه ارزیابی صحت، اریب و زمان محاسباتی روش های پیش بینی ژنومی بیزA و بیزB متناسب با متغیرهای آلل‌های هاپلوتیپ با طول ثابت در مقایسه با آلل های SNP است. آلل های هاپلوتیپ با طول 125 کیلوبایت تا 1 مگابایت، با آستانه فراوانی آللی متفاوت، از 1 تا 10 درصد، با استفاده از مدل های بیزA و بیزB به کار گرفته شدند. هم چنین این فرضیه که آیا اندازه بهینه ای برای طول هاپلوتیپ در پیش بینی های ژنومی وجود دارد، مورد آزمون قرار گرفت.

مواد و روشها

شبیه سازی جمعیت پایه

جمعیت پایه با استفاده از نرم افزار QMSim بر اساس روند پیش رونده در زمان شبیه سازی شدند(19). 100 دام دیپلوئید گوسفند نژاد دو منظوره گوشتی-شیری(دورست)، شامل50 نر و 50 ماده، برای جمعیت پایه(نسل صفر) شبیه‌سازی گردیدند(19). گامت های والدی با فرض عدم تعادل پیوستگی(LD) بر اساس نقشه یابی هالدان گامت های نوترکیب شبیه سازی و به طور تصادفی برای ایجاد یک فرد باهم ترکیب شدند(12). ساختار نسل اول تا نسل 50 با جفت گیری تصادفی دنبال شده تا جمعیت های عدم تعادل پیوستگی ایجاد شود. برای هر نسل،LD با استفاده از آماره r2(رابطه 1) اندازه گیری و به عنوان میانگین LD تمام SNP ها بود. پس از جمعیت LD ده نسل دیگر(51 تا 60) ساخته شد(20). جمعیت پایه شامل 1000 حیوان غیر خویشاوند(500 نر و 500 ماده) بود. در این مطالعه، نسل 51 و 52 به عنوان جمعیت مرجع و نسل های دیگر(53 تا 60) به عنوان جمعیت تأیید در نظر گرفته شدند.

شبیهسازی ژنوم

حیوانات با استفاده از آرایه نانویی شامل نشانگر با تراکم بالای گوسفندی(K50) برای شناسایی دقیق مکانهای ژنی مؤثر بر صفات هدف، که دارای SNP 48583 بود، ژنوتیپ شدند. این SNPها روی 3 کروموزوم پراکنده و طول هر کروموزوم 200 سانتی مورگان در نظر گرفته شد. برای فیلتراسیون داده های ژنوتایپینگ از معیارهای فراوانی ژنوتایپینگ نمونه ها، نرخ ژنوتایپینگ نشانگرها در هر نمونه و حداقل فراوانی آللی(MAF) استفاده شد(14). در ابتدا نشانگرهایی که نرخ تعیین ژنوتیپ شده آن ها در نمونه ها کمتر از 95 درصد بود شناسایی و حذف گردیدند، سپسSNP هایی با حداقل فراوانی آللی(MAF) کمتر از 5 درصد حذف شدند. چنانچه فراوانی آللی نشانگرها کمتر از 5 درصد باشد، منجر به کمتر برآورد شدن آماره r2 برای میزان عدم تعادل پیوستگی بین جفت نشانگرها می شود. QTL دو آللی با توزیع گاما(4/0 و 66/1) در طول ژنوم با تراکم QTL 2 در هر سانتی مورگان ایجاد شد که در مجموع QTL 500 در سطح ژنوم توزیع شد. نرخ جهش SNP ها و QTL ها 10^-5×5/2 به ازاء هر لوکاس در هر نسل فرض شد(20). سه صفت با سه سطح وراثت پذیری پایین: 1/0(تولید شیر(MILK))، متوسط: 3/0(وزن لاشه(CARCASS)) و بالا: 45/0(وزن بدن در زمان بلوغ (MATURE)) در گوسفند شبیه سازی گردید.

عدم تعادل پیوستگی

میانگین LD با جفت SNP های مجاور و میانگین LD در سراسر کروموزوم برای هر کروموزوم برآورد شد. از نرم افزار v4.2 Haploview نیز برای شناسایی بلوک های هاپلوتیپ موجود در هر کروموزوم استفاده گردید. تنوع هاپلوتیپ به صورت تعریف می شود که fi فراوانی iامین هاپلوتیپ را نشان می دهد. چنان چه آستانه 95 درصدی اطمینانD´ بالاتر از 98/0 و حد پایین آن بالاتر از 7/0 باشد، دو SNP در وضعیت LD قوی در نظر گرفته می شوند. جهت محاسبه مقدار LD در بین نشانگرها از آماره r2 استفاده شد (15).

رابطه 1:

که در آن D = f (AB) −f (A) ×f (B) ، وf (AB) ، f (A) ، f (a) ، f (B) ، f (b) به ترتیب فراوانی مشاهده شده برای هاپلوتیپ هایAB ، A ، a ، B ، b می باشد.

ساختار بلوکهای هاپلوتیپ

برای تشکیل فاز هاپلوتیپ از یک مدل مارکوف مخفی از نرم افزار Beagle v4.1 استفاده شد(2). سپس بلوک های هاپلوتیپ به طور جداگانه با استفاده از نرم افزار PLINK v1.9 طبق روش Haploview v4.1 (1) بر اساس تخمین D'برای ترکیب جفت SNPها در طول کروموزوم تعریف شدند(3). با استفاده از مقادیر پیش فرض برای بلوک ها، یک بلوک هاپلوتیپ به عنوان منطقهای تعریف می شود که 95 درصد از جفت های SNP میزان LD بالایی را نشان می دهند(8). از الگوریتم GLM و نرم افزار Plink برای تولید ماتریس هاپلوتیپی استفاده شد. هاپلوتیپ ها با چهار طول مختلف(125 کیلو بایت، 250 کیلو بایت، 500 کیلو بایت و 1 مگابایت) ساخته و آلل هاپلوتیپ‌های نادر بر اساس فراوانی آن ها در جمعیت مرجع در چهار آستانه فراوانی مختلف 1، 5/2، 5 و 10 درصد حذف شدند(14).

تحلیل آماری

از مدل GEBV برای محاسبه مجموع تمام اثرات نشانگر در کل ژنوم استفاده گردید(17):

رابطه 2:

که در آن l تعداد لوکاس گسترده در ژنوم، x_j نشان دهنده ژنوتیپ فردی در j امین لوکاس با ارزش 0، 1 و 2 می باشد، β_j اثر جایگزینی آلل نشانگر در j امین لوکاس است.

روش بیزA

در روش بیزA فرض می شود که تمامی SNPها دارای اثر، حتی جزئی بوده و تعدادی از SNPها در عدم تعادل پیوستگی با QTLهایی با اثرات متوسط تا بزرگ قرار دارند. اثرات SNPها از توزیع نرمال با واریانس جداگانه برای هر SNP از توزیع کای دو معکوس، نمونه گیری میشود. برای به کار بردن این روش از معادله فوق استفاده شد(17):

رابطه 3:

که در آن y بردار N×1 از YD است، μ اثر میانگین، X ماتریس وقوع مقادیر جفت هتروزیس‌ها، h بردار اثرات هتروزیس، k تعداد متغیرهای SNP یا آلل های هاپلوتیپ، Z_j بردار N×1 شماره آللی SNPها(0، 1 و 2) یا آلل های هاپلوتیپی و e بردار N×1 اثرات باقی مانده با میانگین صفر و واریانس δ_e^2 است. در این مدل توزیع شرطی در نظر گرفته شده برای تأثیرات نشانگری توزیع t به صورت:

که در آن dfb و Sb به ترتیب درجات آزادی و پارامتر مقیاس و x^(-2) (〖df〗_b│S_b ) توزیع کای اسکور مقیاس دار معکوس است.

روش بیزB

در این روش اکثر SNPهای موجود در منطقه ژنومی QTLای نداشته و بنابراین اثرات آن ها برابر با صفر می باشد، در حالی که تعداد اندکی از آن ها(π-1) در عدم تعادل پیوستگی با QTL قرار داشته و دارای اثر می باشند. در نتیجه اثرات غیرصفر در عدم تعادل پیوستگی بالایی با QTL قرار دارند. بیز B تحت معادله فوق اجرا شد(17):

رابطه 4:

متغیرها در مدل بیزA تعریف شدند به جز α_j نشاندهنده اثرات صفر در مدل است.از نرم افزار GenSel v4.73R برای پیش بینی ژنومی با نهادن متغیرهای آلل SNP یا هاپلوتیپ در مدل بیزA و بیزB استفاده شد(9). در محیط نرم افزار R برای هر تحلیل یک زنجیره مارکوف مونت کارلو به طول 41 هزار چرخه شامل 10 هزار چرخه اولیه جهت گرم شدن و 200 هزار چرخه اصلی به کار رفت که در هر 5 دور یک بار نتایج ذخیره و در پایان نتایج، 40 هزار چرخه ذخیره گردید. علاوه بر صحت و اریب مدل، تعداد اثرات تصادفی(SNP یا هاپلوتیپ) در مدل گنجانده و زمان محاسباتی نیز اندازه گیری شد.

نتایج

میانگین عدم تعادل پیوستگی

در مطالعه حاضر، میانگین LD محاسبه شده بین تمامیSNP ها 027/0 ± 201/0 (r2) به دست آمد. نتایج نشان می دهد که 89 درصد مقدار LD مورد انتظار در این شبیه سازی حاصل شده است. مقدار LD مورد انتظار بر اساس مطالعه اسوید 210/0 گزارش شده است(22).

تأثیر تراکم نشان گری بر صحت پیشبینی ژنومی

پس از کنترل کیفیت، 25 رأس دام از مطالعه حذف و 175 رأس گوسفند برای تجزیه و تحلیل باقی ماندند. علاوه بر این، SNP 1232 با نرخ حذف کمتر از 95 درصد و SNP 4698 با MAF کمتر از 05/0 حذف شدند. در مجموع SNP 42653 از این فیلترهای کنترل کیفیت عبور کرده و در مجموعه داده ها حفظ شدند. تعداد SNP ها در هر بلوک هاپلوتیپی در ژنوم متفاوت بود(جدول 2). در تمام بلوک های هاپلوتیپی حداقل تعداد SNP ها در هر بلوک هاپلوتیپی 1 محاسبه شد. میانگین تعداد SNP ها در هر بلوک هاپلوتیپی بین 2 تا 32 و حداکثر از 6 تا 58 بود. نتایج نشان داد که با افزایش فاصله بین نشانگرها، سطح LD کاهش می یابد.

جدول 1- خلاصه ساختار جمعیت و پارامترهای شبیه سازی

ارزش	پارامتر های ژنومی
3	تعداد کروموزم
600cM	طول ژنوم
1200	QTL تعداد
48583	تعداد نشانگر
5/2× ^5- 10	نرخ جهش QTL
^3-10×5/2	نرخ جهش SNP
گاما (66/1=α و 4/0=β)	اثر توزیع QTL
تصادفی	جایگاه QTL در ژنوم
یکسان	جایگاه SNP در ژنوم
ارزش	پارامترهای صفت
1/0، 3/0 و 45/0	وراثت پذیری
1	واریانس فنوتیپی
0	صفات محدود به جنس
10	تعداد نسل
تصادفی	نوع تلاقی
همه حیوانات نسل 51 و 52	جمعیت مرجع
همه حیوانات نسل 53 تا 60	جمعیت تأیید

جدول 2- میانگین و حداکثر تعدادSNPها بر اساس طول بلوک هاپلوتیپی

طول بلوک هاپلوتیپی	تعداد بلوک هاپلوتیپی	تعداد SNP در هر بلوک هاپلوتیپی
طول بلوک هاپلوتیپی	تعداد بلوک هاپلوتیپی	میانگین	حداکثر
125 kb	18523	2	6
250 kb	11421	5	11
500 kb	7341	9	18
1 Mb	3477	17	35
2 Mb	1891	32	58

صحت و اریب پیشبینی

صحت پیش بینی و اریب مدل بیزA و بیزB در جدول 3 و نمودار 1 آورده شده است. صفت وزن در بلوغ(MATURE) با وراثت پذیری بالا دارای بالاترین صحت پیش بینی نسبت به سه صفت مورد مطالعه بود، به دنبال آن صفات کیفیت لاشه(CARCASS) و تولید شیر(MILK)، مطابق با سطح وراثت پذیری خود قرار داشتند. مدل های هاپلوتیپی نسبت به مدل بر پایهSNP از صحت بالاتری برخوردار بوده و میزان اریب مشابه یا پائینی داشتند. افزایش طول بلوک هاپلوتیپی یا آستانه فراوانی آلل هاپلوتیپ سبب کاهش صحت و افزایش اریب مدل هاپلوتیپی می شود. با این حال مدل با طول بلوک هاپلوتیپی250 کیلوبایت و فیلتر فراوانی آلل هاپلوتیپی 1 درصد، در بین طول بلوک های مورد مطالعه بیشترین صحت را ارائه داد. افزایش سطح آستانه فراوانی آللی تأثیر منفی بیشتری بر صحت و اریب برای طول بلوک های هاپلوتیپی بلند(Mb1 - 500 کیلو بایت) نسبت به بلوک های هاپلوتیپی کوتاه تر(250 - 125 کیلوبایت) داشت. اریب پیش بینی برای مدل هایی که از بلوک های هاپلوتیپی کوتاه تر استفاده می کنند، مشابه مدل SNP بود، در حالی که مدل هایی که از بلوک های هاپلوتیپی بلندتر استفاده می کردند، معمولاً اریب بیشتری نسبت به مدل بر پایه SNP داشتند(نمودار 1).

جدول 3- صحت و اریب پیش بینی ژنومی سه صفت تولید شیر، وزن لاشه و وزن بدن در بلوغ در چهار سطح بلوک هاپلوتیپ

وراثت پذیری	طول بلوک هاپلوتیپ	صحت پیش بینی		اریب پیش بینی
وراثت پذیری	طول بلوک هاپلوتیپ	BayesA	BayesB		BayesA	BayesB
تولید شیر h²=1/0	125kb	(02/0) 429/0	(03/0) 431/0		(02/0) 117/0	(02/0) 115/0
	250kb	(02/0) 439/0	(02/0) 445/0		(01/0) 216/0	(01/0) 214/0
	500kb	(02/0) 424/0	(01/0) 428/0		(02/0) 329/0	(01/0) 326/0
	1Mb	(01/0) 407/0	(01/0) 413/0		(02/0) 415/0	(01/0) 411/0
وزن لاشه h²=3/0	125kb	(01/0) 537/0	(02/0) 541/0		(2/0) 111/0	(01/0) 089/0
	250kb	(01/0) 546/0	(02/0) 552/0		(02/0) 116/0	(01/0) 113/0
	500kb	(02/0) 529/0	(02/0) 535/0		(03/0) 222/0	(01/0) 218/0
	1Mb	(02/0) 518/0	(01/0) 526/0		(01/0) 229/0	(01/0) 224/0
وزن بدن در بلوغ h²=45/0	125kb	(01/0) 641/0	(02/0) 647/0		(01/0) 087/0-	(01/0) 068/0-
	250kb	(01/0) 646/0	(03/0) 652/0		(01/0) 138/0-	(01/0) 119/0-
	500kb	(01/0) 621/0	(01/0) 634/0		(01/0) 299/0-	(01/0) 284/0-
	1Mb	(01/0) 617/0	(01/0) 625/0		(01/0) 381/0-	(03/0) 379/0-

شکل 1- صحت و اریب پیش بینی ژنومی صفات تولید شیر(a)، وزن لاشه(b) و وزن بدن در بلوغ(c) در طول های مختلف بلوک های هاپلوتیپ و آستانه فراوانی آللی.

تأثیر سطوح مختلف وراثت پذیری بر صحت پیشبینی ژنومی

با افزایش مقادیر وراثت پذیری تحت هر مدلی، میانگین صحت ژنومی افزایش یافت. نتایج نشان داد زمانی که وراثت پذیری یک صفت بالاتر باشد، صحت برآورد شده ارزش اصلاحی ژنومی بالاتر خواهد بود. مدل های هاپلوتیپی صحت ژنومی بیشتری نسبت به مدل SNP داشتند. بین مدل های هاپلوتیپی صحت مدل بر پایه طول بلوک هاپلوتیپی 250 کیلو بایتی با فراوانی آللی 1 درصد بیشتر از صحت مدل بر پایه طول بلوک هاپلوتیپی 125 کیلو بایت با فراوانی آللی 1 درصد بود(نمودار 2). در این مطالعه، بهترین پیشرفت در صحت پیش بینی ژنومی با استفاده از روش بیز B با سطوح مختلف وراثت پذیری در طول های مختلف بلوک هاپلوتیپی در بین صفات مشاهده شد.

نمودار 2- صحت پیش بینی ژنومی مدل های بر پایه SNP و هاپلوتیپ در سطوح مختلف وراثت پذیری

بحث و نتیجه گیری

مدل های هاپلوتیپ

توانایی یک مدل هاپلوتیپ برای بهبود صحت پیش بینی ژنومی به پیش فرض های قبلی مدل، روش مورد استفاده برای تعریف بلوک های هاپلوتیپی و آلل های هاپلوتیپ، تراکم SNP و تعریف جمعیت مرجع و تأیید بستگی دارد. ویلامسن و همکاران طول بهینه بلوک های هاپلوتیپ را برای صفات شبیه سازی شده با وراثت پذیری 02/0 تا 3/0 ارزیابی کرده و دریافتند که بلوک های هاپلوتیپی به طول 1 سانتی مورگان نتایج بهتری را بین وراثت پذیری های مختلف ارائه می دهد(25). صحت پیش بینی مدل های هاپلوتیپ که از طول بلوک هاپلوتیپ 500 کیلوبایت یا کوتاه تر استفاده می کنند(به طور متوسط کمتر از SNP 8 در هر بلوک هاپلوتیپ) به طور کلی دارای صحت پیش بینی بالاتری نسبت به مدل SNP هستند، به ویژه هنگامی که آلل های هاپلوتیپ با فرکانس کمتر از 1 درصد از جمعیت مرجع حذف شوند. ویلامسن و همکاران توسط روش شبیهسازی نشان دادند که تعداد مطلوب SNPها در یک بلوک هاپلوتیپ به فاصله بین نشانگرها، میزان LD و ساختار جمعیت بستگی دارد. مدلهای بلوک هاپلوتیپ 250 کیلو بایتی با فروانی آللی 1 درصد، بهترین عملکرد را در بین چهار بلوک هاپلوتیپ بررسی شده در این مطالعه داشتند اما اجرای آن ها نسبت به مدل های SNP بسیار زمان بر بود زیرا تقریباً در این حالت، متغیرها دو برابر می شوند(25). آن ها گزارش کردند که با افزایش طول بلوک هاپلوتیپ، تعداد آلل های نادر هاپلوتیپ افزایش می یابد، اما ممکن است مشاهدات کافی برای تخمین اثرات آن ها با صحت مناسب وجود نداشته باشد. بنابراین، طراحی هاپلوتیپ ها با استفاده از اطلاعات LD ممکن است برای پیش بینی ژنومی مفیدتر از استفاده بلوک های هاپلوتیپ با طول ثابت باشد، اما از نظر محاسباتی اجرای آن ها به زمان بیشتری نیاز دارد.

تراکمSNP

افزایش تراکم SNP توانایی تمایز آلل های هاپلوتیپ با تفکیک توالی را در یک بلوک هاپلوتیپ تحت تأثیر قرار می دهد: در سطح توالی، همه آلل های هاپلوتیپ واقعی در مجموعه داده ها از نظر تئوری قادر به شناسایی هستند. در حالیکه در تراکم پایین تر، یک آلل هاپلوتیپ مشخص ممکن است نشان دهنده دو یا چند آلل هاپلوتیپ واقعی باشد. این بر توانایی یک مدل برای تخمین دقیق BV یک حیوان برای آن بلوک هاپلوتیپ تأثیر میگذارد، زیرا تأثیر آلل های هاپلوتیپ شناسایی شده علاوه بر خطای پیش بینی، میانگین وزنی اثرات آلل های اصلی هاپلوتیپ واقعی خواهد بود. تلفیق ژنوتیپ در جهش های علی در هاپلوتیپ ها امکان تخمین دقیق تری از اثرات هاپلوتیپ را در مقایسه با نداشتن جهش های علی در هاپلوتیپ فراهم کرده و توانایی تشخیص اثرات کوتاه مدت بین لوکاسهای موجود در همان بلوک هاپلوتیپ را بهبود می بخشد. بنابر این، افزایش تراکم SNP پتانسیل بهبود صحت پیش بینی ژنومی را هنگام استفاده از مدل های هاپلوتیپ دارد. با این حال، افزایش تراکم SNP باعث افزایش تعداد آللهای هاپلوتیپ شناسایی شده می شود که سبب افزایش تعداد آلل های هاپلوتیپ نادر در یک لوکاس شده و اثر این آلل ها را به سمت صفر کاهش می دهد(7). هنگام استفاده از تراکم SNP بالا در ایجاد هاپلوتیپ ها، تعداد متغیرهای لازم برای تخمین اثرات اغلب بیشتر از تعداد SNP ها است، که سبب افزایش زمان محاسباتی می شود. تعداد متغیرهایی که نیاز به تخمین دارند، می توانند با حذف SNP ها پیش از تولید آلل های هاپلوتیپ کاهش یابند(4). مطالعه حاضر به وضوح نشان داد که اندازه نمونه و انتخاب SNP تأثیر قابل توجهی بر تعداد بلوک ها و تعداد کل SNP های استنباط شده از یک نمونه جمعیت دارد. زمانی که افراد بیشتری را در نمونه خود گنجانده شود، هم تعداد بلوک ها و هم تعداد کلSNP ها افزایش می یابد. علاوه بر این، نتایج ما نشان می دهد که برای نتیجهگیری معتبر در مورد تعداد بلوک ها وSNP ها، بایستی تعداد نشانگر SNP بیشتری در این مناطق گنجانده شود. تعداد SNP مورد نیاز برای استنباط قابل اعتماد در ساختارهای هاپلوتیپ ممکن است تابعی از ناحیه و جمعیت تحت مطالعه باشد. سولبرگ و همکاران گزارش کردند که با افزایش تراکم نشانگر در هر مورگان، صحت ژنومی افزایش می یابد(21). افزایش تعداد نشانگرها باعث افزایش LD بین ژنها و نشانگرها شده و بنابراین صحت ارزیابی های ژنومی را افزایش می دهد.

اثر وراثت پذیری

در مطالعه حاضر با افزایش تراکم SNP و طول بلوک هاپلوتیپ از 125 کیلوبایت به 1 مگابایت صحت ژنومی افزایش می یابد. با افزایش تراکم SNP و طول بلوک هاپلوتیپ، می توان صحت مقادیر پیش بینی ژنومی را افزایش داد تا عدم تعادل پیوستگی بین نشانگرها، بلوک هاپلوتیپ وQTL ها افزایش یابد. در صفات با وراثتپذیری پایین تر، ارتباط بین فنوتیپ و ارزش ژنتیکی کمتر خواهد بود و برآورد اثرات SNP را می توان با صحت کمتری انجام داد(11). نتایج این مطالعه با نتایج سولبرگ و همکاران مطابقت داشت(21). نیلسون و همکاران گزارش دادند که با افزایش وراثت پذیری صفت از 2/0 به 4/0، صحت ارزیابی ژنومی حدود 4 درصد افزایش مییابد. زمانی که وراثت پذیری صفت بالا باشد، ارزش فنوتیپی فردی به ارزش ژنتیکی نزدیک تر شده و در نتیجه ارزش اصلاحی ژنومی با صحت بیشتری برآورد میشود(25، 18، 10).

زمان محاسبات کامپیوتری

مدل هایی که بر اساس آلل های هاپلوتیپ اجرا میشوند معمولاً تعداد بیشتری متغیر را نسبت به مدل های بر پایه SNP استفاده کرده و از این رو زمان بیشتری برای محاسبات لازم دارند. تعداد متغیرهای تصادفی ورودی در مدل بیزA، بدون احتساب زمان طراحی مدل و فیلتر آلل هاپلوتیپ بر زمان محاسباتی تأثیر مستقیم دارد. طراحی 2 مگابایت آلل هاپلوتیپ با آستانه فراوانی 10 درصد تنها سبب تولید 850-700 آلل هاپلوتیپ می شود که دارای کمترین مقدار صحت پیش بینی در بین مدل ها بود. زمان محاسباتی با افزایش تعداد آلل های هاپلوتیپ افزایش مییابد. اجرای دقیق ترین مدل برای هر سه صفت مورد مطالعه با استفاده از مدل هاپلوتیپی نسبت به مدل SNP تقریباً دو برابر زمان محاسباتی بیشتری نیاز داشت، زیرا تعداد متغیرهای آن نیز دو برابر شده است. سریع ترین مدلها بسته به صفت مورد مطالعه بین 20 تا 30 دقیقه اجرا شد، اما این امر به شدت با کاهش صحت پیش بینی ژنومی و افزایش اریب همراه بود. بیزB در مقایسه با بیزA زمان محاسباتی کمتری داشت.آلل های هاپلوتیپ با طول ثابت در مقابل کاربردSNP ها می توانند صحت پیش بینی ژنومی را افزایش دهند. بلوک هاپلوتیپ به طول 250 کیلوبایت با آستانه فراوانی آللی 1 درصد منجر به بالاترین صحت در پیش بینی ژنومی شد. طول هاپلوتیپ و فیلتر بر اساس فراوانی آللی هاپلوتیپ تأثیر زیادی در صحت پیش بینی ژنومی دارد. فیلتر فراوانی آلل هاپلوتیپ بالاتر(10 درصد)، تمایل به کاهش صحت پیش بینی ژنومی به ویژه هنگامی که طول هاپلو بلوک ها بزرگ تر بودند، دارد. به منظور نتیجه گیری معتبر در مورد ساختار بلوک های هاپلوتیپ، به جمعیت نسبتاً بزرگ با سطح تراکم بالای نشانگر نیاز دارد.

مراجع

1.Barrett, JC., Fry, B., Maller, J., Daly, MJ. (2005). Haploview: analysis and visualization of LD and haplotype maps. Bioinformatics, 21; 263–265.

2.Browning, BL., Browning, SR. (2009). A unified approach to genotype imputation and haplotype-phase inference for large data sets of trios and unrelated individuals. Journal of Human Genetics, 84; 210–23.

3.Chang, CC., Chow, CC., Tellier, LCAM., Vattikuti, S., Purcell, SM., Lee, JJ. (2015). Second-generation PLINK: rising to the challenge of larger and richer datasets. Gigascience, 4; 7.

4.Cuyabano, BCD., Su, G., Rosa, GJM., Lund, MS., and Gianola, D. (2015). Bootstrap study of genome-enabled prediction reliabilities using haplotype blocks across Nordic Red cattle breeds. Journal of Dairy Science, 98(10); 7351-7363.

5.De Los Campos, G., Hickey, JM., Pong-Wong, R., Daetwyler, HD., Calus, MP. (2013). Whole genome regression and prediction methods applied to plant and animal breeding. Genetics, 193; 327-45.

6.Ferdosi, MH., Henshall, J. and Tier, B. (2016). Study of the optimum haplotype length to build genomic relationship matrices. Genetics, 48(1); 75.

7.Gianola, D. (2013). Priors in Whole-Genome Regression: The Bayesian Alphabet Returns. Genetics, 194(3); 573-596.

8.Gabriel, SB., Schaffner, SF., Nguyen, H., Moore, JM., Roy J., Blumenstiel, B. (2002). The structure of haplotype blocks in the human genome. Science, 296; 2225–9.

9.Garrick, D., Fernando, R. (2013). Implementing a QTL detection study (GWAS) using genomic prediction methodology, genome-wide association studies and genomic prediction. Springer, P; 275-298.

10.Goddard, ME. (2008). Genomic selection: prediction of accuracy and maximization of long term response. Genetics, 136(2); 245–257.

11.Habier, D., Fernando, RL., Dekkers, JCM. (2007). The impact of genetic relationship information on genome-assisted breeding values. Genetics, 177(4); 2389-2397.

12.Haldane, JBS. (1919). The combination of linkage values and the calculation of distances between the loci of linked factors. Genetics, 8; 299-309.

13.Hayes, BJ., Chamberlain, AJ., McPartlan, H., Macleod, I., Sethuraman, L., Goddard, ME. (2007). Accuracy of marker-assisted selection with single markers and marker haplotypes in cattle. Genetics, 89(4); 215-220.

14.Hess, M., Druet, T., Hees, A., Garrick, D. (2017). Fixed length haplotypes can improve genomic prediction accuracy in an admixed dairy cattle population. Genetics Selection Evolution, 49; 54.

15.Hill, WG., Robertson, A. (1968). Linkage disequilibrium in finite populations. Theor. Appl. Genetics, 38; 226-231.

16.Meuwissen, T., Hayes, B., Goddard, M. (2013). Accelerating improvement of livestock with genomic selection. In: H. A. Lewin and R. M. Roberts, editors, Annual Review of Animal Biosciences, Vol 1. Annual Review of Animal Biosciences No. 1. Annual Reviews, Palo Alto, p; 221-237.

17.Meuwissen, THE., Hayes, BJ., Goddard, ME. (2001). Prediction of total genetic value using genome-wide dense marker maps. Genetics, 157(4); 1819–1829.

18.Nielsen, HM., Sonesson, AK., Yazdi H., Meuwissen, THE. (2009). Aquaculture, 289; 259–264.

19.Sargolzaei, M., Schenkel, FS. (2009). QMSim: a large-scale genome simulator for livestock. Bioinformatics, 25; 680-681.

20.Shirali, M., Miraei-Ashtiani, SR., Pakdel, A., Haley, C., Navarro, P., Pong-Wong, R. (2015). A comparison of the sensitivity of the BayesC and Genomic Best Linear Unbiased Prediction (GBLUP) methods of estimating genomic breeding values under different Quantitative Trait Locus (QTL) model assumptions. Iranian Journal of Applied Animal Science, 5(1); 41-46

21.Solberg, TR., Sonesson, AK., Woolliams, JA., Meuwissen, THE. (2008). Genomic selection using different marker types and densities. Journal of Animal Science, 86; 2447-2454.

22.Sved, JA. (1971). Linkage disequilibrium and homozygosity of chromosome segments in finite populations. Bioinformatics, 2; 125-141.

23.VanRaden, PM. (2008). Efficient methods to compute genomic predictions. Journal of Dairy Science, 91(11); 4414-4423.

24.Villumsen, TM., Janss, L. (2009). Bayesian genomic selection: the effect of haplotype length and priors. BMC Proceedings 3 Supp, l(1); S11.

25.Villumsen, TM,. Janss, L., Lund, MS. (2009). The importance of haplotype length and heritability using genomic selection in dairy cattle. Journal of Animal Breeding and Genetics, 126; 3-13.

آمار

تعداد مشاهده مقاله: 274

تعداد دریافت فایل اصل مقاله: 166

سامانه مدیریت نشریات علمی. قدرت گرفته از سیناوب

پیوندهای مفید

اخبار و اعلانات

آمار

مطالعه تأثیر طول بلوک‌های هاپلوتیپی در بهبود صحت پیش بینی ژنومی به کمک روش‌های بیزی در گوسفند DOR: 20.1001.1.17359880.1400.14.2.2.1