ADER 8.1.6/2019
Titlul proiectului: Cercetări privind utilizarea markerilor SNP și formarea unei populații de referință în vederea implementării selecției genomice la taurine
Tipul proiectului: Plan sectorial pentru cercetare-dezvoltare din domeniul agricol şi de dezvoltare rurală al Ministerului Agriculturii și Dezvoltării Rurale, pe anii 2019-2022, "Agricultură şi Dezvoltare Rurală - ADER 2022"
Cod proiect: ADER 8.1.6
Nr. Contract/data: 8.1.6/27.09.2019
Unitatea Finantatoare: Ministerul Agriculturii și Dezvoltării Rurale
Coordonator proiect: Institutul Național de Cercetare-Dezvoltare pentru Biologie și Nutriție Animală- IBNA Balotești
Partener : Stațiunea de Cercetare-Dezvoltare pentru Creșterea Bovinelor Arad
Rezumat:
Din anul 2000 a început dezvoltarea testelor de genotipare pentru un număr mare de polimorfisme ale unei singure nucleotide SNP, iar primul cip comercial de genotipare SNP a fost lansat în decembrie 2007. Peste 15.000 de genotipuri au fost utilizate pentru a determina SNP-uri, care ar trebui să fie utilizate în evaluarea genomică a bovinelor de lapte din Statele Unite ale Americii, SUA. Evaluările genomice ale SUA au fost lansate pentru prima dată în ianuarie 2009 pentru rasele Holstein și Jerseys, în august 2009 pentru Brown Swiss, în aprilie 2013 pentru Ayrshires și în aprilie 2016 pentru Guernseys. Astfel, tematica proiectului vizează studii de selecție genomică la vaci în contextul bio-economic din România. Proiectul își propune investigarea unui număr de 50.000 de SNP-uri în cadrul raselor Bălțată cu Negru Românească, Bălțată Românească și Brună de Maramureș și efectuarea de studii de asociere la nivel genomic, studii GWAS, pentru caracterele importante din punct de vedere economic. Genotiparea cu ajutorul SNP-urilor va genera un set de informații precise despre structura genetică a efectivelor de vaci din România.
Obiective:
Obiective principale:
(a) cu ajutorul controlului oficial al performanțelor să se edifice o bază de date consistentă, coerentă și flexibilă care să cuprindă informații fenotipice (cantitatea de lapte, greutăți corporale, evaluarea exteriorului, informații despre reproducție) și genotipice (polimorfismele SNP-urilor); (b) estimarea efectului SNP-urilor asupra caracterelor evaluate prin cele mai noi metode biometrice;
(c) estimarea componenților de varianță-covarianță care implicit conduc la estimarea parametrilor genetici; identificarea celor mai bune metodologii de analiză biometrică care vor fi folosite la predicția valorii de ameliorare.
Ca obiective secundare ale proiectului amintim:
(i) optimizarea metodelor de măsurare a fenotipurilor;
(ii) optimizarea metodelor alese pentru estimarea parametrilor genetici în funcție de specificul caracterelor (caractere cu heritabilitate mică, caractere care se măsoară repetat în decursul vieții productive ale animalului);
(iii) verificarea SNP-urilor corespunzătoare populațiilor analizate și identificarea densității panelurilor ce urmează a fi folosite la genotipare;
(iv) analiza comparativă a diverselor metode matematice folosite în estimarea valorii de ameliorare genomice.
Derularea activitatilor:
An |
Obiective |
Activitati |
2019 |
Etapa I. Studiu bibliografic privind efectul polimorfismelor markerilor moleculari asupra fenotipurilor ce fac obiectul ameliorării taurinelor și folosirea acestora in selecția genomică. |
Activitatea I.1 Studiu asupra markerilor utilizați în selectia genomica și a metodelor de genotipare. |
Activitatea I.2 Studiu asupra prelucrării datelor obținute în urma genotipării și metodologia GWAS. |
||
Activitatea I.3 Studiu privind utilizarea informației genomice în selecția genomică la taurine |
||
2020 |
Etapa II. Investigarea efectelor markerilor genetici asupra caracterelor ce fac obiectul ameliorării producției de lapte la taurine
|
Activitatea II.1 Colectarea datelor legate de caracterele producției de lapte |
Activitatea II.2 Colectarea probelor biologice |
||
Activitatea II.3 Procesarea datelor fenotipice |
||
Activitatea II.4 Estimarea parametrilor genetici ai caracterelor ce fac obiectul ameliorării producției de lapte |
||
Activitatea II.5 Identificarea și analiza SNP-urilor. |
||
Activitatea II.6 Utilizarea metodologiei Genome-Wide Analisys Signature în detecția semnăturii selecției. |
||
Activitatea II.7 Analiza polimorfismelor SNP asociate cu caractere calitative și cantitative ale producției de lapte la bovine |
||
Activitatea II.8 Estimarea efectului polimorfismelor SNP asupra caracterelor de producție a laptelui la taurine |
||
2021 |
Etapa III Investigarea efectelor markerilor genetici asupra caracterelor ce fac obiectul ameliorării producției de carne la taurine
|
Activitatea III.1 Evaluarea caracterelor morfo-productive la rasele de taurine din România |
Activitatea III.2 Evaluarea non-invazivă cu ultrasunete a producției de carne în carcasă |
||
Activitatea III.3 Estimarea greutății cărnii în carcasă prin ecuații de regresie multiplă |
||
Activitatea III.4 Procesarea datelor fenotipice |
||
Activitatea III.5 Estimarea paramerilor genetici ai caracterelor ce fac obiectul ameliorării producției de carne |
||
Activitatea III.6 Identificarea și analiza SNP-urilor |
||
Activitatea III.7 Utilizarea metodologiei Genome-Wide Analisys Signature în detecția semnăturii selecției. |
||
Activitatea III.8 Analiza polimorfismelor SNP asociate cu caractere calitative si cantitative ale producției de carne la taurine |
||
Activitatea III.9 Estimarea efectului polimorfismelor SNP asupra caracterelor de producție a laptelui la taurine |
||
2022 |
Etapa IV Investigarea efectelor markerilor genetici asupra caracterelor ce fac obiectul ameliorării reproducției și stării de sănătate la taurine
|
Activitatea IV.1 Evaluarea caracterelor legate de reproducție și bunăstare la rasele de taurine din România |
Activitatea IV.2 Procesarea datelor fenotipice |
||
Activitatea IV.3 Estimarea paramerilor genetici ai caracterelor ce fac obiectul ameliorării parametrilor de reproducție și bunăstare |
||
Activitatea IV.4 Identificarea și analiza SNP-urilor |
||
Activitatea IV.5 Utilizarea metodologiei Genome-Wide Analisys Signature în detecția semnăturii selecției |
||
Activitatea IV.6 Analiza polimorfismelor SNP asociate cu caractere de reproductie si bunăstare la taurine |
||
Activitatea IV.7 Estimarea efectului polimorfismelor SNP asupra caracterelor de reproductie si bunăstare la taurine |
||
Activitatea IV.8 Stabilirea modelului statistic utilizat |
||
Activitatea IV.9 Management și diseminare |
Rezultate asteptate:
- Genotiparea unui lot de animale cu 800 capete Bălțată cu Negru Românească, 600 Bălțată Românească și 100 Brună de Maramureș pe baza unui panel de 50.000 de SNP-uri -Single Nucleotide Polymorphism, în scopul creării unor populații de referință pentru aceste rase
- Crearea și dezvoltarea unor baze de date genotipice și fenotipice proprii fiecărei populații de referință, cu date achiziționate în conformitate cu standardele de calitate stipulate de ghidurile internaționale
- Metodologie de estimare prin metode moderne a parametrilor genetici ai populațiilor de taurine din România
- Efectuarea de studii de asociere la nivel genomic, studii GWAS - Genome-Wide Association Study, pentru caracterele de producție și reproducție importante din punct de vedere economic
- Adaptarea modelelor matematice pentru estimarea valorilor de ameliorare genomice
- Elaborarea Indexului de Selecție optim pentru caracteristicile morfo-productive ale populațiilor de taurine din România
- Metodologie de implementare a cuantificării unor noi genotipuri, scorul podal, ecografia mușchiului Longissimus dorsi, LD, ale unor caractere ce fac obiectul ameliorării
- Identificarea punctelor din programele de ameliorare ce vor trebui modificate în vederea trecerii la Selecția Genomică
Stadiul proiectului si rezultate obtinute:
Etapa I. Studiu bibliografic privind efectul polimorfismelor markerilor moleculari asupra fenotipurilor ce fac obiectul ameliorării taurinelor și folosirea acestora în selecția genomică
Obiectivele Etapei:
În etapa I/2019 ne-am propus identificarea principalilor markeri moleculari utilizați în selecția genomică, studierea metodologiei estimării asocierii acestor markeri cu caracterele fenotipice de interes în ameliorarea taurinelor precum și coroborarea informației obținute cu metodologia de estimare a valorii de ameliorare.
Rezumatul Etapei I
In ultimele decenii au fost facute eforturi remarcabile pentru studierea arhitecturii genetice a caracterelor ce fac obiectul ameliorarii la animalele domestice. In urma acestor numeroase eforturi s-au dezvoltat o serie de aplicatii ce au permis selectia indivizilor chiar de la nastere, pe baza unei valori de ameliorare genomice estimate.
Ideea principală în utilizarea SNP-urilor este aceea că un SNP la care se constată că are un anume grad de asociere cu un caracter fenotipic fie este un proxy (influencer) al unei gene fie un variant cauzativ (adică un SNP care afectează caracterul în mod direct). Numărul mare de SNP-uri din genom face să crească probabilitatea descoperirii unui SNP legat de un variant cauzativ, îmbunătățind astfel șansa de a găsi o genă ce contribuie la varianța unui caracter.
dată cu apariția valorilor de ameliorare genomice (GEBV) a început și cursa genotipării animalelor. Disponibilitatea unei multitudini de genotipuri a dus la dezvoltarea de metode noi de încorporare a informației genomice în sistemele de evaluare națională a taurinelor. Prima metodă a fost cea denumită cu pași multipli (multi-step), pași ce trebuiau parcurși pentru a obține valoarea de ameliorare genomică. Au fost necesare evaluarea unor populații distincte de validare și de perfecționare pentru a estima valoarea de ameliorare moleculară (MBV) sau cea genomică directă (DGV) și introducerea acestor valori în valoarea de ameliorare estimată în mod tradițional. Acest model cu pași multipli a fost implementat prima dată în SUA. Metoda cu pași multipli beneficiază de avantajul păstrării metodologiei BLUP neschimbate și a utilizării selecției genomice ca analiză adițională. Cu toate acestea, această metodă prezintă și dezavantaje: a) MBV este generată doar pentru modele simple (un singur caracter, modele non-materne etc.) ceea ce nu reprezintă tocmai o evaluare genetică; b) sunt necesare pseudo-fenotipuri (valoarea de ameliorare este ajustată cu media părinților și acuratețea); c) pseudo-fenotipurile se bazează pe o acuratețe obținută prin algoritmi aproximativi ce pot genera estimări de calitate slabă; d) în model sunt incluse doar animale genotipate; e) MBV poate conține o parte din media părinților ceea ce duce la o anumită redundanță în informație. Deoarece doar o parte din animale sunt genotipate Misztal, Legarra și Aguilar au propus în 2009 o metodologie ce combină informația din pedigreu, fenotipuri și genotipuri într-o singură evaluare. Această metodologie a fost denumită BLUP genomic într-un singur pas (single step Genomic BLUP sau ssGBLUP) și presupune alterarea relațiilor de înrudire dintre animale pe baza genotipurilor. Ca exemplu, semi-frații au în medie 50% din ADN comun, dar în practică acesta poate varia între 20% și 70%. Această metodă poate fi utilizată cu modelele multi-caracter, cu modelele cu efecte materne, previne redundanța informațiilor fenotipice și de pedigreu, asigură o ponderare optimă a tuturor surselor de informații și poate fi utilizat în populații de orice mărime și cu orice număr de animale genotipate. Per ansamblu prin utilizarea ssGBLUP se așteaptă o îmbunătățire a acurateței în comparație cu metoda cu pași multipli. La scurt timp după implementarea în GS, ssGBLUP a fost folosit la populații cu mai mult de 6000 de animale genotipate. O aplicație timpurie a ssGBLUP a fost utilizarea unor date simulate a 1500 animale în evaluarea greutății la înțărcare cu efecte materne. Deși s-a utilizat un număr mic de animale, a fost observat un spor de acuratețe observat pentru efectele materne directe și indirecte. Următorul pas a fost aplicarea ssGBLUP pe seturile de date ale asociațiilor de creștere. Acest pas a consistat în evaluarea a 52000 de vaci Angus genotipate observându-se un spor consistent de precizie.
Publicatii si comunicari (se actualizeaza la fiecare etapa si la finalul proiectului):
Alte rezultate relevante
Rezultat: Studiu asupra markerilor utilizați în selecția genomică și a metodelor de genotipare
Efecte scontate: Identificarea principalilor markeri moleculari utilizați în selecția genomică în vederea punerii la punct a panelurilor dense de evaluare genomică a animalelor precum și a metodologiei optime de genotipare a acestor markeri.
Rezultat: Studiu asupra prelucrării datelor obținute în urma genotipării și metodologia GWAS
Efecte scontate: Elucidarea pașilor ce trebuie urmați în managerierea datelor obținute în urma genotipării, a metodologiei optime de analiză utilizate în studiile de asociere genomică precum și echipamentul software necesar în analiză.
Rezultat: Studiu privind utilizarea informației genomice în selecția genomică la taurine Efecte scontate: Identificarea metodei de introducere a informației genomice în modelele utilizate în metodologia BLUP și transformarea în metodologie Genomic BLUP (GBLUP) respectiv single step Genomic BLUP (ssGBLUP).
Faza II/2020: Investigarea efectelor markerilor genetici asupra caracterelor ce fac obiectul ameliorării producției de lapte la taurine
Rezumatul fazei:
Implementarea tehnologiei microarray cu densitate mare de SNP-uri detectate a transformat GWAS intr-o metoda standard de identificare a locilor ce stau in spatele unor boli sau caractere complexe la speciile domestice de animale.
O schema simplificata a GWAS include pasii urmatori:
- Determinarea genotipului SNP pe baza datelor brute de pe chip si controlul de calitate primar al datelor;
- Metode de detectie si corectare pentru stratificarea populatiei, atunci cand este cazul (de exemplu analiza de component aprincipala in populatie);
- Imputarea genotipurilor lipsa;
- Testarea asocierii dintre SNP-uri si fenotipuri categorice sau discontinue;
- Analiza de semnificatie globala si corectia pentru testari multiple;
- Prezentarea datelor (de exemplu Manhattan plots);
Colectarea datelor fenotipice
Datele fenotipice au fost colectate prin intermediul Asociațiilor de creștere în conformitate cu cerințele de calitate a datelor impuse de cercetătorii din cadrul proiectului.
Colectarea probelor biologice
Au fost colectate proce de sânge venos periferic de la animale ce aparțin fermei Staţiunii de Cercetare - Dezvoltare pentru Creşterea Bovinelor Arad (SCDCB Arad) și a fermei Agroserv Mariuta SRL din Dragoesti, Ialomița.
Procesarea datelor fenotipice
Datele fenotipice au fost procesate pentru asigurarea controlului calității datelor și formatarea acestora în vederea diverselor analize necesare a fi efectuate. Astfel, s-au eliminat valorile aberante pentru variabilele luate în calcul.
Estimarea parametrilor genetici
Heritabilitatea a fost estimată pentru toate cele 42 de scenarii luate în calcul: 7 caractere, 3 lactații, 2 rase, folosind pachetul software rrBLUP v4.6.1 (REF https://acsess.onlinelibrary.wiley.com/doi/full/10.3835/plantgenome2011.08.0024) pentru limbajul R.
Identificarea și analiza SNP-urilor
În cadrul proiectului au fost genotipate 900 de taurine din rasele Baltata cu Negru Romaneasca de tip Holstein (BNR) – 400 animale, Batlata Romaneasca (BR) – 412 animale si Bruna de Maramures (BM) 88 animale, utilizând metoda de tip SNP-array de la Affymetrrix. Metodele de tip SNP-array, au la bază tehnologii de tip microarray și au avantajul că pot investiga simultan un număr de SNP-uri de la câteva sute până la mai mult de un milion per individ. Pentru fiecare SNP, array-ul conține două probe de oligonucleotide, câte una pentru fiecare alelă posibilă. ADN-ul ce se dorește a fi analizat este apoi fragmentat și lăsat sa hibridizeze cu oligonucleotidele din array. Tehnici optice bazate pe fluorescență sunt apoi folosite pentru a identifica alele prezente in ADN-ul hibridizat.
Rezultatele genotipării au fost obținute în format electronic de la furnizorii serviciilor de genotipare și analizate cu mai multe pachete software specializate precum VCFtools v0.1.16 (REF https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3137218/), BCFtools v1.9 (REF https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3198575/), PLINK v1.90b6.16 (REF https://pubmed.ncbi.nlm.nih.gov/17701901/) și fastSTRUCTURE v1.0 (REF https://www.genetics.org/content/197/2/573).
Datele obținute în urma analizei SNP au fost prelucrate pe baza call-rate și a calculării frecvenței alelei minore pentru eliminarea SNP-urilor fără polimorfism.
Call-rate-ul pentru un anume SNP este definit ca proportia de indivizi din studiu a caror informatie SNP corespunzatoare nu lipseste. Spre exemplu, daca un call-rate de 95% vom retine indivizii de la care avem mai putin de 5% date lipsa.
Frecventa alelei minore (MAF) arata gradul de omogenitate a unui SNP in cadrul lotului de probe. Un grad mare de omogenitate la nivelul unui SNP duce la imposibilitatea de a estima cu semnificatie statistica o asociatite dintre un SNP si un caracter studiat. Acest aspect apare atunci cand exista un MAF foarte mic, adica atunci cand majoritatea indivizilor au cele doua copii ale alelei majore. In functie de intensitatea selctiei SNP-urilor se pot aplica praguri de 1-5%.
Atunci cand e astepatata o presiune de selectie cu modificarea frecventelor alelice, este necesara si evaluarea gradului de homozigotie in cadrul SNP-urilor studiate.
Utilizarea metodologiei Genome-Wide Analisys în detecția semnăturii selecției.
Semnatura prezentei selectiei a fost facuta prin intermediul metodei Analizei Intregului Genom (Genome-Wide Analisys) sau GWA, utilizand pachetul de analiza statistica GenAbel disponibil in R.
Principiul echilibrului Hardy-Weinberg porneste de la premisa ca intr-o populatie frecventele alelice si genotipice raman constante, de la generatie la generatie in absenta unei alte influente evolutive. In cazul unei populatii domestice se presupune ca prin monta directionata apar modificatri in frecventele alelice si genotipice. La nivel de SNP, pentru a estima nivelul de echilibru H-W, distributia polimorfismelor SNP observate in cadrul populatiei studiate este comparata cu o distributie asteptata.
Pachetul software detectRUNS v0.9.6 (REF https://cran.r-project.org/web/packages/detectRUNS/index.html) din limbajul de programare R a fost folosit pentru identificarea semnăturilor de selecție de tip „runs of homozigosity” (ROH).
Analiza polimorfismelor SNP asociate cu caractere calitative și cantitative ale producției de lapte la bovine.
Studiul de asociere la nivel de genom, cunoscut și sub numele GWAS, reprezintă un studiu al unui set de variante genetice la nivelul genomului la diferiți indivizi cu scopul de a analiza dacă orice variantă genetică este asociată cu o trăsătură investigată. GWAS se concentrează pe asocierile dintre polimorfismele cu un singur nucleotid (SNP) și diferite caractere.
Pentru implemenarea activității II în cadrul prezentului proiect, s tudii multiple de tip genome-wide association study au fost implementate folosind metoda GWAS din pachetul software rrBLUP v4.6.1 (REF https://acsess.onlinelibrary.wiley.com/doi/full/10.3835/plantgenome2011.08.0024) pentru limbajul R. Grafice de tip „Manhattan plot” și „QQplot” au fost generate utilizând pachetul qqman v0.1.4 (REF https://www.biorxiv.org/content/10.1101/005165v1)
Estimarea efectului polimorfismelor SNP asuptra caracterelor de producție a laptelui la taurine.
Efectul markerilor SNP a fost calculat prin funcția mixed.solve din pachetul rrBLUP pentru fiecare combinație de caracter, rasă și rang lactație, luând în calcul anul nașterii vacii și combinația dintre anul și sezonul fătării ca efecte fixe.
Asocierea polimorfismelor SNP s-a facut utilizand pachetul statistic glm din proiectul R. Pentru estimare s-a folosit modelul:
Unde y este productia de lapte a animalelor la prima lactatie, μ este media generală (sau interceptul), X este matricea de incidență a genotipurilor SNP, g este vectorul efectelor SNP, iar e este eroarea modelului.