Age-based partitioning of individual genomic inbreeding levels in Belgian Blue cattle

Estimation and age-

Zaczęliśmy od zastosowania modelu Mix14R (z R k od 2 do 8192) do oszacowania proporcji genomu należącego do różnych klas HBD dla 634 reproduktorów BBB (Rys. 1a). 1a), co pozwala na oszacowanie współczynnika inbredu w odniesieniu do różnych populacji bazowych, jak wyjaśniono w Metodach (Rys. 1b). Biorąc pod uwagę wszystkie klasy HBD, frakcja genomu, która jest HBD (odpowiadająca współczynnikowi inbredu oszacowanemu z najbardziej odległą populacją bazową) była równa średnio 0,303 (wahając się od 0,258 do 0,375), z głównym wkładem z klas HBD o wysokich współczynnikach R k (R k > 256), które stanowią średnio 71,4% całkowitej proporcji HBD. Te małe ROH lepiej odzwierciedlają historię populacji (chów wsobny w tle i nierównowaga pokrewieństwa związana z przeszłą efektywną wielkością populacji (Ne)) niż zmienność osobniczą. Klasy związane z mniejszymi wskaźnikami R k (tj. z dłuższymi odcinkami HBD) stanowiły mniejszy udział w całkowitym udziale HBD (średni współczynnik inbredu wynosił 0,054 i 0,087 przy uwzględnieniu klas HBD o R k ≤ 32 i R k ≤ 256, odpowiednio, i ustaleniu populacji bazowej około 16 lub 128 pokoleń temu), ale wykazywały większą zmienność wśród osobników. Przykładowo, współczynnik inbredu związany ze wspólnymi przodkami pochodzącymi sprzed około 4 pokoleń (odpowiadający klasom HBD o R k ≤ 8) wahał się od 0,000 do 0,137. Dla buhajów urodzonych od 1980 do 2010 roku, procent genomu w segmentach HBD wzrósł o 3,3% (+ 0,11% rocznie), tj. w przybliżeniu z 28 do 31% (patrz plik dodatkowy 1: Fig. S1a). Natomiast trend dla nowszych klas HBD (R k ≤ 32) był wyraźniejszy (patrz: plik dodatkowy 1: ryc. S1b), tj. od prawie 0 do 6% (+ 0,20% rocznie) i bardziej odpowiadał trendowi obserwowanemu na podstawie rodowodowych współczynników inbredu (patrz: plik dodatkowy 1: ryc. S1c). Buhaje urodzone przed 1980 rokiem prezentowały niewiele dowodów na niedawną autozygotyczność w porównaniu do współczesnych buhajów.

Fig. 1
figura1

Partycjonowanie autozygotyczności w skali genomu dla 634 reproduktorów rasy Belgian Blue przy użyciu panelu SNP BovineHD. a Boxplot procentów poszczególnych genomów związanych z 13 klasami HBD z predefiniowanymi wskaźnikami R k (model Mix14R). Procenty odpowiadają indywidualnym genomowym prawdopodobieństwom przynależności do każdej z klas HBD. b Genomowe współczynniki inbredu oszacowane w odniesieniu do różnych populacji bazowych (F G-T ) uzyskane poprzez wybór różnych progów T, które określają, które klasy HBD są uwzględniane w szacowaniu F G-T (np. ustawienie populacji bazowej w przybliżeniu 0,5 * T pokoleń w przeszłości). Odpowiednie współczynniki chowu wsobnego F G-T są szacowane jako prawdopodobieństwo przynależności do którejkolwiek z klas HBD z R k ≤ T uśrednione dla całego genomu

Aby ocenić wkład każdej klasy HBD do procentu genomu w segmentach HBD i do jego zmienności w bydle BBB, podzieliliśmy całkowitą frakcję genomu w klasach HBD na cztery główne klasy (bardzo niedawne klasy HBD z R k = 2 do 8, niedawne klasy HBD z R k = 16 do 64, starożytne klasy HBD z R k = 128 do 512 i bardzo starożytne klasy HBD z R k = 1024 do 8192), przy czym każda grupa miała trzy klasy HBD, z wyjątkiem ostatniej z czterema klasami HBD. Średnia frakcja genomu związana z każdą z tych głównych klas (uporządkowanych od niedawnych do starożytnych) była równa 0.027 (SD = 0.029), 0.041 (SD = 0.019), 0.054 (SD = 0.013) i 0.180 (SD = 0.011). Należy zauważyć, że wysoki udział bardzo niedawnych segmentów HBD jest mechanicznie związany z niższym udziałem bardzo starych segmentów HBD (r = – 0,407), ponieważ niedawne segmenty HBD maskują bardziej starożytne segmenty HBD. Mimo że odsetek genomu w klasach HBD związanych z niedawnymi wspólnymi przodkami stanowi tylko 22,6% całkowitej autozygotyczności, wykazuje on większą zmienność osobniczą niż w klasach bardziej starożytnych (ponad 50% całkowitej wariancji jest związane z bardzo niedawnymi klasami HBD). Poprzez dopasowanie modelu liniowego oszacowaliśmy, że bardzo niedawne klasy HBD odpowiadają za 59% całkowitej zmienności autozygotyczności, a dodanie do modelu ostatnich klas HBD zwiększa tę wartość do 83%. Podobnie, korelacje pomiędzy współczynnikami inbredu mierzonymi w odniesieniu do różnych populacji bazowych (np. włączając do obliczeń różne klasy HBD) ze współczynnikami inbredu oszacowanymi z wykorzystaniem wszystkich klas HBD wzrosły gwałtownie z 0,16 dla oszacowań opartych na pierwszej klasie (R k = 2) do 0,77 dla współczynników inbredu oszacowanych z uwzględnieniem klas HBD przy R k ≤ 8 i do 0,90 przy R k ≤ 16, a następnie poprawiły się tylko nieznacznie poprzez dodanie kolejnych klas HBD (ryc. 2). Spadek korelacji obserwowany przy R k = 1024 wynika z faktu, że starożytna autozygotyczność jest skoncentrowana przy R k = 1024 dla niektórych osobników i przy R k = 2048 dla innych.

Fig. 2
figure2

Korelacje pomiędzy genomowymi współczynnikami inbredu oszacowanymi w odniesieniu do różnych populacji bazowych (F G-T ) a współczynnikiem inbredu oszacowanym z najbardziej odległą populacją bazową FG-8192 (obejmującą wszystkie klasy HBD). Różne populacje bazowe uzyskuje się przez wybór różnych progów T, które określają, które klasy HBD są uwzględniane w szacowaniu F G-T (np. ustawienie populacji bazowej w przybliżeniu 0,5 * T pokoleń w przeszłości). Odpowiednie współczynniki inbredu F G-T szacowane są jako prawdopodobieństwo przynależności do którejkolwiek z klas HBD o R k ≤ T uśrednione dla całego genomu. Oszacowanie współczynników inbredu przeprowadzono za pomocą modelu Mix14R (model 13 klas HBD z predefiniowanymi współczynnikami R k) dla 634 genomów.zdefiniowanymi wskaźnikami R k) dla 634 reproduktorów rasy Belgian Blue i przy użyciu panelu SNP BovineHD

Porównanie wyników dla bydła BBB z wynikami dla innych ras

Aby określić, czy porównywalne poziomy i wzorce autozygotyczności obserwuje się również u innych ras pochodzenia europejskiego, zastosowaliśmy ten sam model do 10 ras genotypowanych za pomocą tej samej tablicy (ryc. 3). 3). U większości z tych ras współczynniki inbredu oszacowane w odniesieniu do różnych populacji bazowych wzrastały umiarkowanie do FG-256 (np. klasa HBD z R k ≤ 256 uwzględniona w estymacji), a silniej przy starszych populacjach bazowych (FG-512 do FG-2048), które obejmują znacznie więcej pokoleń przodków. Duże różnice współczynników inbredu zaobserwowano przy stosunkowo niedawnych populacjach bazowych (FG-64, około 32 pokolenia temu), wynoszące od 0,013 i 0,042 u bydła piemonckiego i limousin do 0,164 i 0,200 u bydła Jersey i Hereford. Niektóre osobniki rasy Hereford prezentowały ekstremalne współczynniki inbredu oszacowane z ostatnimi populacjami bazowymi (patrz plik dodatkowy 2), tj. do 40% dla FG-8 (np. około 4 pokolenia wstecz). Część osobników rasy Hereford z tego zbioru danych pochodzi z linii Hereford Line 1, linii wsobnej, co wskazuje, że nasz model poprawnie wychwytuje ekstremalne zdarzenia, ale także, że genotypowane osobniki włączone do tego badania niekoniecznie są reprezentatywne dla rasy.

Fig. 3
figure3

Estymulacja współczynników inbredu w odniesieniu do różnych populacji bazowych (próg T określa, które klasy HBD są uwzględniane w estymacji F G-T ) modelem Mix14R w 11 rasach bydła pochodzenia europejskiego z wykorzystaniem panelu SNP BovineHD. ANG Angus, BBB Belgian Blue Beef cattle, BSW Brown Swiss, CHL Charolais, GNS Guernsey, HFD Hereford, HOL Holstein, JER Jersey, LMS Limousin, PMT Piedmontese, RMG Romagnola

Estymulacja współczynników inbredu i prawdopodobieństwa HBD przy różnych gęstościach SNP

Dopasowaliśmy model Mix14R stosując różne gęstości SNP, tj.e., od LD (6844 SNPs) do HD (601,226 SNPs) na zbiorze danych 634 BBB, a nawet do WGS (5,653,911 SNPs) dla 50 osobników sekwencjonowanych w całym genomie. Średnie szacowane współczynniki inbredu mierzone w odniesieniu do różnych populacji bazowych (ryc. 4) i plik dodatkowy 3: ryc. S2 były podobne we wszystkich panelach SNP dla najnowszych populacji bazowych (FG-32). W przypadku bardziej starych populacji bazowych, mniej autozygotyczności zostało uchwyconych za pomocą panelu LD, z wyraźnymi różnicami dla starożytnych klas HBD, które zostały uchwycone tylko za pomocą paneli HD lub WGS. Podobny trend zaobserwowano w przypadku panelu 50 K, ale średnie współczynniki inbredu były podobne do tych z panelu HD aż do FG-256 (około 128 pokoleń wstecz). Średnie współczynniki inbredu oszacowane przy użyciu najbardziej odległej populacji bazowej oraz paneli LD, 50 K i HD wynosiły odpowiednio 0,060, 0,093 i 0,303 (przy oszacowaniu tylko na 50 sekwencjonowanych osobnikach wartości te wynosiły odpowiednio 0,047, 0,101 i 0,309, a przy panelu WGS 0,359). Populacja bazowa jest więc funkcją najmniejszych segmentów HBD, które mogą być wychwycone przez zastosowany panel. Korelacje pomiędzy tymi współczynnikami inbredu oszacowanymi za pomocą różnych paneli były wysokie, tj. 0,934 (LD-HD), 0,944 (LD-50 K) i 0,975 (50 K-HD). Pomimo znacznie niższych współczynników inbredu uzyskanych z panelem 50 K, ujmuje on w zasadzie całą zmienność osobniczą uzyskaną z panelem HD, co zgadza się z wcześniejszą obserwacją, że większość zmienności związana była z ostatnimi klasami HBD.

Fig. 4
figure4

Porównanie współczynników inbredu oszacowanych przy różnych gęstościach SNP (panel LD na zielono, panel 50 K na niebiesko i panel BovineHD na szaro) i dla różnych populacji bazowych (próg T określa, które klasy HBD są uwzględniane w estymacji F G-T ). Oszacowanie współczynników inbredu przeprowadzono za pomocą modelu Mix14R dla 634 reproduktorów rasy Belgian Blue

Następnie zastosowaliśmy algorytm Viterbiego do identyfikacji segmentów HBD z różnymi panelami SNP (Tabela 1). Algorytm Viterbiego klasyfikuje każdą pozycję SNP jako HBD lub nie-HBD, podczas gdy algorytm forward-backward zapewnia lokalne prawdopodobieństwo HBD. Zgodnie z oczekiwaniami, w panelach o większej gęstości wychwytywanych jest więcej i krótszych segmentów HBD. W przypadku panelu HD udało się wychwycić ograniczoną liczbę wyjątkowo małych (kilka kb) segmentów. Długość większości segmentów wahała się od 10 do 500 kb, przy czym ponad połowa z nich była krótsza niż 100 kb, ale takie segmenty niekoniecznie mają największy udział w całkowitym odsetku genomu w klasach HBD, ponieważ klasy z mniejszą liczbą, ale dłuższych segmentów mogą odpowiadać za dużą część autozygotyczności. Zaobserwowaliśmy również ekstremalnie długie segmenty HBD (> 50 Mb), które potwierdziły obecność niedawnej autozygotyczności (najdłuższy segment HBD miał ponad 90 Mb długości). Średnio każdy z 634 buhajów miał 4,25 segmentów HBD, które były dłuższe niż 10 Mb i związane ze wspólnym przodkiem, który był obecny około pięć pokoleń wstecz. Liczba takich segmentów HBD wahała się od 0 do 14 na osobnika. Sześćdziesiąt jeden buhajów miało nawet jeden lub więcej (do trzech) segmentów HBD dłuższych niż 50 Mb. Przy zastosowaniu paneli 50 K i LD ponad 99% zidentyfikowanych segmentów było dłuższych niż odpowiednio 100 i 500 kb (ze szczytem w klasach odpowiednio od 1 do 5 Mb i od 5 do 10 Mb), a tylko część segmentów została wychwycona w porównaniu z użyciem panelu HD. W szczególności, zdecydowana większość segmentów HBD krótszych niż 1 Mb nie została zidentyfikowana. Przy niższej gęstości SNP najmniejsze segmenty po prostu nie są wychwytywane, ponieważ nie zawierają żadnego SNP lub zawierają ich zbyt mało. Segmenty o pośredniej wielkości mogą nie osiągać wysokiego prawdopodobieństwa HBD z powodu mniejszej liczby SNP w segmencie. Z drugiej strony, długość niektórych segmentów HBD może być przeszacowana przy użyciu panelu LD, na przykład gdy nie ma wystarczającej liczby SNP do identyfikacji małych segmentów nie-HBD, które otaczają segmenty HBD. Rysunek 5a ilustruje identyfikację segmentów HBD dla jednego chromosomu. Widać na nim, że (1) więcej segmentów zidentyfikowano przy większej gęstości, (2) prawdopodobieństwo HBD było wyższe przy gęstszych mapach, (3) algorytm Viterbiego zadeklarował niektóre pozycje SNP jako HBD, mimo że miały one tylko umiarkowane prawdopodobieństwo HBD, oraz (4) granice segmentów HBD zmieniały się w zależności od gęstości panelu. Podobnie, ryc. 5b przedstawia segmenty HBD, które zidentyfikowano na chromosomie Bos taurus (BTA) 5 dla 50 osobników za pomocą algorytmu Viterbi przy różnych gęstościach SNP. Wyniki zgadzają się z tymi przedstawionymi w tabeli 1. Większy odsetek genomu został uznany za HBD przy użyciu panelu HD, a małe segmenty HBD stanowiły większość różnicy w porównaniu z wynikami z paneli o niższej gęstości. Zaobserwowaliśmy jednak, że niektóre segmenty HBD o długości kilku Mb nie zostały zidentyfikowane przy niższej gęstości SNP (a tym bardziej przy panelu LD). Podobnie jak na ryc. 5a, długość niektórych segmentów HBD jest przeszacowana, gdy użyto panelu LD. Porównaliśmy również lokalne prawdopodobieństwa HBD oszacowane przy użyciu panelu LD lub 50 K z lokalnymi klasami HBD wyinterpretowanymi przy użyciu panelu HD i algorytmu Viterbiego (ryc. 6). Prawdopodobieństwa HBD były wysokie dla ostatnich klas HBD i spadały dla bardziej odległych wspólnych przodków. Zgodnie z oczekiwaniami, panel LD był wydajny tylko dla najbardziej niedawnych wspólnych przodków (prawdopodobieństwo HBD wynosiło 0,90 lub więcej, gdy R k < 16 i ~ 0,50 dla R k = 32), podczas gdy panel 50 K pozwalał na wychwycenie bardziej starożytnej autozygotyczności (prawdopodobieństwo HBD wynosiło 0,90 lub więcej, gdy R k < 64 i ~ 0,50 dla R k = 128). Więcej wyników dotyczących wieku (lub długości) segmentów HBD, które mogą być uchwycone przy różnych gęstościach SNP, opisano w Druet i Gautier .

Tabela 1 Rozkład długości segmentów HBD zidentyfikowanych za pomocą modelu z 13 klasami HBD o wstępnie zdefiniowanych wskaźnikach R k dla różnych SNP.zdefiniowanymi wskaźnikami R k dla różnych gęstości SNP
Fig. 5
figure5

Ilustracje identyfikacji segmentów HBD przy użyciu różnych paneli SNP. a Przykład szacowanych prawdopodobieństw HBD dla jednego osobnika na autosomie Bos taurus (BTA) 16 przy użyciu różnych gęstości SNP (panel LD na zielono, panel 50 K na niebiesko i panel BovineHD na szaro). Linie poziome poniżej krzywych reprezentują segmenty HBD zidentyfikowane przez algorytm Viterbiego za pomocą trzech paneli. Przedstawiony jest wyjątkowo długi segment HBD (~ 50 Mb) (w całym zbiorze danych zidentyfikowano tylko 69 takich segmentów HBD), co sugeruje niedawny chów wsobny. Buhaj ten jest jednym z 29 osobników posiadających tak długie segmenty HBD, a jego rodowodowy współczynnik inbredu wynosi 0,048. b Porównanie segmentów HBD zidentyfikowanych dla 50 osobników na BTA5 przy użyciu różnych paneli (każda linia reprezentuje jednego osobnika). Segmenty zidentyfikowane za pomocą paneli HD, 50 K i LD zaznaczono odpowiednio kolorem szarym, niebieskim i zielonym (przy czym wyniki uzyskane przy niższej gęstości maskują wyniki uzyskane przy wyższej gęstości). Najkrótsze segmenty HBD są identyfikowane za pomocą panelu HD (zaznaczone na szaro), podczas gdy segmenty o średnim rozmiarze są również wychwytywane za pomocą panelu 50 K (i nadal pomijane za pomocą panelu LD) i zaznaczone na niebiesko. W przypadku kilku segmentów HBD, zastosowanie panelu LD skutkuje uzyskaniem dłuższych segmentów

Fig. 6
figure6

Średnie prawdopodobieństwa HBD oszacowane dla segmentów HBD związanych z różnymi klasami wiekowymi. Prawdopodobieństwa HBD zostały oszacowane za pomocą paneli LD (zielony) lub 50 K (niebieski), podczas gdy klasy oparte na wieku zostały określone za pomocą algorytmu Viterbi i panelu HD (20-krotny wzrost gęstości SNP). Średnie prawdopodobieństwa HBD wskazują, czy segmenty z różnych klas są wychwytywane przy użyciu paneli o niższej gęstości

Porównanie modeli

Modele szacujące wskaźniki R k klas HBD (modele KR)

Dla różnych badanych gęstości SNP i dla każdego osobnika, użyliśmy BIC (patrz ), aby wybrać model KR z najlepszym wsparciem statystycznym (tj.e., z optymalną liczbą klas K, z K – 1 klasami HBD i jedną klasą nie-HBD) po oszacowaniu wskaźnika(ów) R k dla każdego osobnika z każdym testowanym modelem. Dla każdego panelu SNP w tabeli 2 przedstawiono liczbę przypadków, w których dany model został wybrany jako najlepszy dla analizowanego osobnika. Wraz ze wzrostem gęstości SNP można zbadać więcej przeszłych pokoleń, a optymalne K odpowiednio wzrasta. W większości przypadków modele z jedną klasą HBD są preferowane dla panelu LD, modele z dwiema klasami HBD dla panelu 50 K, modele z trzema klasami HBD dla paneli HD i WGS (choć dla tego ostatniego często wybierany jest również model z czterema klasami HBD, tj. dla 23 z 50 osobników). W tych optymalnych modelach pierwsza klasa HBD wychwytuje najbardziej aktualną autozygotyczność (R k od 15 do 20), druga klasa HBD wychwytuje autozygotyczność związaną ze wspólnymi przodkami z kilkuset pokoleń wstecz, a późniejsze klasy wiążą się z wyższym R k (> 1000) (Tabela 2). Korelacje współczynników inbredu oszacowanych za pomocą tych wybranych modeli KR ze współczynnikami uzyskanymi za pomocą pełnego modelu Mix14R (w zakresie od 0,981 do 1,000) oraz porównanie średnich oszacowanych współczynników inbredu wskazują, że za pomocą tych zredukowanych modeli KR możemy skutecznie uchwycić autozygotyczność ogólnogenomową. W przypadku modeli 1R i niskich lub umiarkowanych gęstości SNP obserwowaliśmy nieznaczne niedoszacowanie współczynników inbredu w porównaniu z modelem Mix14R i nieco niższe korelacje (wciąż powyżej 0,98). Wskaźniki R k oszacowane dla każdego osobnika przy tych panelach mają niższą wartość mediany (odpowiednio 15 i 41 przy panelach LD i 50 K) niż wskaźniki R k oszacowane przy panelach o większej gęstości (mediana R k > 1000), dla których wkład mniejszych ROH jest znacznie większy. W rezultacie, niektóre małe fragmenty nie zostały uchwycone przez model przy niższej gęstości, podczas gdy przy wyższej gęstości współczynniki inbredu są niemal identyczne z oszacowaniami uzyskanymi za pomocą modelu Mix14R. Modele zawierające dwie lub więcej klas HBD wychwyciły taką samą ilość autozygotyczności jak model Mix14R, niezależnie od gęstości SNP. Chociaż współczynnik inbredu jest prawidłowo szacowany za pomocą modelu 1R (jedna klasa HBD i nie-HBD z tym samym wskaźnikiem) z danymi WGS, zidentyfikowane segmenty HBD mają tendencję do bycia mniejszymi, ponieważ szacowane wskaźniki R k są wyższe (tj. Mniejsze oczekiwane długości fragmentów), jak pokazano w pliku dodatkowym 4: Fig. S3. Rzeczywiście, model 1R skutkuje większą liczbą segmentów o długości 10-100 kb niż model Mix14R, ale mniejszą liczbą segmentów dłuższych niż 100 kb. Tak więc w modelu 1R długie segmenty HBD mogą zostać pocięte na mniejsze fragmenty w obecności heterozygotycznych SNP (prawdopodobnie błędy sekwencjonowania), podczas gdy w modelach obejmujących klasy HBD związane z niedawnymi wspólnymi przodkami (z małymi współczynnikami R k), te segmenty HBD są identyfikowane jako jeden długi i niedawny fragment (ponieważ kara za zakończenie i rozpoczęcie nowego segmentu jest wyższa). Rysunek 7 ilustruje to na przykładzie. Rzeczywiście, zaobserwowaliśmy długi segment o wysokim prawdopodobieństwie HBD, chociaż istnieje wiele pozycji, w których prawdopodobieństwo heterozygotycznego genotypu jest inne niż zerowe (ale jest ono ograniczone w porównaniu z regionami flankującymi). W modelu Mix14R segment ten jest uważany za długi, a lokalne prawdopodobieństwo HBD pozostaje wyższe niż 0,99 dla całego regionu (z wyjątkiem regionu z pięcioma kolejnymi heterozygotycznymi SNP). W modelu 1R, prawdopodobieństwo HBD wielokrotnie spada z powodu tych potencjalnie heterozygotycznych SNP, a najdłuższy segment HBD jest cięty na kilka mniejszych fragmentów (na podstawie wyników algorytmu Viterbiego). Zauważmy, że w panelu HD osobnik ten jest homozygotyczny dla wszystkich 13 009 SNP zawartych w tym 56,1-Mb odcinku. Podobnie jak na Rys. 5, zauważamy, że algorytm Viterbiego klasyfikuje niektóre pozycje o niskim szacowanym prawdopodobieństwie HBD jako HBD.

Tabela 2 Porównanie modeli użytych do oszacowania genomowych współczynników inbredu z różnej liczbie klas HBD (od 1 do 4)
Fig. 7
figure7

Porównanie długości segmentów HBD zidentyfikowanych na podstawie danych WGS oraz modeli 1R lub Mix14R na BTA3. Szare i czerwone linie reprezentują prawdopodobieństwa HBD oszacowane odpowiednio za pomocą modeli 1R i Mix14R; ciemnoszare kropki reprezentują prawdopodobieństwo genotypów heterozygotycznych (uzyskane z VCF); niebieskie i żółte segmenty reprezentują segmenty HBD zidentyfikowane za pomocą algorytmu Viterbiego odpowiednio z modelem 1R i Mix14R

Modele z predefiniowanymi współczynnikami R k klas HBD (modele MixKR)

W porównaniu z modelami KR, Modele MixKR mają tę zaletę, że wykorzystują te same klasy HBD dla wszystkich osobników (współczynniki R k klas HBD nie są indywidualnie szacowane, lecz predefiniowane przez użytkownika) i ułatwiają porównania między osobnikami (np. porównanie dwóch osobników z jedną klasą HBD, ale z R k = 8 dla pierwszego i R k = 96 dla drugiego nie byłoby łatwe – szacowane R k wahają się od 4 do 1000). Kilka z tych modeli MixKR (z K = 2, 3 i 4) przetestowano z panelem LD (Tabela 3), aby ocenić, czy zredukowane modele z predefiniowanymi współczynnikami klas HBD są skuteczne. Aby wybrać te predefiniowane wskaźniki, albo użyliśmy mediany oszacowanych wskaźników uzyskanych z modeli o tej samej liczbie klas (patrz poprzednia sekcja), albo wybraliśmy kilka klas z modelu MixKR w celu pokrycia zakresu oszacowanych wartości (np. jedna klasa dla najnowszych segmentów HBD i jedna dla starożytnych segmentów HBD). Zgodnie z wcześniejszymi obserwacjami dotyczącymi modeli KR, porównanie oszacowanych współczynników inbredu z tymi uzyskanymi za pomocą modelu Mix14R wskazuje, że modele z jedną klasą HBD nieznacznie zaniżają współczynniki inbredu i dają niższe korelacje (> 0.96) niż modele z dwiema lub więcej klasami HBD (> 0.99). Obecność wielu klas HBD (> 2) pozwala na lepszą ocenę wkładu od różnych przeszłych pokoleń (np., R k = 8 vs 64), ale nie zapewnia lepszych oszacowań współczynnika inbredu w całym genomie.

Tabela 3 Oszacowanie genomowych współczynników inbredu za pomocą modeli wykorzystujących różne liczby klas HBD (od 1 do 4) przy wstępniezdefiniowanymi wskaźnikami R k, które odpowiadają oczekiwanej długości w Morganach segmentów HBD oraz z panelem LD

Porównanie do innych estymatorów współczynników inbredu

Średnie i zakresy współczynników inbredu oszacowanych różnymi metodami i panelem HD znajdują się w Tabeli 4, a ich korelacje w Tabeli 5, oraz w pliku dodatkowym 5: Tabele S1 i S2 dla innych paneli. Podobnie jak w naszym modelu, modele oparte na obserwowanej homozygotyczności i ROH dawały wysokie współczynniki inbredu (średnio odpowiednio 0,644 i 0,151), podczas gdy inne estymatory genomowe dawały współczynniki inbredu skupione wokół 0 i zawierające wartości ujemne. Należy zaznaczyć, że wyższe wartości (0,268) uzyskuje się średnio przy stosowaniu mniej rygorystycznych reguł identyfikacji ROH (np. okna 20 SNP i co najmniej 10 SNP na ROH). Zaobserwowaliśmy bardzo wysokie korelacje między szacunkami opartymi na HMM a miarami opartymi na homozygotyczności (r = 0,95 dla FHOM i FExHOM, te dwie miary wykazują korelację 1 i są w zasadzie takie same) lub ROH (r = 0,95 dla FROH), co sugeruje, że przy dużej liczbie SNP proste heurystyki (ignorujące częstości alleli, odstępy między SNP itp.) są efektywne (FHOM i FROH są wysoko skorelowane, r = 0,97). Korelacja między FHOM oszacowanym dla paneli LD i HD wynosi 0,890 i jest nieco niższa niż korelacja między oszacowaniami uzyskanymi za pomocą HMM dla tych dwóch paneli (r = 0,934), co wskazuje, że globalne estymatory nadal działają poprawnie dla 6844 SNP w tej populacji. Metody ROH oparte na regułach są mniej wydajne przy niższych gęstościach SNP, ponieważ wychwytują tylko najdłuższe fragmenty (5 Mb lub więcej i średnio 20 Mb) przy parametrach użytych w obecnym badaniu (domyślny rozmiar okien w plink). W rzeczywistości, estymatory oparte na ROH są rzadko stosowane z panelem LD u bydła, chociaż więcej segmentów HBD może być zidentyfikowanych przy mniej rygorystycznych zasadach, kosztem zwiększonego odsetka wyników fałszywie dodatnich. Przy niskiej gęstości SNP, ramy HMM nadal zapewniają poprawne globalne i lokalne prawdopodobieństwa HBD, chociaż segmenty HBD nie są identyfikowane bez niejednoznaczności.

Tabela 4 Statystyki zbiorcze dla współczynników inbredu oszacowanych dla 634 reproduktorów rasy Belgian Blue różnymi metodami i przy użyciu panelu HD
Tabela 5. 5 Korelacje między współczynnikami inbredu oszacowanymi dla 634 reproduktorów rasy Belgian Blue różnymi metodami i z wykorzystaniem panelu HD

Korelacje oszacowań z tradycyjnego GRM z naszymi oszacowaniami są umiarkowanie wysokie (r = 0.73), a niższe z estymatorami homozygotyczności (r = 0,63) i estymatorami opartymi na ROH (0,61). FGRM został obliczony przy użyciu formuły zaproponowanej przez , która dzieli wszystkie wkłady SNP przez tę samą wagę. W przypadku estymacji z użyciem alternatywnej formuły, która dzieli każdy wkład SNP przez jego własną wagę 2f i (1 – f i ) (f i oznacza częstość SNP i), jak w Amin et al. , korelacje były niższe (tj. 0,48 z FG, 0,34 z FHOM i 0,33 z FROH). Estymator oparty na ujednoliconych korelacjach między gametami zaproponowany przez Yang i in. wykazywał stosunkowo wysokie korelacje zarówno z FG, jak i FGRM (odpowiednio 0,90 i 0,92) oraz nieco niższe z pozostałymi estymatorami (r = 0,87 i 0,85 odpowiednio z FHOM i FROH).

Korelacje tych estymatorów ze współczynnikami inbredu rodowego (uwzględniając jedynie osobniki urodzone po 1999 roku w celu zwiększenia głębokości rodowodu) zamieszczono również w tabeli 5. Ogólne korelacje były umiarkowane, z najwyższymi wartościami dla korelacji z miarami opartymi na homozygotyczności i ROH (0,55 dla obu miar) i nieco niższymi wartościami dla korelacji z estymatorem opartym na HMM (0,46), podczas gdy zaobserwowaliśmy niski związek z FGRM (0,29) i umiarkowaną korelację z FUNI (0,45). Porównaliśmy również współczynniki FPED i inbredu oszacowane za pomocą naszego modelu w odniesieniu do różnych populacji bazowych (Rys. 8) i stwierdziliśmy, że korelacje wzrastały do FG-32 (ujmując inbred od przodków około 16 pokoleń wstecz), a następnie prezentowały plateau od FG-32 do FG-256 osiągając maksimum przy r = 0,56 (tj. nieco lepiej niż estymatory oparte na homozygotyczności). Tendencja ta była oczekiwana, ponieważ FPED jest szacowany dla ograniczonej liczby pokoleń wstecz. Średnia równoważna liczba znanych pokoleń oszacowana za pomocą PEDIG wynosiła 6,3 dla buhajów urodzonych po 1999 roku (wzrosła z 5,5 dla buhajów urodzonych w 2000 roku do 7,5 dla tych urodzonych w 2010 roku) odpowiadając średnio FG-16. Dodanie klasy HBD R k = 32 pozwala na uchwycenie wkładu niektórych starszych gałęzi rodowodu oraz najmniejszych segmentów HBD odziedziczonych po wspólnych przodkach w rodowodzie.

Fig. 8
figure8

Korelacje pomiędzy współczynnikami inbredu oszacowanymi w odniesieniu do różnych populacji bazowych (F G-T ) a współczynnikiem inbredu oszacowanym na podstawie danych rodowodowych dla reproduktorów rasy Belgian Blue urodzonych po 1999 roku i z wykorzystaniem panelu HD. Różne populacje bazowe uzyskano poprzez wybór różnych progów T, które określają, które klasy HBD są brane pod uwagę przy szacowaniu F G-T (np. ustawienie populacji bazowej około 0,5 * T pokoleń w przeszłości). Odpowiednie współczynniki inbredu F G-T są szacowane jako prawdopodobieństwo przynależności do którejkolwiek z klas HBD o R k ≤ T uśrednione dla całego genomu. Genomowe współczynniki inbredu oszacowano za pomocą modelu Mix14R

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *