Partição baseada na idade dos níveis individuais de consanguinidade genómica no gado Azul Belga

Stimativa e idade-Partição baseada em níveis individuais de consanguinidade genómica na população belga de gado bovino Blue Beef

Iniciámos utilizando um modelo Mix14R (com R k variando de 2 a 8192) para estimar a proporção do genoma pertencente a diferentes classes de HBD para os 634 reprodutores BBB (Fig. 1a), o que permite a estimativa do coeficiente de consanguinidade em relação a diferentes populações de base, como explicado em Métodos (Fig. 1b). Ao considerar todas as classes de HBD, a fracção do genoma que é HBD (correspondente ao coeficiente de consanguinidade estimada com a população de base mais remota) foi igual a 0,303 em média (variando de 0,258 a 0,375), com uma contribuição importante das classes de HBD com taxas elevadas de R k (R k > 256) que representam 71,4% da proporção total de HBD em média. Estas pequenas ROH reflectem melhor a história da população (consanguinidade e desequilíbrio de ligação associados ao tamanho efectivo da população (Ne) passado) do que a variação individual. As classes associadas a taxas menores de R k (ou seja, com segmentos mais longos de HBD) representaram uma proporção menor da proporção total de HBD (o coeficiente de consanguinidade média foi igual a 0,054 e 0,087 ao incluir as classes de HBD com R k ≤ 32 e R k ≤ 256, respectivamente, e ao fixar a população de base há aproximadamente 16 ou 128 gerações atrás) mas apresentaram mais variação entre os indivíduos. Por exemplo, o coeficiente de consanguinidade associado com os antepassados comuns que se rastreavam até cerca de quatro gerações atrás (correspondente às classes HBD com R k ≤ 8) variava entre 0,000 e 0,137. Para os touros nascidos de 1980 a 2010, a percentagem do genoma nos segmentos HBD aumentou 3,3% (+ 0,11% por ano), ou seja, aproximadamente de 28 a 31% (ver Ficheiro adicional 1: Fig. S1a). Contudo, a tendência para classes mais recentes de HBD (R k ≤ 32) foi mais pronunciada (ver ficheiro adicional 1: Fig. S1b), ou seja, de quase 0 a 6% (+ 0,20% por ano) e correspondeu mais de perto à tendência observada com coeficientes de consanguinidade baseados em pedigree (ver ficheiro adicional 1: Fig. S1c). Os touros nascidos antes de 1980 apresentaram poucas provas de autozygosidade recente em comparação com os touros modernos.

Figcaption>Fig. 1
figure1
p>Particionamento da autozygosidade de todo o genoma para os 634 touros Belgas Blue sires utilizando o painel BovineHD SNP. um Boxplot de percentagens de genomas individuais associados a 13 classes HBD com taxas R k pré-definidas (modelo Mix14R). As percentagens correspondem a probabilidades individuais de pertencer a cada uma das classes HBD. b Coeficientes genómicos de consanguinidade estimados em relação a diferentes populações de base (F G-T ) obtidos seleccionando diferentes limiares T que determinam quais as classes HBD que são consideradas na estimativa de F G-T (por exemplo, estabelecendo a população de base aproximadamente 0,5 * T gerações no passado). Os coeficientes de consanguinidade correspondentes F G-T são estimados como a probabilidade de pertencer a qualquer uma das classes HBD com um R k ≤ T com média sobre todo o genoma

Para avaliar a contribuição de cada classe HBD para a percentagem do genoma nos segmentos HBD e para a sua variação no gado BBB, dividimos a fracção total do genoma nas classes HBD em quatro classes principais (classes HBD muito recentes com R k = 2 a 8, classes HBD recentes com R k = 16 a 64, classes HBD antigas com R k = 128 a 512, e classes HBD muito antigas com R k = 1024 a 8192), tendo cada grupo três classes HBD excepto a última com quatro classes HBD. A fracção média do genoma associado a cada uma destas classes principais (ordenado de recente a antigo) era igual a 0,027 (SD = 0,029), 0,041 (SD = 0,019), 0,054 (SD = 0,013) e 0,180 (SD = 0,011). Note-se que proporções elevadas de segmentos HBD muito recentes estão mecanicamente associadas a proporções mais baixas de segmentos HBD muito antigos (r = – 0,407) porque os segmentos HBD recentes mascaram segmentos HBD mais antigos. Embora a percentagem do genoma nas classes HBD associadas a antepassados comuns recentes represente apenas 22,6% da autozygosidade total, apresenta mais variação individual do que a das classes mais antigas (mais de 50% da variação total está associada a classes HBD muito recentes). Ao instalar um modelo linear, estimamos que as classes HBD muito recentes representam 59% da variação total da autozygosidade e que a adição de classes HBD recentes ao modelo aumenta este valor para 83%. Do mesmo modo, as correlações entre os coeficientes de consanguinidade medida em relação a diferentes populações de base (por exemplo, incluindo diferentes classes de HBD no cálculo) com os coeficientes de consanguinidade estimados usando todas as classes de HBD aumentaram abruptamente de 0,16 para estimativas baseadas na primeira classe (R k = 2) para 0,77 para coeficientes de consanguinidade estimados incluindo classes de HBD com um R k ≤ 8 e para 0,90 com um R k ≤ 16, e depois melhoraram apenas marginalmente ao adicionar mais classes de HBD (Fig. 2). A diminuição da correlação observada em R k = 1024 resulta do facto de a autozygosidade antiga se concentrar em R k = 1024 para alguns indivíduos e em R k = 2048 para outros.

Figcaption>Fig. 2
figure2
p>Correlações entre coeficientes de consanguinidade genómica estimados com respeito a diferentes populações de base (F G-T ) e o coeficiente de consanguinidade estimada com a população de base mais remota FG-8192 (incluindo todas as classes HBD). Diferentes populações de base são obtidas através da selecção de diferentes limiares T que determinam quais as classes HBD consideradas na estimativa de F G-T (por exemplo, estabelecendo a população de base aproximadamente 0,5 * T gerações no passado). Os coeficientes de consanguinidade correspondentes F G-T são estimados como a probabilidade de pertencer a qualquer uma das classes HBD com uma média R k ≤ T em todo o genoma. A estimativa dos coeficientes de consanguinidade foi realizada com o modelo Mix14R (13 HBD-classes modelo com pré-definido R k) para 634 touros Belgas Blue sires e utilizando o painel BovineHD SNP

Comparação dos resultados para o gado BBB com os de outras raças

Para determinar se são também observados níveis e padrões comparáveis de autozygosidade noutras raças de origem europeia, aplicámos o mesmo modelo a 10 raças genotipadas com a mesma matriz (Fig. 3). Na maioria destas raças, os coeficientes de consanguinidade estimados em relação a diferentes populações de base aumentaram moderadamente até FG-256 (por exemplo, classe HBD com R k ≤ 256 incluído na estimativa) e mais fortemente com populações de base mais antigas (FG-512 a FG-2048), que incluem muito mais gerações de antepassados. Foram observadas grandes diferenças nos coeficientes de consanguinidade com populações de base relativamente recentes (FG-64, há aproximadamente 32 gerações), variando de 0,013 e 0,042 em Piemonte e Limousin a 0,164 e 0,200 em Jersey e Hereford. Alguns indivíduos de Hereford apresentaram coeficientes de consanguinidade extremos estimados com populações de base recentes (ver Ficheiro adicional 2), ou seja, até 40% para FG-8 (por exemplo, aproximadamente quatro gerações atrás). Parte dos indivíduos Hereford deste conjunto de dados provém da Linha 1 de Hereford, uma linha consanguínea, o que indica que o nosso modelo capta correctamente eventos extremos, mas também que os indivíduos genotípicos incluídos neste estudo não são necessariamente representativos da raça.

Fig. 3
figure3
p>>estimação dos coeficientes de consanguinidade relativamente a diferentes populações de base (o limiar T determina quais as classes de HBD incluídas na estimativa de F G-T ) com um modelo Mix14R em 11 raças bovinas de origem europeia utilizando o painel BovineHD SNP. ANG Angus, BBB Blue Beef cattle belga, BSW Brown Swiss, CHL Charolais, GNS Guernsey, HFD Hereford, HOL Holstein, JER Jersey, LMS Limousin, PMT Piemontês, RMG Romagnola

Stimativa de coeficientes de consanguinidade e probabilidades de HBD com diferentes densidades de SNP

Equipamos um modelo Mix14R usando diferentes densidades de SNP, i.e., de LD (6844 SNPs) a HD (601.226 SNPs) no conjunto de dados 634 BBB e mesmo a WGS (5.653.911 SNPs) para os 50 indivíduos de todo o genoma sequenciado. Os coeficientes médios estimados de consanguinidade medidos em relação a diferentes populações de base (Fig. 4) e o ficheiro adicional 3: Fig. S2 foram semelhantes entre os painéis SNP para as populações de base mais recentes (FG-32). Para populações de base mais antigas, foi capturada menos autozygosidade com o painel LD com diferenças marcadas para as classes HBD antigas que eram capturadas apenas com painéis HD ou WGS. Uma tendência semelhante foi observada com o painel de 50 K, mas os coeficientes médios de consanguinidade foram semelhantes aos do painel HD até ao FG-256 (aproximadamente 128 gerações atrás). Os coeficientes médios de consanguinidade estimados utilizando a população base mais remota e os painéis LD, 50 K e HD foram iguais a 0,060, 0,093 e 0,303, respectivamente (quando estimados apenas nos 50 indivíduos sequenciados, estes valores foram iguais a 0,047, 0,101 e 0,309, respectivamente, e a 0,359 com o painel WGS). A população de base é então uma função dos segmentos HBD mais pequenos que podem ser capturados pelo painel utilizado. As correlações entre estes coeficientes de consanguinidade estimados com diferentes painéis foram elevadas, ou seja, 0,934 (LD-HD), 0,944 (LD-50 K) e 0,975 (50 K-HD). Apesar dos coeficientes de consanguinidade muito mais baixos obtidos com o painel de 50 K, capta essencialmente toda a variação individual obtida com um painel HD, de acordo com a observação anterior de que a maior parte da variação estava associada a classes HBD recentes.

Fig. 4
figure4
p>Comparação de coeficientes de consanguinidade estimada com diferentes densidades de SNP (painel LD em verde, painel 50 K em azul e painel BovineHD em cinzento) e para diferentes populações de base (o limiar T determina quais as classes de HBD que estão incluídas na estimativa de F G-T ). A estimativa dos coeficientes de consanguinidade foi realizada com o modelo Mix14R para 634 touros Belgas Blue sires

Utilizámos então o algoritmo Viterbi para identificar segmentos HBD com diferentes painéis SNP (Tabela 1). O algoritmo de Viterbi classifica cada posição SNP como HBD ou não-HBD enquanto que o algoritmo forward-back fornece a probabilidade HBD local. Como esperado, são capturados mais e mais curtos segmentos HBD com painéis de maior densidade. Com o painel HD, uma proporção limitada de segmentos extremamente pequenos (alguns kb) foram capturados. O comprimento da maioria dos segmentos variava entre 10 e 500 kb, sendo mais de metade inferior a 100 kb, mas tais segmentos não têm necessariamente a maior contribuição para a percentagem total do genoma nas classes HBD, uma vez que as classes com menos segmentos mas mais longos podem ser responsáveis por uma grande proporção de autozygosidade. Também observámos segmentos extremamente longos de HBD (> 50 Mb), o que confirmou a presença de autozygosidade recente (o segmento mais longo de HBD tinha mais de 90 Mb de comprimento). Em média, cada um dos 634 touros tinha 4,25 segmentos de HBD com mais de 10 Mb e associados a um antepassado comum que estava presente há cerca de cinco gerações. O número desses segmentos HBD variava de 0 a 14 por indivíduo. Sessenta e um touros tinham até um ou mais (até três) segmentos de HBD com mais de 50 Mb. Com os painéis de 50 K e LD, mais de 99% dos segmentos identificados tinham mais de 100 e 500 kb, respectivamente (com um pico nas classes de 1 a 5 Mb e de 5 a 10 Mb, respectivamente), e apenas uma fracção dos segmentos foi capturada em comparação com quando o painel HD foi utilizado. Em particular, a grande maioria dos segmentos HBD inferiores a 1 Mb não foram identificados. Em densidades de SNP mais baixas, os segmentos mais pequenos simplesmente não são capturados porque não contêm nenhum SNP ou são muito poucos. Os segmentos de tamanho intermédio podem não atingir probabilidades elevadas de HBD devido a um menor número de SNPs no segmento. Inversamente, o comprimento de alguns segmentos HBD pode ser sobrestimado quando se utiliza o painel LD, por exemplo, quando não existem SNPs suficientes para identificar pequenos segmentos não-HBD que flanqueiam segmentos HBD. A figura 5a ilustra a identificação de segmentos de HBD para um cromossoma. Mostra que (1) foram identificados mais segmentos com maior densidade, (2) as probabilidades de HBD eram maiores com mapas mais densos, (3) o algoritmo de Viterbi declarou algumas posições de SNP como HBD embora tivessem apenas probabilidades moderadas de HBD, e (4) os limites dos segmentos HBD variavam com a densidade do painel. Da mesma forma, a figura 5b representa segmentos HBD que foram identificados no cromossoma Bos taurus (BTA) 5 para 50 indivíduos com o algoritmo de Viterbi com diferentes densidades de SNP. Os resultados estão de acordo com os relatados na Tabela 1. Proporções maiores do genoma foram declaradas HBD com o painel HD e pequenos segmentos HBD foram responsáveis pela maior parte da diferença com os resultados de painéis de menor densidade. Ainda assim, observámos que alguns segmentos HBD de alguns Mb de comprimento não foram identificados com menor densidade SNP (e ainda mais com o painel LD). Quanto à Fig. 5a, o comprimento de alguns segmentos HBD está sobrestimado quando o painel LD foi utilizado. Também comparámos as probabilidades locais de HBD estimadas usando o painel LD ou o painel 50 K com as classes HBD locais inferidas usando o painel HD e o algoritmo de Viterbi (Fig. 6). As probabilidades de HBD eram elevadas para as classes HBD recentes e desceram para antepassados comuns mais remotos. Como esperado, o painel LD foi eficiente apenas para os antepassados comuns mais recentes (a probabilidade HBD era 0,90 ou superior quando R k < 16 e ~ 0,50 para R k = 32) enquanto que o painel 50 K permitiu a captura de autozygosidade mais antiga (a probabilidade HBD era 0,90 ou superior quando R k < 64 e ~ 0,50 para R k = 128). Mais resultados relativos à idade (ou comprimento) dos segmentos HBD que podem ser capturados com diferentes densidades de SNP são descritos em Druet e Gautier .

Table 1 Distribuição do comprimento dos segmentos HBD identificados com um modelo com 13 classes HBD com pré-taxas R k definidas para diferentes densidades de SNP
Figcaption>Fig. 5
figure5

Ilustrações da identificação de segmentos HBD utilizando diferentes painéis SNP. a Exemplo de probabilidades estimadas de HBD para um indivíduo no autossoma Bos taurus (BTA) 16 utilizando diferentes densidades de SNP (painel LD em verde, painel 50 K em azul e painel BovineHD em cinzento). As linhas horizontais abaixo das curvas representam segmentos HBD tal como identificados pelo algoritmo de Viterbi com os três painéis. Um segmento HBD extremamente longo (~ 50 Mb) é representado (existem apenas 69 segmentos HBD identificados em todo o conjunto de dados), sugerindo consanguinidade recente. Este touro é um dos 29 indivíduos portadores de segmentos HBD tão longos e tem um coeficiente de consanguinidade de pedigree de 0,048. b Comparações de segmentos HBD identificados para 50 indivíduos no BTA5 usando painéis diferentes (cada linha representa um indivíduo). Os segmentos identificados com os painéis HD, 50 K e LD são representados em cinzento, azul e verde, respectivamente (com resultados de menor densidade mascarando os resultados obtidos com maior densidade). Os segmentos HBD mais curtos são identificados com o painel HD (indicado a cinzento) enquanto os de tamanho intermédio são também capturados com o painel 50 K (e ainda falhados com o painel LD) e indicados a azul. Para alguns segmentos HBD, a utilização do painel LD resulta em segmentos mais longos

Fig. 6
figure6

P>Probabilidades médias de HBD estimadas para segmentos HBD associadas a diferentes classes baseadas na idade. As probabilidades de HBD foram estimadas com os painéis LD (verde) ou 50 K (azul) enquanto que as classes baseadas na idade foram determinadas usando o algoritmo de Viterbi e o painel HD (um aumento de densidade SNP de 20 vezes). As probabilidades médias HBD indicam se segmentos de diferentes classes são capturados usando painéis de densidade inferior

Comparação de modelos

Modelos que estimam as taxas R k das classes HBD (modelos KR)

Para as diferentes densidades de SNP testadas e para cada indivíduo, utilizámos o BIC (ver ) para seleccionar o modelo KR com o melhor suporte estatístico (i.e., com o número óptimo de classes K, com classes K – 1 HBD e uma classe não-HBD) após estimar a(s) taxa(s) R k para cada indivíduo com cada modelo testado. Para cada painel SNP, a Tabela 2 mostra o número de vezes que um modelo foi seleccionado como o melhor modelo para o indivíduo analisado. medida que a densidade do SNP aumenta, mais gerações passadas podem ser exploradas e o K óptimo aumenta em conformidade. Na maioria dos casos, os modelos com uma classe HBD são preferidos para o painel LD, modelos com duas classes HBD para o painel 50 K, modelos com três classes HBD para os painéis HD e WGS (embora o modelo com quatro classes HBD seja também frequentemente seleccionado para este último, ou seja, para 23 de 50 indivíduos). Com estes modelos óptimos, a primeira classe HBD capta a autozygosidade mais recente (R k de 15 a 20), a segunda classe HBD capta a autozygosidade que está associada a antepassados comuns de algumas centenas de gerações atrás e as classes posteriores estão associadas a R k mais elevado (> 1000) (Tabela 2). As correlações dos coeficientes de consanguinidade estimados com estes modelos KR seleccionados com os obtidos com o modelo Mix14R completo (variando entre 0,981 e 1.000) e a comparação dos coeficientes médios de consanguinidade estimados indicam que com estes modelos KR reduzidos, podemos efectivamente capturar a autozygosidade de todo o genoma. Com modelos 1R e densidades de SNP baixas ou moderadas, observámos uma ligeira subestimação dos coeficientes de consanguinidade em comparação com o modelo Mix14R e correlações ligeiramente inferiores (ainda acima de 0,98). As taxas R k estimadas para cada indivíduo com estes painéis têm um valor mediano mais baixo (respectivamente 15 e 41 com os painéis LD e 50 K) do que as taxas R k estimadas com painéis de maior densidade (mediana R k > 1000) para os quais a contribuição de ROH mais pequeno é muito maior. Como resultado, alguns pequenos fragmentos não foram capturados pelo modelo com menor densidade, enquanto que com maior densidade, os coeficientes de consanguinidade são quase idênticos às estimativas obtidas com o modelo Mix14R. Os modelos contendo duas ou mais classes HBD capturaram a mesma quantidade de autozygosidade que o modelo Mix14R, independentemente da densidade do SNP. Embora o coeficiente de consanguinidade seja correctamente estimado com um modelo 1R (uma classe HBD e não HBD com a mesma taxa) com dados WGS, os segmentos HBD identificados tendem a ser mais pequenos uma vez que as taxas R k estimadas são mais altas (isto é, comprimentos esperados de fragmentos menores), como se mostra no ficheiro adicional 4: Fig. S3. De facto, o modelo 1R resulta em mais segmentos de 10 a 100 kb de comprimento do que o modelo Mix14R, mas menos segmentos de comprimento superior a 100 kb. Assim, com um modelo 1R, segmentos longos HBD podem ser cortados em fragmentos menores na presença de SNPs heterozigotos (possivelmente erros de sequenciação), enquanto que com modelos que incluem classe(s) HBD associados a antepassados comuns recentes (com pequenas taxas R k), estes segmentos HBD são identificados como um fragmento longo e recente (porque a penalização para terminar e iniciar um novo segmento é maior). A figura 7 ilustra isto com um exemplo. De facto, observámos um segmento longo com probabilidades elevadas de HBD, embora existam múltiplas posições em que a probabilidade do genótipo heterozigoto não é nula (mas isto é limitado em comparação com as regiões de flanco). Com o modelo Mix14R, este é considerado como um segmento longo e a probabilidade local de HBD permanece superior a 0,99 para toda a região (excepto para uma região com cinco SNPs heterozigotos consecutivos). Com o modelo 1R, as probabilidades de HBD caem repetidamente devido a estes SNPs possivelmente heterozigotos e o segmento mais longo de HBD é cortado em vários fragmentos menores (com base nos resultados do algoritmo de Viterbi). Note-se que com o painel HD, este indivíduo é homozigoto para todos os 13.009 SNPs que estão incluídos neste segmento longo de 56,1-Mb. Tal como na Fig. 5, notamos que o algoritmo Viterbi classifica algumas posições com uma probabilidade baixa estimada de HBD como HBD.

Table 2 Comparação de modelos utilizados para estimar coeficientes de consanguinidade genómica com números diferentes de classes HBD (de 1 a 4)
Figcaption>Fig. 7
figure7

Comparação do comprimento dos segmentos HBD identificados com dados WGS e com os modelos 1R ou Mix14R no BTA3. As linhas cinzentas e vermelhas representam as probabilidades de HBD estimadas com os modelos 1R e Mix14R, respectivamente; os pontos cinzentos escuros representam a probabilidade de genótipos heterozigotos (obtidos a partir do FCR); os segmentos azul e amarelo representam segmentos HBD identificados com o algoritmo Viterbi com o modelo 1R e o modelo Mix14R, respectivamente

Modelos com taxas R k pré-definidas das classes HBD (modelos MixKR)

Comparados com os modelos KR, Os modelos MixKR apresentam a vantagem de utilizar as mesmas classes HBD para todos os indivíduos (as taxas R k das classes HBD não são estimadas individualmente mas pré-definidas pelo utilizador) e tornam as comparações entre indivíduos mais fáceis (por exemplo, comparar dois indivíduos com uma única classe HBD mas com R k = 8 para a primeira e R k = 96 para a segunda não seria fácil – o R k estimado varia entre 4 e 1000). Vários destes modelos MixKR (com K = 2, 3 e 4) foram testados com o painel LD (Quadro 3) para avaliar se os modelos reduzidos com taxas pré-definidas de classes HBD são eficientes. Para seleccionar estas taxas pré-definidas, ou utilizámos medianas de taxas estimadas obtidas de modelos com o mesmo número de classes (ver secção anterior) ou seleccionámos algumas classes do modelo MixKR para cobrir a gama de valores estimados (por exemplo, uma classe para segmentos HBD recentes e outra para segmentos HBD antigos). De acordo com observações anteriores sobre modelos KR, as comparações dos coeficientes de consanguinidade estimados com os obtidos com o modelo Mix14R indicam que modelos com uma única classe HBD subestimam ligeiramente os coeficientes de consanguinidade e resultam em correlações inferiores (> 0,96) do que modelos com duas ou mais classes HBD (> 0,99). A presença de múltiplas classes HBD (> 2) permite uma melhor avaliação das contribuições das diferentes gerações passadas (por exemplo, R k = 8 vs 64) mas não fornece melhores estimativas do coeficiente de consanguinidade em todo o genoma.

Table 3 Estimation of genomic inbreeding coefficients with models using different numbers of HBD classes (from 1 to 4) with pre-taxas R k definidas que correspondem ao comprimento esperado em Morgans de segmentos HBD e com o painel LD

Comparação com outros estimadores de coeficiente de consanguinidade

Means e gamas de coeficientes de consanguinidade estimados com diferentes métodos e o painel HD estão na Tabela 4 e as suas correlações estão na Tabela 5, e em Ficheiro adicional 5: Tabelas S1 e S2 para outros painéis. Similar ao nosso modelo, modelos baseados na homozigocidade observada e ROH resultaram em coeficientes de consanguinidade elevados (respectivamente, 0,644 e 0,151 em média) enquanto que outros estimadores genómicos resultaram em coeficientes de consanguinidade centrados em torno de 0 e incluindo valores negativos. Deve notar-se que valores mais elevados são obtidos em média (0,268) quando se utilizam regras menos rigorosas para identificar ROH (por exemplo, janelas de 20 SNPs e pelo menos 10 SNPs por ROH). Observamos correlações muito elevadas entre estimativas baseadas em HMM e ambas as medidas baseadas na homozigosidade (r = 0,95 com FHOM e FExHOM, sendo estas duas medidas apresentando uma correlação de 1 e sendo essencialmente as mesmas) ou na ROH (r = 0,95 com FROH), o que sugere que com grandes números de SNPs, a heurística simples (ignorando frequências alélicas, espaçamento SNP, etc.) são eficientes (sendo FHOM e FROH altamente correlacionadas, r = 0,97). A correlação entre FHOM estimada com painéis LD e HD é igual a 0,890, o que é ligeiramente inferior à correlação entre as estimativas obtidas com o HMM para estes dois painéis (r = 0,934), o que indica que os estimadores globais ainda funcionam correctamente com 6844 SNPs nesta população. Os métodos ROH baseados em regras são menos eficientes com densidades de SNP mais baixas, uma vez que capturam apenas os fragmentos mais longos (5 Mb ou mais e 20 Mb em média) com os parâmetros utilizados no estudo actual (o tamanho padrão das janelas em plink). De facto, os estimadores baseados em ROH são raramente utilizados com o painel LD no gado, embora mais segmentos HBD possam ser identificados com regras menos rigorosas, à custa de uma maior taxa de falsos positivos. Com uma baixa densidade SNP, o quadro HMM ainda fornece probabilidades correctas de HBD global e local, embora os segmentos HBD não sejam identificados sem ambiguidade.

Table 4 Summary statistics for the inbreeding coefficients estimated for the 634 Belgian Blue sires with different methods and using the HD panel
Table 5 Correlações entre coeficientes de consanguinidade estimados para os 634 reprodutores Belgas Blue com diferentes métodos e usando o painel HD

Correlações de estimativas do GRM tradicional com as nossas estimativas são moderadamente altas (r = 0.73) e inferiores com estimadores de homozigocidade (r = 0,63) e com estimadores baseados em ROH (0,61). O FGRM foi calculado com a fórmula proposta por , que divide todas as contribuições do SNP pelo mesmo peso. Quando estimado com a fórmula alternativa, que divide cada contribuição do SNP pelo seu próprio peso 2f i (1 – f i ) (sendo f i a frequência do SNP i) como em Amin et al. , as correlações foram mais baixas (isto é, 0,48 com FG, 0,34 com FHOM e 0,33 com FROH). O estimador baseado nas correlações unificadas entre gametas propostas por Yang et al. apresentaram correlações relativamente altas tanto com FG e FGRM (respectivamente, 0,90 e 0,92) e correlações ligeiramente mais baixas com os outros estimadores (r = 0,87 e 0,85 com FHOM e FROH, respectivamente).

Correlações destas estimativas com coeficientes de consanguinidade de pedigree (considerando apenas os indivíduos nascidos após 1999 para aumentar a profundidade do pedigree) estão também na Tabela 5. As correlações globais foram moderadas com os valores mais elevados para correlações com a homozigosidade e medidas baseadas em ROH (0,55 para ambas as medidas) e valores ligeiramente inferiores para aqueles com o estimador baseado em HMM (0,46), enquanto que observámos uma relação baixa com FGRM (0,29) e uma correlação moderada com FUNI (0,45). Também comparámos o FPED e coeficientes de consanguinidade estimados com o nosso modelo em relação a diferentes populações de base (Fig. 8) e constatámos que as correlações aumentaram até FG-32 (capturando a consanguinidade de antepassados de aproximadamente 16 gerações atrás) e depois apresentaram um planalto de FG-32 a FG-256 atingindo um máximo de r = 0,56 (ou seja, ligeiramente melhor do que os estimadores baseados na homozigocidade). Esta tendência era esperada uma vez que o FPED é estimado para um número limitado de gerações atrás no tempo. O número médio equivalente de gerações conhecidas estimado com o PEDIG foi de 6,3 para os touros nascidos depois de 1999 (aumentou de 5,5 para os touros nascidos em 2000 para 7,5 para os nascidos em 2010) correspondendo em média ao FG-16. A adição de HBD classe R k = 32 permite a captura de contribuições de alguns ramos mais antigos do pedigree e dos mais pequenos segmentos HBD herdados de antepassados comuns no pedigree.

Fig. 8
figure8

Correlações entre os coeficientes de consanguinidade estimados em relação a diferentes populações de base (F G-T ) e o coeficiente de consanguinidade estimado a partir dos dados de pedigree para os garanhões Belgas Blue nascidos após 1999 e utilizando o painel HD. Foram obtidas diferentes populações de base seleccionando diferentes limiares T que determinam quais as classes HBD consideradas para estimar F G-T (por exemplo, fixando a população de base aproximadamente 0,5 * T gerações no passado). Os coeficientes de consanguinidade correspondentes F G-T são estimados como a probabilidade de pertencer a qualquer uma das classes HBD com uma média R k ≤ T em todo o genoma. Os coeficientes de consanguinidade genómica foram estimados com o modelo Mix14R

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *