Em formação

10.8: Sequenciamento de DNA - Biologia


A. Uma breve história do sequenciamento de DNA

O sequenciamento de RNA veio primeiro, quando Robert Holley sequenciou um tRNA em 1965. O sequenciamento direto de tRNAs foi possível porque os tRNAs são pequenos e curtos ácidos nucléicos e porque muitas das bases nos tRNAs são quimicamente modificadas após a transcrição. Um método inicial de sequenciamento de DNA desenvolvido por Walter Gilbert e colegas envolvia a fragmentação do DNA, o sequenciamento dos pequenos fragmentos de DNA e o alinhamento das sequências sobrepostas dos fragmentos curtos para montar sequências mais longas. Outro método, a técnica de sequenciação de DNA 'didesoxi' baseada na síntese de DNA, foi desenvolvida por Frederick Sanger na Inglaterra. Sanger e Gilbert ganharam o Prêmio Nobel de Química em 1983 por seus esforços de sequenciamento de DNA. No entanto, devido à sua simplicidade, o método de Sanger rapidamente se tornou o padrão para sequenciar todos os tipos de DNAs clonados.

O primeiro genoma completo a ser sequenciado foi o de um bacteriófago (vírus bacteriano) denominado φX174. Ao mesmo tempo que ocorriam os avanços na tecnologia de sequenciamento, também ocorriam alguns dos primeiros desenvolvimentos na tecnologia do DNA recombinante. Juntos, eles levaram a clonagem e sequenciamento de DNA mais eficientes e rápidos de fontes cada vez mais diversas. O primeiro foco foi, naturalmente, em genes e genomas de organismos-modelo importantes, como E. coli, C. elegans, fermento (S. cerevisiae)… E, claro, nós! Em 1995, Craig Venter e colegas da Instituto de Pesquisa Genômica completou a sequência de um genoma bacteriano inteiro (Haemophilus influenzae) e em 2001, o grupo privado de Venter, juntamente com Frances Collins e colegas do NIH, publicou um primeiro rascunho da sequência do genoma humano. Venter provou a eficácia de uma abordagem de sequenciamento do genoma completo chamada sequenciamento de espingarda, que foi muito mais rápido do que a estratégia de sequenciamento "linear" gene por gene, fragmento por fragmento, usada por outros investigadores (mais tarde!). Como o método de sequenciamento de DNA didesoxinucleotídico de Sanger continua sendo uma metodologia comum e econômica, vamos considerar os princípios básicos do protocolo.

B. Detalhes da Sequenciação DiDeoxy

Dado um DNA modelo (por exemplo, um cDNA de plasmídeo), Sanger usou protocolos de replicação in vitro para demonstrar que ele poderia:

  1. Replicar o DNA em condições que interromperam aleatoriamente a adição de nucleotídeos em todas as posições possíveis nas fitas em crescimento.
  2. Separe e depois detecte esses fragmentos de DNA de DNA replicado.

Lembre-se de que as polimerases de DNA catalisam a formação de ligações fosfodiéster ligando o ( alpha ) fosfato de um trifosfato de nucleotídeo para o 3 'OH livre de um desoxinucleotídeo no final de uma fita de DNA em crescimento. Lembre-se também de que o açúcar ribose nos precursores de replicação de desoxinucleotídeos carece de um grupo 2 'OH (hidroxil). O truque de Sanger era adicionar trifosfatos didesoxinucleotídicos à sua mistura de replicação in vitro. A ribose em um didesoxinucleotídeo trifosfato (ddNTP) carece de um 3 ’OH, além do grupo 2’ OH (como mostrado abaixo).

Adicionar um didesoxinucleotídeo a uma fita de DNA em crescimento interrompe a replicação. Nenhum outro nucleotídeo pode ser adicionado à extremidade 3 'da fita de DNA em replicação porque o 3'-OH necessário para a síntese de desidratação da próxima ligação fosfodiéster está ausente! Porque eles podem parar a replicação em células em crescimento ativo, ddNTPs, como didesoxiadenosina (nome comercial, cordicepina) são drogas quimioterápicas anticâncer.

Uma olhada em um protocolo de sequenciamento manual de DNA revela o que está acontecendo nas reações de sequenciamento. Quatro tubos de reação são configurados, cada um contendo o DNA modelo a ser sequenciado, um primer de sequência conhecida e os quatro precursores de desoxinucleotídeos necessários para a replicação.

A configuração para sequenciamento manual de DNA é mostrada abaixo.

Um ddNTP diferente, (ddATP, ddCTP, ddGTP ou ddTTP) é adicionado a cada um dos quatro tubos. Finalmente, a DNA polimerase é adicionada a cada tubo para iniciar a reação de síntese de DNA. Durante a síntese de DNA, fragmentos de diferentes comprimentos de novo DNA se acumulam à medida que os ddNTPs incorporam bases complementares opostas no DNA modelo que está sendo sequenciado. As expectativas das reações de sequenciação didioxi nos quatro tubos são ilustradas abaixo.

Pouco tempo depois de adicionar a DNA polimerase para iniciar as reações, a mistura é aquecida para separar as fitas de DNA e nova DNA polimerase é adicionada para repetir as reações de síntese. Essas reações de sequenciamento são repetidas até 30 vezes para produzir fragmentos de DNA radioativos suficientes para serem detectados. Quando o calor é estável Taq DNA polimerase da bactéria termofílica Thermus aquaticus tornou-se disponível (mais tarde!), não era mais necessário adicionar DNA polimerase fresco após cada ciclo de replicação. Os muitos ciclos de aquecimento e resfriamento necessários para o que ficou conhecido como sequenciamento de DNA de terminação de cadeia logo foram automatizados usando termocicladores programáveis.

Como uma pequena quantidade de um desoxinucleotídeo radioativo (geralmente ATP marcado com 32P) estava presente em cada tubo de reação, os fragmentos de DNA recém-feitos são radioativos. Após a eletroforese para separar os novos fragmentos de DNA em cada tubo, a autorradiografia do gel eletroforético revela a posição de cada fragmento terminado. A sequência de DNA pode então ser lida a partir do gel, conforme ilustrado na autorradiografia simulada abaixo.

Conforme mostrado no desenho, a sequência de DNA pode ser lida lendo as bases da parte inferior do gel, começando com o C na parte inferior da pista C. Tente ler a sequência você mesmo!

O primeiro método de sequenciamento de DNA semiautomático foi inventado no laboratório de Leroy Hood na Califórnia em 1986. Embora ainda sequenciando Sanger, os quatro didesoxinucleotídeos na reação de sequenciamento foram marcados para detecção com corantes fluorescentes em vez de nucleotídeos marcados com fosfato radioativo. Após as reações de sequenciamento, os produtos da reação são submetidos à eletroforese em um "sequenciador automático de DNA". A luz ultravioleta excita os fragmentos de DNA terminados em corante em migração à medida que passam por um detector. A cor de sua fluorescência é detectada, processada e enviada para um computador, gerando um gráfico codificado por cores como o mostrado abaixo, mostrando a ordem (e, portanto, o comprimento) dos fragmentos que passam pelo detector e, portanto, a sequência da fita.

Uma característica mais útil deste método de sequenciamento é que um modelo de DNA pode ser sequenciado em um único tubo, contendo todos os componentes necessários, incluindo tudo quatro didesoxinucleotídeos! Isso ocorre porque o detector de fluorescência na máquina de sequenciamento vê separadamente todos os fragmentos curtos terminados em ddNTP à medida que se movem através do gel eletroforético.

As inovações de Hood foram rapidamente comercializadas, tornando possíveis grandes projetos de sequenciamento, incluindo sequenciamento do genoma completo. A rapidez do sequenciamento de DNA automatizado levou à criação de grandes bancos de dados de sequências nos EUA e na Europa.

O NCBI (National Center for Biological Information) mantém o banco de dados dos EUA. Apesar de sua localização, o NCBI arquiva virtualmente todas as sequências de DNA determinadas em todo o mundo. Novos sequenciadores de DNA ‘minúsculos’ tornaram o DNA de sequenciamento tão portátil que, em 2016, um até foi usado no Estação Espacial Internacional. Bancos de dados em expansão e novas ferramentas e protocolos (alguns são descritos abaixo) para encontrar, comparar e analisar sequências de DNA também cresceram rapidamente.

C. Sequenciamento em grande escala

O sequenciamento em grande escala tem como alvo genomas procarióticos inteiros e, normalmente, genomas eucarióticos muito maiores. Os últimos requerem estratégias que sequenciam fragmentos de DNA longos e / ou sequenciam fragmentos de DNA mais rapidamente. Já observamos o sequenciamento shotgun usado por Venter para sequenciar genomas cada vez maiores (incluindo o nosso ... ou mais precisamente, o seu próprio!). No sequenciamento shotgun, fragmentos de DNA clonados de 1000 pares de bases ou mais são divididos aleatoriamente em fragmentos menores e mais facilmente sequenciados. Os fragmentos são eles próprios clonados e sequenciados e as sequências não redundantes são montadas alinhando regiões de sequência sobrepostas. O software de computador de hoje é bastante adepto do alinhamento rápido de sequências de sobreposição, bem como de conectar e exibir longas sequências de DNA contíguas. O sequenciamento do Shotgun é resumido abaixo.

As lacunas de sequência que permanecem após o sequenciamento shotgun podem ser preenchidas por primer walking, em que uma sequência conhecida perto da lacuna é a base da criação de um primer de sequenciamento para "andar" na região da lacuna em um DNA intacto que não foi fragmentado. Outra técnica de "preenchimento de lacunas" envolve PCR (a Reação em Cadeia da Polimerase, a ser descrita em breve). Resumidamente, dois oligonucleotídeos são sintetizados com base na informação de sequência em ambos os lados de uma lacuna. Em seguida, o PCR é usado para sintetizar o fragmento ausente e o fragmento é sequenciado para preencher a lacuna.


Mapeamento de todo o genoma da atividade do promotor autônomo em células humanas

Os métodos anteriores para caracterizar sistematicamente a atividade intrínseca da sequência de promotores foram limitados por um rendimento relativamente baixo e o comprimento das sequências que poderiam ser testadas. Aqui, apresentamos a 'pesquisa de elementos reguladores' (SuRE), um método que analisa mais de 10 8 fragmentos de DNA, cada um com 0,2–2 kb de tamanho, quanto à sua capacidade de conduzir a transcrição de forma autônoma. No SuRE, uma biblioteca de plasmídeos de fragmentos genômicos aleatórios a montante de um código de barras de 20 pb é construída e decodificada por sequenciamento de extremidades emparelhadas. Esta biblioteca é usada para transfectar células e os códigos de barras no RNA transcrito são quantificados por sequenciação de alto rendimento. Quando aplicado ao genoma humano, alcançamos a cobertura do genoma de 55 vezes, o que nos permite mapear a atividade do promotor autônomo em todo o genoma em células K562. Por modelagem computacional, delineamos sub-regiões dentro de promotores que são relevantes para sua atividade. Nós mostramos que a transcrição do promotor anti-sentido é geralmente dependente das sequências do promotor do núcleo sentido, e que a maioria dos intensificadores e várias famílias de elementos repetitivos atuam como locais de iniciação da transcrição autônomos.


1. Introdução

Muito do que sabemos sobre as regras fundamentais que sustentam os sistemas biológicos foi coletado por meio do estudo de populações: populações de organismos ou populações de células dentro de organismos. No entanto, a última década viu o desenvolvimento de uma infinidade de técnicas que permitem o estudo de um grande número de células individuais, revelando a função celular em detalhes intrincados, mas também mostrando um alto nível de heterogeneidade celular. 1, 2 Essa heterogeneidade só se torna aparente no nível de uma única célula e é resultado de redes de programação celular, do ruído inerente à expressão gênica, bem como da dinâmica de sinalização. 3, 4 Quantificar e compreender a heterogeneidade celular e vinculá-la à função celular é de grande importância para muitas aplicações, por exemplo, a descoberta de células raras (por exemplo, no sistema imunológico), 5, 6 ganhando uma melhor compreensão da desenvolvimento de embriões, 7, 8 estudar as propriedades fundamentais de redes genéticas e de sinalização, 9 e analisar a composição de tumores sólidos. 10, 11 O isolamento e a caracterização de células individuais no nível do genoma, transcriptoma, proteoma ou metaboloma podem ser alcançados de várias maneiras diferentes, desde experimentos de citometria de fluxo de rendimento muito alto (mas número limitado de pontos de dados por célula), a estudos iniciais mostrando o sequenciamento do genoma completo ou do transcriptoma completo de um número limitado de células individuais colocadas em poços de microlitro. 12 Referimos o leitor interessado a uma série de revisões recentes que enfocam a biologia de célula única 1, 2, 6, 11 ou fornecem uma visão geral das diferentes tecnologias usadas. 13, 14

Apesar de um aumento exponencial no número de estudos de uma única célula relatados, esses experimentos não são nada triviais, com muitos desafios técnicos restantes, incluindo o isolamento de células únicas (de amostras sólidas), o manuseio de pequenas quantidades de materiais biológicos e laboriosos fluxos de trabalho. Nos últimos anos, a microfluídica e, em particular, a microfluídica de gotícula emergiu como uma tecnologia de escolha para uma abordagem facilmente implementável, de alto rendimento e relativamente barata para uma ampla gama de estudos de análise de célula única (Figura 1).

O objetivo desta revisão é comparar e contrastar as tecnologias de microfluídica de gotículas disponíveis para caracterização de célula única, a fim de permitir que usuários em potencial implementem rapidamente as melhores ferramentas.

Estruturamos esta revisão da seguinte forma: primeiro, apresentaremos brevemente o campo da microfluídica de gotículas e discutiremos as principais características que a tornam uma tecnologia ideal para análise de uma única célula. Em segundo lugar, apresentaremos diferentes métodos para a preparação de amostras de células individuais. Depois disso, forneceremos uma visão geral do estado da arte dos principais avanços em estudos genéticos, epigenéticos, transcriptômicos, proteômicos e metabólicos de uma única célula. Figura 2 fornece uma visão geral gráfica dos tópicos discutidos nesta revisão. Combinada, a revisão será útil para pesquisadores novatos no campo, mas também para cientistas experientes que desejam explorar novas combinações de estudos de uma única célula e esperam adaptar as tecnologias existentes para ampliar suas capacidades.


Introdução

Definir os motivos de reconhecimento de pequenas moléculas de ligação de DNA no espaço de sequência do tamanho do genoma é crítico para aplicações em biologia e nanotecnologia. As poliamidas Py-Im são oligômeros sintéticos de ligação ao DNA compostos por análogos de N-metilpirrole. 1 Aminoácidos aromáticos combinados como pares de anéis assimétricos podem ser usados ​​para ler o sulco menor do DNA de acordo com regras de emparelhamento bem definidas (Figura & # x200B (Figura 1). 1). Empilhado lado a lado N-metilimidazol (Im) e N-metilpirrol (Py) carboxamidas (pares Im / Py) distinguem G & # x000b7C de C & # x000b7G pares de bases, 2 enquanto N-metil-3-hidroxipirrol (Hp) / Py mostra especificidade para T & # x000b7A sobre A & # x000b7T. 3 Finalmente, os pares Py / Py especificam A & # x000b7T e T & # x000b7A. 4 A unidade de rotação & # x003b3-ácido aminobutírico (GABA) funciona para manter os anéis emparelhados inequivocamente quando dobrados em uma configuração em grampo. A unidade giratória também funciona no grampo de cabelo como um elemento seletivo A & # x000b7T / T & # x000b7A (Figura & # x200B (Figura 1A). 1 A). Poliamidas em gancho podem potencialmente se ligar em duas orientações: alinhadas 5 & # x02032-3 & # x02032 no DNA em relação ao terminal NC da poliamida (referido como a orientação direta) ou 3 & # x02032-5 & # x02032 no DNA em relação a o terminal NC (orientação reversa). As poliamidas em gancho que incorporam uma unidade giratória GABA não substituída mostram uma preferência energética modesta para a orientação frontal. 5 Esta preferência é aumentada quando um quiral, & # x003b1-substituído (R) -amino-GABA por sua vez é introduzida (& # x0003e100 vezes maior ligação dos locais direto versus reverso). 6 Mais recentemente, & # x0201csegunda geração & # x0201d poliamidas em gancho com elementos de curva & # x003b2-amino-GABA mostraram afinidade de ligação aumentada para algumas poliamidas em gancho. Esses grampos de curva & # x003b2 aumentam a atividade biológica da poliamida e a captação nuclear em vários casos. 7 & # x022129 O efeito do & # x003b2-amino GABA na orientação da poliamida e na especificidade da sequência são menos bem caracterizados. 10 Aqui aplicamos sequenciamento maciço paralelo para testar a ligação poliamida-DNA, permitindo que motivos de ligação imprevistos sejam descobertos. Este ensaio de sequenciamento imparcial facilita o design iterativo da poliamida, orientando a reprogramação da especificidade da poliamida e nos permitindo codificar os princípios gerais do design críticos para o reconhecimento de sulcos menores.

(A) Reconhecimento de poliamida em gancho Py-Im do sulco menor de DNA. Os pares de anéis de aminoácidos aromáticos reconhecem pares de bases de DNA distintos. Estruturas completas para cada conjugado de poliamida-biotina em gancho usado podem ser encontradas em Informações de Apoio. (B) Esquema para análise Bind-n-Seq de poliamidas de ligação a DNA. O DNA de fita dupla contendo um segmento degenerado de 21 pb é enriquecido, purificado e analisado por meio de sequenciamento de alto rendimento. As sequências de consenso de DNA comumente ligadas são identificadas por meio de pesquisa de motivo.

Historicamente, o projeto de moléculas de ligação de DNA específicas de sequência tem sido guiado por avanços essenciais em técnicas de triagem analítica. Para um grampo de cabelo de oito anéis que se liga a 6 bp, existem formalmente 2.080 diferentes sítios de DNA duplex de 6mer que são alvos potenciais. 11 A pegada e a clivagem por afinidade apoiaram o desenvolvimento das regras de emparelhamento, definindo as preferências de sequência e a orientação dos oligômeros de oito anéis em gancho de cabelo Py-Im no contexto de um fragmento de restrição de DNA de 150 & # x02013250 bp, efetivamente uma biblioteca de algumas centenas de locais de ligação potenciais , cada um com 6 bp de tamanho. 12 & # x0221215 As titulações quantitativas da pegada de DNase adicionaram informações críticas sobre a energética e as penalidades para a ligação de incompatibilidade de base única. 16,17 No entanto, as aplicações de poliamidas Py-Im em biologia e nanotecnologia exigirão o conhecimento da especificidade da sequência em contextos de sequência maiores e necessitaram do desenvolvimento de técnicas de triagem que analisem o espaço da sequência em um maior rendimento, de maneira menos trabalhosa do que o gel. pegada baseada. O ensaio de deslocamento intercalador de fluorescência foi aplicado para classificar a ligação da poliamida a todas as sequências únicas de 5 bp, mas é de natureza qualitativa e tem limitações em sua capacidade de abordar locais de ligação maiores no formato de microplaca. 18,19 Uma abordagem semelhante a SELEX desenvolvida por Van Dyke e colegas de trabalho foi usada para determinar as preferências de ligação a duas poliamidas em gancho dentro de uma biblioteca de 1,3 & # x000d7 10 8 sequências de DNA, mas exigiu várias rodadas de seleção e foi limitada a qualitativa identificação dos locais de ligação de poliamida de maior afinidade. 20 Ansari e colegas de trabalho aplicaram uma plataforma de microarray para analisar a ligação de poliamidas marcadas com Cy3 no contexto de todos os 10mers distintos (5,24 & # x000d7 10 5 sequências únicas). 21 & # x0221223 Quando calibrado com dados de pegada da DNase I, este método permite a determinação da constante de associação de equilíbrio quantitativo (Kuma) valores para ligação de poliamida a todos os locais possíveis de correspondência e de incompatibilidade de par de base único. 22 No entanto, a aplicação de rotina de métodos de microarray é dificultada pela necessidade de síntese e análise customizada de arrays, apresentando um obstáculo técnico significativo como a transição de instalações genômicas centrais para plataformas baseadas em sequenciamento de alto rendimento. 24

Recentemente, vários métodos foram desenvolvidos para caracterizar as interações de proteínas e # x02013DNA usando sequenciamento paralelo maciço. 25 & # x0221228 Uma dessas técnicas, denominada Bind-n-Seq, usa fatores de transcrição marcados por afinidade para enriquecer um pool de oligonucleotídeos contendo 21mers aleatórios (& # x0003e2 & # x000d7 10 12 sequências únicas) em uma única rodada de seleção (Figura & # x200B (Figura 1 1 B). 27 O sequenciamento e a análise de dados permitem a identificação de sequências de alta afinidade e se correlacionam bem com medições de fase de solução de afinidade de ligação. Cada reação Bind-n-Seq contém 2,5 & # x000d7 10 7 cópias de cada 10mer possível , em comparação com 4 cópias de cada 10mer amostrado por métodos de microarray. 21 Isso garante a amostragem de sequências curtas incorporadas em uma sequência 21mer diversa, fornecendo uma imagem de média de contexto de ligação. Combinado com a capacidade de consultar sequências mais longas e reações de ligação múltipla de sequência profunda simultaneamente, esta abordagem pode representar uma alternativa útil para métodos baseados em array e fornecer informações importantes sobre a ligação de poliamida-DNA no espaço de sequência do tamanho do genoma.


Discussão

Nossos resultados revelam que, ao contrário de estratégias alternativas, incluindo genótipos SNP (de microarrays SNP), verificados em uma única espécie ou população, que possuem vieses inerentes entre espécies ou estudos populacionais [31], sequenciamento de todo o genoma (levando à detecção de milhões de polimorfismos) permitem relações filogenéticas e padrões de mistura dentro do gênero Sus para ser resolvido com segurança. De fato, ao tentar recapitular a análise usando o chip SNP de 60K porcino [32] (arquivo adicional 8), foram encontradas diferenças substanciais nas estimativas de comprimento de ramal. Essas discrepâncias são devido ao viés de averiguação que demonstra que um método simples de genotipagem de matriz SNP, mesmo para vários indivíduos, não teria permitido a resolução proporcionada por um único genoma completo. Além disso, mostramos que existe um alto grau de discordância filogenética em todo o genoma. Tal discordância poderia potencialmente levar a conclusões incorretas sobre as relações entre essas espécies se apenas um subconjunto desses loci fosse amostrado [16]. Embora a incongruência filogenética possa frustrar a inferência taxonômica, ela tem o potencial de testar a presença de fluxo gênico interespecífico. Nossos dados demonstram que a riqueza de informações extraídas desses genomas permite uma análise aprofundada (arquivos adicionais 4 e 5) que permite a reconstrução temporal da história evolutiva de. Sus discutido abaixo.

História evolutiva de Sus

Nossas estimativas de tempo de divergência sugerem que a divergência inicial do javali eurasiano de um clado que consiste em outros Sus espécies ocorreram durante o estágio Zanclean no início do Plioceno (Figura 1B 5,3 a 3,5 Mya). Embora a localização geográfica precisa dessa divisão (em Sundaland ou no sudeste da Ásia continental) permaneça obscura, o momento coincide com a divergência entre outros táxons sundaicos e asiáticos continentais [10]. Os milhões de anos subsequentes (de 3,5 a 2,5 Mya, o estágio Piacenziano, Figuras 1B e 2) foram marcados por períodos de frio mais intenso que provavelmente facilitaram o surgimento de uma massa terrestre contígua de Sundaland por períodos prolongados (Figuras 1A e 2). É provável que quedas concomitantes nos níveis do mar tenham permitido a dispersão do ancestral de Sus verrucosus para Java (consistente com o registro fóssil Arquivo adicional 6). A profunda divisão entre S. verrucosus e outro ISEA Sus demonstra que esta espécie ameaçada de extinção S. verrucosus representa uma linhagem distinta. Tal descoberta tem implicações para ex e no local programas de conservação, pois mostra que esta espécie representa uma unidade evolutivamente significativa que merece estratégias de conservação específicas.

Nossos resultados fornecem evidências de que, após a divergência do S. verrucosus linhagem, o ancestral de Sus cebifrons colonizou as Filipinas durante o primeiro estágio do Pleistoceno, aproximadamente 2,4 a 1,6 Mya (estágio Gelasiano, Figuras 1B e 2). Esta data se correlaciona com a atividade tectônica que levou ao isolamento das Filipinas de Sundaland, mesmo durante os períodos de baixo nível do mar [33]. Este mesmo período testemunhou a divergência entre S. scrofa populações em Sumatra e no leste da Ásia continental (Figuras 1B e 2). No entanto, não está claro se essa divergência foi o resultado da migração de S. scrofa do ISEA para o continente ou vice-versa. Além disso, esta profunda divergência entre o continente e os javalis do ISEA (S. scrofa) apóia estudos morfológicos anteriores que defenderam a distinção desses ISEA S. scrofa subespécies em comparação com outras populações MSEA [13] (ou seja, o porco com faixas S. scrofa vittatus).

Nossos resultados mostram que S. celebensis colonizou Sulawesi, do oeste (Bornéu), durante o último estágio do Pleistoceno (Figuras 1B e 2 da Calábria), aproximadamente 1,6 a 0,8 Mya. Parece que esta colonização ocorreu apesar das evidências de que o Estreito de Makassar que separa Sundaland e Sulawesi continuou a existir mesmo durante os períodos de redução do nível do mar, restringindo assim a dispersão durante o Plio-Pleistoceno [34]. No entanto, incidências mais frequentes de níveis mais baixos do mar durante este período [28] (Figura 2) teriam reduzido a distância entre Sundaland e Sulawesi, aumentando assim a probabilidade de uma travessia bem-sucedida do estreito. Nossa análise filogenômica implica que as populações de Bornéu atuaram como a fonte inicial e principal para esta dispersão, embora a análise de mistura sugira que S. verrucosus em Java e S. cebifrons nas Filipinas mais tarde também contribuiu para o S. celebensis pool genético (arquivos adicionais 4 e 5). Esses resultados podem explicar a existência de dois bem apoiados, mas parafiléticos S. celebensis clados de mtDNA presentes em Sulawesi [15, 25].

Embora a dispersão ultramarina de suidas indígenas de Java e das Filipinas para Sulawesi possa ter sido o resultado da translocação com ajuda humana, a divergência inicial de S. celebensis da população de Bornéu é muito velha para ter sido induzida por humanos modernos. Assim, se a dispersão no exterior ocorreu entre Bornéu e Sulawesi, também pode ter sido possível para os porcos se dispersarem naturalmente de Java e das Filipinas, nos últimos milhões de anos (por exemplo, por rafting ou natação). Outros estudos que podem datar esses eventos de colonização de Java e das Filipinas em Sulawesi, usando vários genomas de S. celebensis, poderia permitir avaliações sobre se essas migrações foram de fato o resultado de translocação humana.

A divergência continental de S. scrofa em populações regionalmente discretas também começaram durante a metade do Pleistoceno (Figura 1B). Populações de S. scrofa da Ásia migrou para o oeste aproximadamente 1,2 Mya, alcançando a Europa em torno de 0,8 Mya, como sugerido pela primeira aparição de S. scrofa no registro fóssil (consulte o arquivo adicional 6 para obter detalhes). A primeira divergência entre oriental e ocidental S. scrofa, conforme cronometrado por nossa análise do relógio molecular (Figura 1B), foi provavelmente o resultado de um clima mais frio durante o período da Calábria, que isolou populações em pequenos refúgios na Eurásia (Figura 2). Nossos dados indicam que a divisão entre o norte e o sul da China S. scrofa as populações ocorreram durante o estágio jônico de aproximadamente 0,6 Mya (Figura 1B). Este tempo se correlaciona com a redução mais significativa da temperatura global no Plio-Pleistoceno, caracterizada por longos intervalos glaciais e curtos períodos interglaciais, que começaram aproximadamente 0,8 Mya [35] (Estágio Jônico Figuras 1B e 2). Nesse período, as florestas se contraíram em pequenos refúgios, isolando assim as populações em todo o MSEA [10].

Substituição de mistura e mtDNA

Embora tenhamos apresentado a história evolutiva de Sus como eventos de especiação resultantes de bifurcações simples, estatísticas D [26] e simulações desafiam esta visão e sugerem numerosos casos de diversificação e reticulação (arquivos adicionais 4 e 5). Nossa análise mostra que as flutuações concomitantes do nível do mar permitiram um extenso fluxo gênico intra e interespecífico durante esses períodos, tanto em Sundaland quanto entre Sundaland e MSEA (Figura 1C, D Arquivos adicionais 4 e 5). Mistura de frações entre Sumatra e Chinês S. scrofa as subpopulações eram maiores (9,5 a 11% Arquivo adicional 4) do que aquelas entre Sumatra S. scrofa e outro Sus espécies em Sundaland (1,3 a 4,2% Arquivo adicional 4). Esta descoberta sugere que, durante o Pleistoceno, mais fluxo gênico ocorreu entre os chineses e Sumatra. S. scrofa populações do que entre Sumatra S. scrofa populações e outras Sus espécies que vivem em Sundaland. A distância geográfica entre Sumatra e Chinês S. scrofa populações é muito maior do que entre Sumatra S. scrofa e o outro Sus espécies que vivem em Sundaland (por exemplo, S. verrucosus e Sus barbatus) Assim, este padrão suporta um modelo de especiação em andamento com fluxo gênico em que a relação entre espécies está mais intimamente correlacionada com uma história de mistura do que com a proximidade geográfica atual.

Apesar desses períodos alternados de divergência e homogeneização, as árvores construídas com genomas completos recuperam as denominações de espécies modernas. O mesmo não acontece com as árvores filogenéticas mitocondriais publicadas anteriormente de porcos do ISEA e MSEA que foram capazes de distinguir populações geograficamente distintas de S. scrofa na Eurásia, mas foram incapazes de recuperar a monofilia de espécies morfologicamente distintas que viviam em Sundaland [15, 16, 25, 36]. Este paradoxo pode resultar da informação filogenética limitada presente nos fragmentos mitocondriais curtos usados ​​em estudos anteriores, ou do padrão complexo de mistura em Sundaland descrito acima (Figura 1C, D).

Nossa árvore filogenética com base em genomas de mtDNA quase completos (Figura 1E) é consistente com estudos anteriores [15, 25], apoiando uma relação parafilética entre nãoS. scrofa espécies e um clado monofilético de táxons de Sundaland com ramos curtos. Além disso, nossa análise demográfica (Figura 3) mostra que as espécies que vivem em Sundaland sofreram um declínio populacional de longo prazo, mais extenso do que no MSEA (Arquivo adicional 7), durante o Pleistoceno. Esses resultados sugerem que houve uma substituição de haplótipos mitocondriais que ocorreu em Sundaland durante a última parte do Pleistoceno (1,5 Mya até o presente arquivo adicional 4), após a divergência de S. celebenisis (Figura 1B, E Arquivo adicional 4). A substituição do mtDNA pode ter sido facilitada por pequenos tamanhos populacionais (Figura 3). Táxons endêmicos para as Filipinas e Sulawesi, isolados de Sundaland, não foram envolvidos nesta mistura e abrigam haplótipos mtDNA altamente divergentes de sequências mitocondriais completas e fragmentos da região de controle [15, 25] (Figura 1E). É improvável que esse fenômeno seja uma exceção em porcos e foi recentemente observado em ursos polares [3].

Translocação mediada por humanos

Embora a mudança climática tenha tido a influência mais dramática e sustentada na história de especiação dos suídeos, os humanos também afetaram esse processo. Durante os últimos 40.000 anos, os humanos translocaram ativa e passivamente centenas de espécies (como comensais, selvagens ou domésticas) dentro do ISEA, Wallacea e Australasia [11], e as assinaturas da mistura resultante entre linhagens de suídeos são evidentes nas sequências genômicas . Além disso, S. scrofa é uma espécie importante para a agricultura que foi domesticada de forma independente pelo menos duas vezes na Eurásia continental (Oriente Próximo e China) [25]. A estreita relação entre humanos e porcos torna esta espécie mais propensa a translocações antropogênicas. Na verdade, nossa análise de mistura revelou a existência de fluxo gênico interespecífico que envolveu a dispersão de longa distância através de barreiras que provavelmente não seriam o resultado de vias naturais de migração.

Estudos morfológicos anteriores [37] e genéticos [15] sugeriram que S. celebensis foi mantido em cativeiro e transportado por humanos de Sulawesi para Timor, Flora, Halmahera e Simeulue (Noroeste de Sumatra). As análises de mistura apóiam essas afirmações, revelando o fluxo gênico de S. celebensis no local S. scrofa populações em Sumatra e MSEA. Mesmo durante os períodos de frio, Sulawesi e Sundaland foram separados por um canal de mar profundo [34]. Assim, parece improvável que as populações de S. celebensis, de Sulawesi, conseguiu voltar para as ilhas isoladas ao redor de Sumatra e MSEA nos últimos 1,5 minutos desde sua divergência de S. barbatus. Em sua totalidade, esses resultados fornecem evidências de que a translocação humana de suids ocorreu em toda a região e não se restringiu às ilhas próximas a Sulawesi.

Também detectamos uma forte assinatura de fluxo gênico da Europa S. scrofa populations into species in ISEA, consistent with a previous study that identified European mitochondrial haplotypes among populations in ISEA [15]. This gene-flow was most likely the result of human-induced dispersal of European pigs into ISEA within the past few hundred years. Some of these introduced pigs likely became feral and interbred with indigenous species.

While some of the admixture signals detected in this study are unequivocal (that is, admixture within Sundaland, supported by mtDNA and frequent merging of these islands during the Plio-Pleistocene epoch), other signatures, including those involving long distance dispersal, are more difficult to interpret. For example, admixture involving un-sampled or extinct lineages can result in complex site patterns and could influence the results of the D-statistics [26]. For instance, the signal of gene-flow from European S. scrofa into species in ISEA could be the result of an admixture from an un-sampled sister lineage, and may not necessarily involve European pigs per se. Another limitation of the method can arise from ancestral population subdivision as has been suggested to account for signatures of Neanderthal and human admixture [38]. However, ancestral subdivision is unlikely to affect our analysis because of the evolutionary time frame investigated here (Additional file 4).

Factors driving and reversing speciation in Sus

Our results suggest that Plio-Pleistocene climatic fluctuations had a significant impact on the diversification and homogenization of Sus in ISEA and MSEA. Speciation within Sus was mainly driven by dispersal across ISEA during the short glacial interval of the late Pliocene and early Pleistocene as suggested by evidence gleaned from other taxa [10, 39]. Rapid changes in climate and sea level resulted in population bottlenecks across ISEA (Figure 3). In addition, extensive intra- and inter-specific gene-flow led to instances of mtDNA replacement and a reversal (however temporary) of the speciation process.

Methodological challenges

Our work demonstrates that the analysis of high-throughput sequencing data provides a powerful tool to investigate speciation history but is unlikely to be devoid of sequencing errors, especially for low sequence coverage. However, the sequence coverage in our samples (7.5 to 25×) is expected to provide reliable genotype calls [40]. In addition, the major conclusions of this study are not expected to suffer from these biases as these analyses rely on non-singleton sites. Specifically, for a site to be phylogenetically informative the mutation must be shared by at least two taxa and the D-statistic analysis is explicitly designed to be robust to sequencing errors resulting in singletons [26]. Therefore, for a sequencing error to influence our phylogenetic or admixture analysis, it would have to be systematic and have occurred separately in different samples sequenced at different times in different sequencing centers. Thus, making the reasonable assumption that sequencing errors are independent between the samples, the probability of creating enough falsely informative sites to bias these analyses is exceedingly low.

Another limitation of our phylogenetic analysis could stem from recombination. Indeed, due to recombination, each of our genomic bins may represent a mosaic of different evolutionary histories. Nonetheless, theory and simulations suggest that our overall conclusions are relatively insensitive to the effects of recombination [41]. This insensitivity is because, moving along a sequence, different topologies are highly correlated and hence recombination is expected to have small effects over short recombination distances [42].

Lastly, it is important to take results of demographic history with caution. Indeed, while we believe that the general pattern described in Figure 3 is reliable, the magnitude of this bottleneck, in different species, is difficult to interpret. Differences in coverage among our samples likely result in variable power to call heterozygous sites, and could explain at least some of the differences in demographic history between different species.


Advanced undergraduates, beginning graduate students, faculty and researchers that need a primer of molecular genetics as it relates to entomology. Libraries at institutions with strong programs in entomology, pest control, biological control, insect pathology, and molecular genetics

Preface to the Third Edition

Preface to the Second Edition

Preface to the First Edition

Part I: Genes and Genome Organization in Eukaryotes

Chapter 1. DNA, Gene Structure, and DNA Replication

1.2 DNA is the Hereditary Material: A Brief History

1.4 The “RNA World” Came First?

1.5 The Molecular Structure of DNA

1.6 The Molecular Structure of RNA

1.8 Complementary Base Pairing is Fundamental

1.9 DNA Exists in Several Forms

1.11 The Genetic Code for Protein-Coding Genes is a Triplet and is Degenerate

1.13 Efficient DNA Replication is Essential

1.14 DNA Replication is Semiconservative

1.15 Replication Begins at Replication Origins

1.16 DNA Replication Occurs Only in the 5′ to 3′ Direction

1.17 Replication of DNA Requires an RNA Primer

1.18 Ligation of Replicated DNA Fragments

1.19 DNA Replication during Mitosis in Eukaryotes

1.20 Telomeres at the End: A Solution to the Loss of DNA during Replication

1.21 DNA Replication Fidelity and DNA Repair

1.22 Mutations in the Genome

1.23 Common Genetic Terminology

1.24 Independent Assortment and Recombination during Sexual Reproduction

Chapter 2. Transcription, Translation, and Regulation of Eukaryotic DNA

2.3 RNA Synthesis is Gene Transcription

2.4 Transcription Involves Binding, Initiation, Elongation, and Termination

2.5 RNA Transcripts of Protein-Coding Genes

2.6 RNA of Protein-Coding Genes Must Be Modified and Processed in Eukaryotes

2.7 Splicing Out the Introns

2.8 Translation Involves Protein Synthesis

2.9 RNA Surveillance: Damage Control

2.10 Import and Export from the Nucleus

2.11 Transport of Proteins within the Cytoplasm

2.13 Chaperones and the Proteosome

2.14 RNA Silencing or Interference and miRNAs

2.15 Gene Regulation in Eukaryotes

2.16 Insulators and Boundaries

2.17 Chromosome or Gene Imprinting in Insects

2.18 Eukaryotic Genomes and Evolution

Chapter 3. Nuclear and Extranuclear DNA in Insects

3.3 C-Value Paradox: Is it Real?

3.4 Repetitive DNA is Common in Insects

3.5 Composition of Insect DNA

3.6 Chromosomes are DNA Plus Proteins

3.7 Packaging Long, Thin DNA Molecules into Tiny Spaces

3.8 Structure of the Nucleus

3.9 Euchromatin and Heterochromatin

3.12 Chromosomes during Mitosis and Meiosis

3.18 Extranuclear Inheritance in Mitochondrial Genes

3.19 Transposable Elements are Ubiquitous Agents that Alter Genomes

Chapter 4. Genetic Systems, Genome Evolution, and Genetic Control of Embryonic Development in Insects

4.3 Genetic Systems in Insects

4.4 Endopolyploidy is Common in Somatic Tissues of Arthropods

4.5 Genetics of Insects Other than D. melanogaster

4.6 Dynamic Insect Genomes

4.8 Unique-Sequence DNA in the Nucleus

4.9 Middle-Repetitive DNA in the Nucleus

4.10 Highly Repetitive DNA

4.11 Producing Large Amounts of Protein in a Short Time: Gene Amplification and Gene Duplication

4.12 Multiple Genomes in or on Insects: What is the “Biological Individual”?

4.14 Dissecting Development with D. melanogaster Mutants

4.15 Interactions During Development

4.16 Similarities and Differences in Development in Other Insects

4.17 Evo-Devo and the Revolution in Developmental Studies

Part II: Molecular Genetic Techniques

Chapter 5. Some Basic Tools: How to Cut, Paste, Copy, Measure, Visualize, and Clone DNA

5.2 Introduction to a Basic Molecular Biology Experiment

5.3 Extracting DNA from Insects

5.4 Precipitating Nucleic Acids

5.6 Cutting DNA with Restriction Endonucleases

5.8 Growth, Maintenance, and Storage of E. coli

5.9 Plasmids for Cloning in E. coli

5.10 Transforming E. coli with Plasmids

5.11 Purifying Plasmid DNA from E. coli

5.12 Electrophoresis in Agarose or Acrylamide Gels

5.13 Detecting, Viewing, and Photographing Nucleic Acids in Gels

5.14 Identifying Specific DNA by Southern Blot Analysis

5.15 Labeling DNA or RNA Probes

5.16 Removing DNA from Agarose Gels after Electrophoresis

5.17 Restriction-Site Mapping

Chapter 6. Some Additional Tools for the Molecular Biologist

6.3 The Perfect Genomic Library

6.5 Enzymes Used in Molecular Biology Experiments

6.6 Isolating a Specific Gene from a Library if Whole-Genome Sequencing is Not Done

6.7 Labeling Probes by a Variety of Methods

6.8 Baculovirus Vectors Express Foreign Polypeptides in Insect Cells

6.9 Expression Microarray Analysis

Chapter 7. DNA Sequencing and the Evolution of the “-Omics”

7.3 The Dideoxy or Chain-Termination (Sanger) Method

7.4 The Maxam and Gilbert Sequencing Method

7.5 Shotgun Strategies for Genomes

7.6 Sequencing DNA by the Polymerase Chain Reaction (PCR)

7.7 Automated Sanger Sequencers

7.8 Analyzing DNA Sequence Data

7.9 DNA-Sequence Data Banks

7.10 A Brief History of the Drosophila Genome Project

7.11 Next-Generation Sequencing Methods and Beyond

7.13 Genome Analyses of Other Arthropods

7.14 Transposable Elements (TEs) as Agents of Genome Evolution

7.17 Proteomics: Another “-Omic”

7.19 Structural Genomics—Another New Horizon?

7.21 Interactomes or Reactomes

7.22 The Post-Genomic Era: Systems Genetics

Chapter 8. DNA Amplification by the Polymerase Chain Reaction: Molecular Biology Made Accessible

8.3 The Basic Polymerase Chain Reaction (PCR)

8.4 Some Modifications of the PCR

8.5 Some Research Applications

8.6 Multiple Displacement Amplification: Another Method to Amplify DNA

Chapter 9. Transposable-Element Vectors and Other Methods to Genetically Modify Drosophila and Other Insects

9.3 P Elements and Hybrid Dysgenesis

9.4 P-Element Structure Varies

9.5 Transposition Method of P Elements

9.6 Origin of P Elements in D. melanogaster

9.7 P Vectors and Germ-Line Transformation

9.8 Using P-Element Vectors

9.9 Transformation of Other Insects with P Vectors

9.10 Evolution of Resistance to P Elements

9.11 Using P to Drive Genes into Populations

9.12 Relationship of P to Other Transposable Elements (TEs)

9.13 Other TEs Can Transform D. melanogaster

9.14 Improved Transformation Tools for Drosophila

9.15 TE Vectors to Transform Insects other than Drosophila

9.16 Cross Mobilization of TE Vectors

9.17 Conversion of Inactive TE Vectors to Activity

9.18 Suppression of Transgene Expression

9.19 Other Transformation Methods

Part III: Applications in Entomology

Chapter 10. Sex Determination in Insects

10.3 Costs and Benefits of Sexual Reproduction

10.4 Sex Determination Involves Soma and Germ-Line Tissues

10.5 Sex Determination in Drosophila melanogaster

10.6 Are Sex-Determination Mechanisms Diverse?

10.8 Meiotic Drive Can Distort Sex Ratios

10.11 Cytoplasmic Agents Distort Normal Sex Ratios

10.12 Paternal Sex-Ratio Chromosomes and Cytoplasmic Incompatibility in Nasonia

10.13 Male Killing in the Coccinellidae

10.14 Sex and the Sorted Insects

Chapter 11. Molecular Genetics of Insect Behavior

11.3 The Insect Nervous System

11.4 Traditional Genetic Analyses of Behavior

11.5 Molecular-Genetic Analyses of Insect Behavior

11.6 Symbionts and Insect Behavior

11.7 Human Neurodegenerative Diseases and Addictions in Drosophila

11.8 High-Throughput Ethomics

11.9 Systems Genetics of Complex Traits in Drosophila

11.10 Social Behavior in Bees and Ants

Chapter 12. Molecular Systematics and the Evolution of Arthropods

12.3 Controversies in Molecular Systematics and Evolution

12.4 Molecular Methods for Molecular Systematics and Evolution

12.5 Targets of DNA Analysis

12.6 Steps in Phylogenetic Analysis of DNA Sequence Data

12.7 The Universal Tree of Life

12.8 The Fossil Record of Arthropods

12.9 Molecular Analyses of Arthropod Phylogeny

12.10 Molecular Evolution and Speciation

Chapter 13. Insect Population Ecology and Molecular Genetics

13.3 What is Molecular Ecology?

13.4 Collecting Arthropods in the Field for Analysis

13.5 Molecular Ecological Methods

13.6 Analysis of Molecular Data

13.7 Case Studies in Molecular Ecology and Population Biology

13.8 Applied Pest Management

Chapter 14. Genetic Modification of Pest and Beneficial Insects for Pest-Management Programs

14.3 Why Genetically Modify Insects?

14.4 Why Use Molecular-Genetic Methods?

14.5 What Genetic Modification Methods are Available?

14.6 Methods to Deliver Exogenous Nucleic Acids into Arthropod Tissues

14.7 What Genes are Available?

14.8 Why are Regulatory Signals Important?

14.9 How are Modified Arthropods Identified?

14.10 How to Deploy Genetically Modified Pest and Beneficial Arthropods

14.11 Potential Risks Associated with Releases of Genetically Modified Arthropods

14.12 Permanent Releases of Genetically Modified Arthropods into the Environment

14.13 Regulatory Issues: Releases of Genetically Modified Arthropods


Implications for the Design of Minor Groove Binding Molecules

Fully ring-paired Py-Im polyamides (13, 5, 6) prefer a 5′-3′ forward orientation, as previously reported, regardless of turn modificaton.(5)

Conformationally flexible, β-containing polyamides with a β-amino-GABA linker (i.e., 4, 8, 9) prefer a reverse orientation, in which the N-terminal Im is aligned with the 3′ end of the binding site.(44)

Conformationally flexible, β-containing polyamides with a α-amino-GABA linker (i.e., 7, 10) prefer a forward orientation, in which the N-terminal Im is aligned with the 5′ end of the polyamide binding site.(39)

Polyamide binding in the reverse orientation may cause misalignment of internal Im/Py ring pairs (as in 4 e 8) Restoration of forward orientation can restore sequence-specific binding by these ring pairs (as in 7 e 10).

For optimal binding affinity and specificity, internal β residues should be used as follows: Counting from the polyamide N-terminus, Im heterocycles that are found following two or more ring pairs (Im or Py) should be preceded by a flexible β if possible to restore alignment with the GC base pair (i.e., compare 3 e 10) Similar observations have been previously reported but never formally codified.(34, 38, 49)


Resumo

Activation of innate immunity initiates various cascades of reactions that largely contribute to defense against physical, microbial or chemical damage, prompt for damage repair and removal of causative organisms as well as restoration of tissue homeostasis. Genetic polymorphism in innate immune genes plays prominent role in disease resistance capabilities in various breeds of cattle and buffalo. Here we studied single nucleotide variations (SNP/SNV) and haplotype structure in innate immune genes viz CHGA, CHGB, CHGC, NRAMP1, NRAMP2, DEFB1, BNBD4, BNBD5, TAP e LAP in Gir cattle and Murrah buffalo. Targeted sequencing of exonic regions of these genes was performed by Ion Torrent PGM sequencing platform. The sequence reads obtained corresponding to coding regions of these genes were mapped to reference genome of cattle BosTau7 by BWA program using genome analysis tool kit (GATK). Further variant analysis by Unified Genotyper revealed 54 and 224 SNPs in Gir and Murrah respectively and also 32 SNVs was identified. Among these SNPs 43, 36, 11,32,81,21 and 22 variations were in CHGA, CHGB, CHGC, NRAMP1, NRAMP2, DEFB1 e TAP genes respectively. Among these identified 278 SNPs, 24 were found to be reported in the dbSNP database. Variant analysis was followed by structure formation of haplotypes based on multiple SNPs using SAS software revealed a large number of haplotypes. The SNP discovery in innate immune genes in cattle and buffalo breeds of India would advance our understanding of role of these genes in determining the disease resistance/susceptibility in Indian breeds. The identified SNPs and haplotype data would also provide a wealth of sequence information for conservation studies, selective breeding and designing future strategies for identifying disease associations involving samples from distinct populations.


OBOC (&bdquoOne-Bead-One-Compound&rdquo) DECL

OBOC DECL Concept

Applying combinatorial chemistry principles to solid phase synthesis, it is possible to generate microbeads-supported chemical libraries, termed &ldquoone-bead-one-compound&rdquo (OBOC) libraries. Each bead carries many copies of a single compound and the methodology holds a great potential for the rapid identification of novel hits against a protein (drug) target. However, this potential is very cumbersome to fully realize, given a number of technical obstacles. One of the major bottleneck is that, while a OBOC library of millions of compounds can be readily synthesized applying split-and-pool methodologies, the screening and &ldquodecoding&rdquo of millions of beads by the conventional analytical methods is extremely impractical and challenging for industrial applications. However, introducing DNA-coding of the OBOC-microbeads, the screening and decoding tasks can be readily accomplished using water-in oil emulsion droplet microfluidics and next generation sequencing respectively.

OBOC DECL Synthesis

DNA-encoded solid-phase synthesis (DESPS) is typically employed to the assembly of OBOC DECLs. DESPS requires a bifunctional linker for enabling the parallel chemical synthesis and enzymatic DNA-based encoding. The assembly is usually performed alternating the chemical modification of the core scaffold attached to the bead, to the substoichiometric enzymatic DNA-encoding in split-and-pool fashion (Figure 26). Eventually, the final DESPS product is a resin-bound oligomeric compound carrying an encoding DNA-tag. Depending on bead size, each OBOC library microbead can display up to 10 &minus15 &minus10 &minus9 moles of an individual library member.

Figure 26: OBOC DECL member. Microbeads (160-&mum diameter) is first elaborated with a common photocleavable linker. The linker-resin is further connected to a bifunctional spacer. The synthesis proceeds as alternating split-&-pool steps of monomer coupling and DNA-coding. The initial DNA-tagging is performed substoichiometrically (i.e., only a portion of the molecule displayed on the beads are DNA-tagged).

OBOC DECL Selection (&ldquoSorting&rdquo)

Most of the DECL technologies which has been developed relies on affinity-based hit identification (&ldquopanning&rdquo), however these libraries are &ldquorefractory&rdquo to any biochemical or cellular activity selection pressure. In order to introduce the activity-based screen to the DECL selections, many copies of an individual library member must be localized in a discrete volume, and this can be conceptually achieved using OBOC DECLs.

The use of water-in oil emulsion droplet microfluidics as developed by Paegel and co-workers is crucial for the automation of the OBOC DECL selection strategy. The droplet encapsulate the library bead together with the screening components (Figure 27A). In each droplet, the library compound is photochemically cleaved (Figure 27B) from the bead during the transit towards the incubation chamber (Figure 27C). Eventually the assay-positive droplets are selected (&ldquosorted&rdquo Figure 27D) and submitted to high-throughput DNA sequencing decoding (Figure 27E).

The microfluidic device enables the homogenous generation of picoliter incubation incubation chambers, and generates appropriate concentrations for the screening of femto-moles of material.

Figure 27: OBOC DECL Selection & Sorting. Water oil-emulsion containing assay components and OBOC library are mixed and droplets formed (UMA) Droplets flow through a serpentine channel, where an integrated waveguide irradiates droplets with UV, photochemically liberating compound from the bead into the droplet volume (B) Droplets then flow into a deep incubation channel/chamber (C) before auxiliary oil inputs separate and guide droplets at the sorting junction where confocal laser-induced fluorescence controls the sorting (D) The DNA of the selected droplet hits is PCR-amplified and decoded after high-throughput sequencing (E).

© 2016 by DECLTechnology Website Creator.
Todos os direitos reservados. No part of this document may be reproduced or transmitted in any form or by any means, electronic, mechanical, photocopying, recording, or otherwise, without prior written permission of DECLTechnology Website Creator.| Privacy Policy, cookies and Copyright Notice | Powered by Isoladipasqua


REFERÊNCIAS

Korobko, I.V., Georgiev, P.G., Skryabin, K.G., and Kirpichnikov, M.P., Acta Naturae, 2016, vol. 8, no. 4, pp. 6–13.

Yakovleva, I.V., Zhuravleva, E.V., and Kamionskaya, A.M., FEBS Open Bio, 2019, vol. 9, não. S1, pp. 280–281.

Guidance on Risk Assessment of Living Modified Organisms, Convention on Biological Diversity, 2012. UNEP/CBD/BS/COP-MOP/6/13/Add.1 July 30, 2012.

Metodicheskie ukazaniya MUK 4.2.1903-04. “Produkty pishchevye. Metod identifikatsii geneticheski modifitsirovannykh istochnikov (GMI) rastitel’nogo proiskhozhdeniya s primeneniem biologicheskogo mikrochipa”, utverzhdennye Glavnym gosudarstvennym sanitarnym vrachom RF 6 marta 2004 g. (Guidelines MUK 4.2.1903-04. “Food Products. Method for the Identification of Genetically Modified Sources (GMI) of Plant Origin using a Biological Microchip”, Approved by the Chief State Sanitary Doctor of the Russian Federation, March 6, 2004), Moscow: Minzdrav Rossii, 2004. http://base.garant.ru/4181368/#friends.

Metodicheskie ukazaniya MUK 4.2.1902-04. “Opredelenie geneticheski modifitsirovannykh istochnikov (GMI) rastitel’nogo proiskhozhdeniya metodom polimeraznoi tsepnoi reaktsii”, utverzhdennye Glavnym gosudarstvennym sanitarnym vrachom RF 6 marta 2004 g. (Guidelines MUK 4.2.1902-04. “Determination of Genetically Modified Sources (GMI) of Plant Origin by the Method of Polymerase Chain Reaction”, Approved by the Chief State Sanitary Doctor of the Russian Federation, March 6, 2004), Moscow: Federal’nyi tsentr Gossanepidnadzora Minzdrava Rossii, 2004. http://base. garant.ru/4180376/.

Agapito-Tenfen, S.Z., Okoli, A.S., Bernstein, M.J., Wikmark, O.G., and Myhr, A.I., Front. Plant Sci., 2018, vol. 9, pp. 1–18. Article 1874. https://doi.org/10.3389/fpls.2018.01874

Maher, M.F., Nasti, R.A., Vollbrecht, M., Starker, C.G., Matthew, D.C., and Voytas, D.F., Nat. Biotechnol., 2020, vol. 38, pp. 84–89. doi.org/https://doi.org/10.1038/s41587-019-0337-2

Jones, H.D., Nat. Plantas, 2015, vol. 1. Article 14011. https://doi.org/10.1038/nplants.2014.11

Davison, J. and Ammann, K., GM Crops Food, 2017, vol. 8, no. 1, pp. 13–34. https://doi.org/10.1080/21645698.2017.1289305

Metje-Sprink, J., Mens, J., Dodrzejewski, D., and Sprink, T., Front. Plant Sci., 2019, vol. 9, pp. 133–141. Article 1957. https://doi.org/10.3389/fpls.2018.01957

Globus, R. and Qimrom, U., Célula Biochem. J., 2018, vol. 119, nº 2, pp. 1291–1298. https://doi.org/10.1002/jcb.26303

Yakovleva, I.V., Vinogradova, S.V., and Kamionskaya, A.M., Russ. J. Genet.: Appl. Res., vol. 6, no. 6, pp. 646–656. https://doi.org/10.1134/S2079059716060095

Whelan, A.I. and Lema, M.A., GM Crops Food, 2015, vol. 6, no. 4, pp. 253–265. https://doi.org/10.1080/21645698.2015.1114698

Eddy, S.R., Nat. Biotechnol., 2004, vol. 22, não. 7, pp. 909–910. https://doi.org/10.1038/nbt0704-909

Altschul, S.F., Gish, W., Miller, W., Myers, E.W., and Lipman, D.J., J. Mol. Biol., 1990, vol. 215, no. 3, pp. 403–410. https://doi.org/10.1016/S0022-2836(05)80360-2

Needleman, S.B. and Wunsch, C.D., J. Mol. Biol., 1970, vol. 48, nº 3, pp. 443–453.

Pearson, W.R. and Lipman, D.J., Proc. Natl. Acad. Sci. U. S. A., vol. 85, não. 8, pp. 2444–2448. https://doi.org/10.1073/pnas.85.8.2444

States, D.J., Gish, W., and Altschul, S.F., Métodos, 1991, vol. 3, não. 1, pp. 66–70. https://doi.org/10.1016/S1046-2023(05)80165-3

Herrero, J., Muffato, M., Beal, K., Fitzgerald, S., Gordon, L., Pignatelli, M., Vilella, A.J., Searle, S.M.J., Amode, R., Brent, S., Spooner, W., Kulesha, E., Yates, A., and Flicek, P., Base de dados, 2016, vol. 2016. Article bav096. https://doi.org/10.1093/database/bav096

Kent, W.J., Sugnet, C.W., Furey, T.S., Roskin, K.M., Pringle, T.H., Zahler, A.M., and Haussler, D., Genome Res., 2002, vol. 12, não. 6, pp. 996–1006. https://doi.org/10.1101/gr.229102

Derrien, T., Andre, C., Galibert, F., and Hitte, C., Bioinformática, 2006, vol. 23, não. 4, pp. 498–499. https://doi.org/10.1093/bioinformatics/btl618

Sinha, A.U. and Meller, J., BMC Bioinformática, 2007, vol. 8. Article 82. https://doi.org/10.1186/1471-2105-8-82

Hingamp, P., Broek, A.E., Stoesser, G., and Baker, W., Mol. Biotechnol., 1999, vol. 12, não. 3, pp. 255–267. https://doi.org/10.1385/MB:12:3:255

Benson, D.A., Cavanaugh, M., Clark, K., Karsch-Mizrachi, I., Lipman, D.J., Ostell, J., and Sayers, E.W., Nucleic Acids Res., 2013, vol. 41, no. D1, pp. D36–D42. https://doi.org/10.1093/nar/gks1195

Nikitin, N.A., Trifonova, E.A., Karpova, O.V., and Atabekov, J.G., Moscow Univ. Biol. Sci. Bull., 2016, vol. 71, no. 3, pp. 128–134.

Yoon, B.J., Curr. Genômica, 2009, vol. 10, não. 6, pp. 402–415. https://doi.org/10.2174/138920209789177575

Bateman, A., Birney, E., Durbin, R., Eddy, S.R., Finn, R.D., and Sonnhammer, E.L.L., Nucleic Acids Res., 1999, vol. 27, no. 1, pp. 260–262. https://doi.org/10.1093/nar/27.1.260

Finn, R.D., Mistry, J., Tate, J., Coggill, P., Heger, A., Pollington, J.E., Gavin, O.L., Gunasekaran, P., Ceric, G., Forslund, K., Holm, L., Sonnhammer, E.L.L., Eddy, S.R., and Bateman, A., Nucleic Acids Res., 2010, vol. 38, no. S1, pp. 211–222. https://doi.org/10.1093/nar/gkp985

Korotkov, E.V. and Korotkova, M.A., J. Phys.: Conf. Ser., 2019, vol. 1205. Article 012025. https://doi.org/10.1088/1742-6596/1205/1/012025

Korotkov, E.V., Suvorova, Y.M., Kostenko, D., and Korotkova, M.A., Genes, 2021, Under consideration.

Korotkov, E.V., Kamionskaya, A.M., and Korotkova, M.A., Biotekhnologiya, 2020, vol. 36, não. 4, pp. 7–14. https://doi.org/10.21519/0234-2758-2020-36-4-7-14

Pugacheva, V., Korotkov, A., and Korotkov, E., Stat. Appl. Genet. Mol. Biol., 2016, vol. 26, no. 5, pp. 381– 400. https://doi.org/10.1515/sagmb-2015-0079

Suvorova, Y.M., Korotkova, M.A., Skryabin, K.G., and Korotkov, E.V., DNA Res., 2019, vol. 26, no. 2, pp. 157–170. https://doi.org/10.1093/dnares/dsy046

Solovyev, V.V., Shahmuradov, I.A., and Salamov, A.A., in Métodos em Biologia Molecular, Ladunga, I., Ed., N.J.: Humana Press, 2010, vol. 674, pp. 57–83. https://doi.org/10.1007/978-1-60761-854-6_5

De Jong, A., Pietersma, H., Cordes, M., Kuipers, O.P., and Kok, J., BMC Genomics, 2012, vol. 13. Article 299. https://doi.org/10.1186/1471-2164-13-299

Di Salvo, M., Pinatel, E., Tala, A., Fondi, M., Peano, C., and Alifano, P., BMC Bioinformática, 2018, vol. 19. Article 36. https://doi.org/10.1186/s12859-018-2049-x

Ou, S., Su, W., Liao, Y., Chougule, K., Agda, J.R.A., Hellinga, A.J., Lugo, C.S.B., Elliott, T.A., Ware, D., Peterson, T., Jiang, N., Hirsch, C.N., and Hufford, M.B., Genome Biol., 2019, vol. 20, não. 4. Article 275. https://doi.org/10.1186/s13059-019-1905-y

Zhou, X., Ruan, J., Wang, G., and Zhang, W., PLoS Comput. Biol., 2007, vol. 3, não. 3, pp. 0412–0423. e37. https://doi.org/10.1371/journal.pcbi.0030037

Mohan, V. and Paran, I., in The Capsicum Genome. Compendium of Plant Genomes, Ramchiary, N. and Kole, C, Eds., New York: Springer Cham, 2019, pp. 105–109.

Vemireddy, L.R., Noor, S., Satyavathi, V.V., Srividhya, A., Kaliappan, A., Parimala, S.R.N., Bharathi, P.M., Deborah, D.A., Rao, K.V.S., Shobharani, N., Siddiq, E.A., and Nagaraju, J., BMC Plant Biol., 2015, vol. 15. Article 207. https://doi.org/10.1186/s12870-015-0575-5

Stemmer, M., Thumberger, T., del Sol., Keyer, M., Wittbrodt, J., and Mateo, J.L., PLoS One, 2015, vol. 10, não. 4. e0124633. https://doi.org/10.1371/journal.pone.0124633

Labuhn, M., Adams, F.F., Ng, M., Knoess, S., Schambach, A., Charpentier, E.M., Schwarzer, A., Mateo, J.L., Klusmann, J.H., and Heckl, D., Nucleic Acids Res., 2017, vol. 46, não. 3, pp. 1375–1385. https://doi.org/10.1093/nar/gkx1268


Assista o vídeo: Tudo o que você precisa para entender o sequenciamento Sanger! (Janeiro 2022).