Pipelines ponta a ponta de descoberta de medicamentos com tecnologia fornecida por AI.
O BioNeMo é serviço em cloud para descoberta de medicamentos com tecnologia fornecida por AI desenvolvido com o NVIDIA NeMo Megatron para treinamento e implantação de grandes modelos de transformadores biomoleculares com AI em escala de supercomputação. O serviço inclui modelos de linguagem grande (LLMs) pré-treinados e suporte nativo para formatos comuns de arquivos para proteínas, DNA, RNA e química, fornecendo carregadores de dados para SMILES para estruturas moleculares e FASTA para sequências de aminoácido e nucleotídeo. O framework BioNeMo também estará disponível para download e execução em sua própria infraestrutura.
O BioNeMo vem com três LLMs pré-treinados. O MegaMolBART é um modelo de química generativa treinado com 1,4 bilhão de moléculas (sequências SMILES) e pode ser usado em várias aplicações de quimioinformática.
ESM-1, baseado no ESM-1b de última geração da Meta AI, e ProtT5 são modelos de linguagem de proteínas baseados em transformers que podem ser usados para gerar incorporações aprendidas para tarefas como estrutura de proteínas e previsão de propriedades.
OpenFold, um modelo de deep learning para predição de estrutura 3D de novas sequências de proteínas, estará disponível no serviço BioNeMo.
A BioNeMo permite que os desenvolvedores implantem LLMs com bilhões e trilhões de parâmetros. Os modelos atuais de linguagem proteica contêm bilhões de parâmetros que exigem uma infraestrutura de supercomputação para inferência no vasto espaço químico. O dimensionamento dinâmico de recursos no cloud permite que os pipelines de inferência LLM sejam automaticamente dimensionados para atender às demandas de computação.
O BioNeMo facilita a introdução de modelos pré-treinados, downloads automáticos e pré-processamentos para bancos de dados UniRef50 e ZINC. Vários modelos, incorporações e saídas podem ser combinados para unir dados multimodais, graças a alunos estruturados não supervisionados. O pré-treinamento não supervisionado também elimina a necessidade de dados rotulados, a geração inicial de incorporações aprendidas para prever a estrutura proteica, a função, a localização celular, a solubilidade da água, a limitação da membrana, as regiões conservadas e variáveis e muito mais.
Inscreva-se para ter acesso antecipado ao serviço BioNeMo