Na atualidade, a inteligência artificial (IA) vem se infiltrando em diversas áreas da biotecnologia e pesquisa farmacêutica, oferecendo soluções promissoras. No entanto, a implementação dessas tecnologias é mais complexa do que se possa imaginar. A Converge Bio, uma startup emergente, desenvolveu uma ferramenta que visa facilitar o uso de modelos de linguagem de larga escala (LLMs) focados em biologia, tornando-os realmente funcionais para as empresas do setor. Com um investimento de **$5,5 milhões** em uma rodada inicial de financiamento, a empresa se prepara para escalar seus produtos e atender à crescente demanda do mercado.
Descomplicando a aplicação de modelos de linguagem na biotecnologia
A integração da IA nas atividades diárias das empresas de biotecnologia e farmacêuticas enfrenta desafios significativos, especialmente quando se considera a natureza especializada da pesquisa. Segundo o CEO e cofundador da Converge Bio, Dov Gertz, “um modelo é apenas um modelo. Não é o suficiente”. Ele enfatiza a necessidade de um pipeline que permita que as empresas utilizem esses modelos em seus próprios processos de pesquisa e desenvolvimento (P&D), dado que o mercado atual é altamente fragmentado. Gertz ressalta que as indústrias farmacêuticas e de biotecnologia buscam consumir essas tecnologias de uma forma consolidada, em um único local, e a Converge se propõe a ser esse ponto de convergência.
É importante compreender que os LLMs utilizados em biomedicina não são simples histórias contadas em livros ou postagens na internet, mas sim modelos robustos e complexos treinados em vastos bancos de dados de informações biológicas, como sequências de DNA, estruturas de proteínas e genômica. Assim como os LLMs criados para chatbots, tais modelos de biologia exigem um trabalho considerável para serem moldados e utilizados de forma prática em pesquisas cotidianas. Este desafio se torna ainda mais intrincado em domínios altamente especializados, como microbiologia ou imunologia.
Para ilustrar a questão, Gertz menciona a pesquisa sobre anticorpos, enfatizando que, apesar da existência de um LLM treinado em biologia específica de anticorpos, sua capacidade é bastante genérica. A Converge Bio propõe uma série de melhorias que podem ser implementadas de maneira segura e utilizando a propriedade intelectual de cada empresa.
Aprimorando a usabilidade e a explicabilidade dos modelos
Dentre os processos desenvolvidos pela Converge Bio, destaca-se o “enriquecimento de dados”, onde o LLM voltado para anticorpos é complementado com dados relevantes, como interações entre antígenos e anticorpos. Com um repositório de conhecimento mais específico, a ferramenta pode ser ajustada para se concentrar no antígeno que a equipe busca atingir, levando em conta dados proprietários que possam ter sido coletados em laboratório.
“Agora temos uma aplicação: a entrada é uma sequência, e a saída é a afinidade de ligação,” explica Gertz. Outro aspecto relevante do sistema da Converge é o fator de **explicabilidade**. Os pesquisadores conseguem aprofundar-se nos resultados para descobrir não apenas que “essa sequência funciona melhor do que aquela”, mas também identificar, a nível de aminoácido ou par de bases, quais partes da sequência contribuem para um desempenho superior.
Além disso, a plataforma é capaz de gerar novas sequências que prometem resultados aprimorados, também proporcionando um nível de explicação que surpreendeu positivamente os clientes. Esta característica permite que os especialistas aproximem sua expertise em interações de proteínas a áreas mais obscuras de bioinformática e aprendizado de máquina.
Impulsionando inovações e construindo diferenciais no mercado
A Converge está aproveitando diversos modelos de fundação open-source, mas também está desenvolvendo o seu próprio. Gertz afirma que a empresa já possui um processo proprietário para o aspecto explicativo de seus modelos, além de um currículo de “enriquecimento de dados” que é inteiramente exclusivo. As metodologias de treinamento, segundo Gertz, são um dos segredos bem guardados pelas empresas de IA de maior sucesso, e a Converge pretende construir sua barreira competitiva com base nessa exclusividade. O CEO também aponta que “essa é provavelmente a maior oportunidade em biotecnologia em cinco décadas”.
Entretanto, é notável que muitas empresas de biotecnologia, possivelmente a maioria, não possuem uma solução dedicada para lidar com trabalhos relacionados a LLMs em seu campo e vêm buscando nichos não atendidos por soluções generalistas. Gertz ressalta que o objetivo da Converge é se tornar “a loja completa para genAI em biotecnologia”, utilizando essa posição como uma alavanca para oferecer serviços adicionais ao longo do tempo.
Os investidores parecem apoiar essa visão, tendo colocado **$5,5 milhões** na rodada inicial, que foi liderada pela TLV Partners. A empresa planeja utilizar esse capital para expandir sua equipe e conquistar clientes, além de publicar um artigo científico sobre a designação de anticorpos com a utilização de seus sistemas, é claro, e treinar um “modelo de fundação adequado”.
Com este investimento, a Converge Bio não apenas se posiciona como uma referência promissora, mas dá um passo significativo em direção à inovação no campo da biotecnologia. A expectativa é que as ferramentas desenvolvidas pela empresa contribuam significativamente para a aceleração de descobertas e novas abordagens na pesquisa e desenvolvimento farmacêutico.