A Anthropic agora consegue rastrear o funcionamento interno bizarro de um modelo de linguagem de grande porte
O que a empresa descobriu desafia algumas suposições básicas sobre como essa tecnologia realmente funciona.
O que você encontrará neste artigo:
– Circuit tracing: como a Anthropic monitora o funcionamento interno dos LLMs
– Comportamentos estranhos e descobertas sobre o funcionamento dos modelos
– Limites atuais do conhecimento e o futuro da interpretação dos modelos