Tag: Anthropic - MIT Technology Review

Agente difama engenheiro de software e coloca assédio online na era da Inteligência Artificial

Texto foi publicado em blog após contribuição ser recusada na biblioteca Matplotlib

O que você encontrará neste artigo:

– Como agentes de IA podem gerar assédio online
– Por que ainda é tão difícil responsabilizar esses agentes
– Quais normas e riscos devem moldar o futuro dos agentes

Governança

Anthropic temia compromisso da OpenAI com o Pentágono

Empresa defendeu limites morais, enquanto rival se contentou com barreiras legais mais brandas e, agora, tende a se beneficiar

O que você encontrará neste artigo:

– Como OpenAI e Anthropic divergiram sobre limites ao Pentágono
– Por que as salvaguardas legais da OpenAI geram dúvidas
– Quais são os efeitos políticos e militares dessa disputa

Inteligência artificial

A IA deve nos lisonjear, nos corrigir ou apenas nos informar?

A OpenAI está falhando em escolher um caminho, talvez porque o CEO Sam Altman ache que pode fazer as três coisas.

O que você encontrará neste artigo:

– O dilema triplo de como a IA deve nos tratar
– A IA e seus impactos nos relacionamentos emocionais e na saúde mental
– A possibilidade de personalização da IA para diferentes preferências

Inteligência artificial

Forçar grandes modelos de linguagem a serem malignos durante o treinamento pode torná-los mais amigáveis no longo prazo

Nova pesquisa da Anthropic mostra que traços indesejáveis podem ser detectados, e até prevenidos, ao examinar e manipular o funcionamento interno do modelo.

O que você encontrará neste artigo:

– Como detectar padrões malignos em modelos de IA
– Prevenir comportamentos indesejáveis nos LLMs
– A técnica ativa de prevenção e seus benefícios

Assine

Anthropic

Agente difama engenheiro de software e coloca assédio online na era da Inteligência Artificial

Anthropic temia compromisso da OpenAI com o Pentágono

A IA deve nos lisonjear, nos corrigir ou apenas nos informar?

Forçar grandes modelos de linguagem a serem malignos durante o treinamento pode torná-los mais amigáveis no longo prazo

Newsletter

Compartilhar

Conecte-se

Assine nossa newsletter