Claude’s Constitution

Wed, 21 Jun 2023 23:14:48 +1000

Andrew Pam <xanni [at] glasswings.com.au>

Andrew Pam
https://www.anthropic.com/index/claudes-constitution

"How does a language model decide which questions it will engage with and which
it deems inappropriate? Why will it encourage some actions and discourage
others? What “values” might a language model have?

These are all questions people grapple with. Our recently published research on
“Constitutional AI” provides one answer by giving language models explicit
values determined by a constitution, rather than values determined implicitly
via large-scale human feedback. This isn’t a perfect approach, but it does make
the values of the AI system easier to understand and easier to adjust as
needed.

Since launching Claude, our AI assistant trained with Constitutional AI, we've
heard more questions about Constitutional AI and how it contributes to making
Claude safer and more helpful. In this post, we explain what constitutional AI
is, what the values in Claude’s constitution are, and how we chose them."

Via Wayne Radinsky.

Cheers,
       *** Xanni ***
--
mailto:xanni@xanadu.net               Andrew Pam
http://xanadu.com.au/                 Chief Scientist, Xanadu
https://glasswings.com.au/            Partner, Glass Wings
https://sericyb.com.au/               Manager, Serious Cybernetics

Comment via email

Home E-Mail Sponsors Index Search About Us