| Anthropic | 可解釋性 | Neuronpedia | LLM

Anthropic公開運算電路追蹤工具 推進語言模型可解釋性研究

Anthropic開源運算電路追蹤工具,結合Neuronpedia互動前端平臺,使研究人員能視覺化語言模型推論過程,推進語言模型可解釋性研究,促進業界和學界共同分析語言模型內部運作邏輯

2025-06-02