みなさん、こんにちは。私はAIシステムの性能を評価するさまざまなツールを調べてきました。世の中には実に多くのツールがあり、適切なものを選ぶのはやや難しい場合があります。皆さんはAIプロジェクトのベンチマークに何をお使いですか?皆さんの意見や経験をぜひお聞かせください!