評価のパラダイムシフト!
eval000、プリローンチ
評価のノイズ・バイアス・誤差を数学的に除去するメタ評価AIプラットフォーム「eval000」が、いよいよ動き始めます。なぜ今、評価を根本から問い直さなければならないのか。私たちが辿り着いた答えをお伝えします。
評価の「不公平」は、構造的な問題です
「あの審査員がいたから通った」「あの審査員がいなければ受賞できていた」——コンテスト、採用、事業評価、グラント審査。こうした声は、評価の現場のどこかで必ず聞こえます。
これは「審査員が悪い」という話ではありません。これは、評価プロセスの設計そのものに内在する、構造的な問題です。
これはノーベル賞受賞者カーネマンらの研究が実証した数字です。「気分」「時刻」「審査する順番」——それだけで評価が19%動く。これが「ノイズ」の正体です。
さらに「バイアス」は、審査員が持つ専門分野・経験・価値観の偏りから生じる系統的なゆがみです。5人の審査員がいれば、5通りの内在化された評価基準があります。「誤差」は、ルーブリック設計の不完全性から生まれます。完璧な評価基準を設計することは、原理的に不可能です。
審査員を増やしても、基準を精緻化しても、この構造的な問題は解決しません。問題の根は、評価プロセスそのものの設計にあります。
生成AIを使っても、公平にはならない
「AIに評価させれば公平になる」——この考えは、残念ながら誤りです。私たちは2025年、同一製品を2種類の生成AIモデルで並行評価する実証実験を行いました。
モデルAは「技術完成度と将来性」を重視する先行評価型。モデルBは「市場実績と定量データ」を重視する検証型。同じ製品を評価して、最大12点の差が生まれました。
「評価を評価する」という発想の転換
eval000のコアにあるのは、「メタ評価(meta-evaluation)」という概念です。評価のインプットそのものを外側から評価し直す——これがeval000の根本的なアプローチです。
この思想は、哲学者ゲーデルの不完全性定理(どんなルールも内側からだけでは正しさを証明できない)から着想を得ています。そして、数学者バナッハの固定点定理が「反復収束すれば必ず唯一の安定した答えに辿り着ける」という数学的保証を与えてくれます。
この技術は、横浜市立大学大学院 経済学研究科出身の里吉 竜一氏が考案し、現在特許出願中です(特願2026-35650)。リカードの比較優位論、スラッファーのメタ評価理論、ゲーデルの不完全性定理、バナッハの固定点定理——経済学と数学と哲学の交差点から生まれた、唯一無二のアルゴリズムです。
4ステップで「標準評価」を確立する
eval000のプロセスは、シンプルで強力な4つのステップで構成されています。
6つの分野で、評価のあり方を変える
eval000は、評価が行われるあらゆる現場に適用できます。私たちが特に注力しているのは、以下の6つの分野です。
共通するのは「評価の公正さが、結果への納得感と次の挑戦意欲を左右する」という事実です。eval000が実現する評価の透明化は、コンテストや制度への信頼を高め、優秀な人材・事業・研究が正当に評価される社会の実現に貢献します。
また、award-of.net(Award Force日本正規パートナー)との完全統合により、エントリー受付からAI評価・委員会・受賞者通知・式典管理までを一元化したワンストップの審査DXを実現します。
一緒に「評価の未来」を作りませんか
eval000はいま、PoCコラボレーションパートナーを募集しています。実際の審査プログラムにeval000を試験導入し、「AIありとなしでどう変わるか」を一緒に検証しましょう。
「今使っている審査の仕組みを変えるのは怖い」——そうお感じの方こそ、まずPoC(概念実証)で試してみてください。既存の審査書類をAIで再評価し、人手評価との比較だけでも、見えていなかった評価のゆらぎが可視化されるはずです。
私たちが目指しているのは、評価そのものが「透明で、公正で、温かい」ものになる社会です。どんな挑戦も、正しく評価される世界。そのために、eval000はあります。
