Skip to main content
    FAQ / よくあるご質問 — eval000.ai
    eval000.ai — FAQ
    01メタ評価エンジンについて
    Q「メタ評価」とは何ですか?通常のAI評価と何が違いますか?

    通常のAI評価は「AIが直接応募書類を採点する」ものです。メタ評価とは「評価そのものを外側から評価・再構成する」アプローチです。まず評価目的「外生的な(システム外部の)原理」を定め、複数の審査員とAIモデルが出した評価値に「評価再構成作用 F」を反復適用し、数学的に唯一の標準評価(v*)へ収束させます。

    収束式

    v(t+1) = F(v(t), R, K)
    → 固定点 v* = F(v*) に収束(バナッハの固定点定理)

    ChatGPT・Gemini・Claudeなど個々のAIモデルには「審査思想の偏り(AIの個性)」があり、同一書類に最大12点の差が生じることが2025年のPoCで実証されています。メタ評価エンジンはこのAIの個性問題を解決します。

    Q「標準評価」とは何ですか?絶対的に正しい点数が出るのですか?

    「標準評価」とは、複数の評価インプット(審査員スコア・AIスコア)からノイズ・バイアス・誤差を数学的に除去した客観的評価結果です。「絶対的に正しい」という意味ではなく、「与えられたルーブリックと評価目的に対して、最も一貫性・客観性を持つ評価」です。

    重要

    最終的な合否・受賞・採択の判断は、標準評価を参照した人間(審査員・委員会)が下します。AIの出力をそのまま最終決定として使用することは推奨しません。

    Qeval000のStep 4「標準評価の確認・承認」とは何ですか?

    eval000のStep 4は「外生的な原理との照合確認」です。人間の役割は①評価目的「外生的な(システム外部の)原理」を定めること、②数学的に確立された標準評価がその原理に照合しているかを確認することの2点のみです。標準評価の結果を人間が判断・決裁するものではありません。これはContextual Wisdomではなく、純粋な照合確認プロセスです。

    Q特許はどのような内容ですか?

    特願2026-35650「生成AIによる評価再構成に基づく標準評価算出方法、装置、プログラムおよびその記録媒体」として里吉 竜一氏が出願中です。メタ評価エンジン(評価再構成と固定点収束)の部分が対象です。利用はeval000との契約ライセンスの範囲内となり、無断複製・リバースエンジニアリングは禁止されています。

    Qeval000は「ラディカルイノベーション」だと言われる理由は?

    従来の評価改善は「より良い審査員を集める」「基準を精緻化する」という既存フレームの改良でした。eval000は根本から異なります。評価目的「外生的な(システム外部の)原理」を外部基準として定め、評価再構成作用Fの反復適用により標準評価を数学的に自律確立します。人間の判断は標準評価の結果には介入しません。これは評価という行為そのものの定義を刷新するラディカルイノベーションであり、単なる効率化ツールではありません。

    Qeval000における人間の役割は何ですか?

    人間の役割は明確に2点のみです。①評価目的「外生的な(システム外部の)原理」を定めること——例:「世界を変えるユニコーン企業を見つけたいのか」「次世代人材を育てたいのか」。②数学的に確立された標準評価がその外生的な原理に照合しているかを確認すること。標準評価の結果を人間が判断・修正・決裁することはありません。標準評価は数学的に自律確立されます。

    Q従来のAI評価・再構成技術との「構造的な違い」は何ですか?

    従来の評価システムにも「再構成(reconstruction)」は存在します。統計的手法の適用や機械学習への置換などがその例です。しかしこれらはいずれも単発的な処理にとどまります。再構成は一回限りの演算であり、その結果は固定的に出力されます。

    メタ評価エンジンは根本的に異なります。評価再構成は単なる処理ではなく、反復的に適用される作用(operator)として定義されます。評価ベクトル v は外部規範 N を用いた関数 Φ によって更新され続けます(v_{t+1} = Φ(v_t; N))。評価は一度で確定するのではなく、反復過程を通じて外部規範に向かって収束し続けます。これが「単発的評価生成」との構造的差異の本質です。

    Q>「固定点(v*)」とは何ですか?なぜそれが重要なのですか?

    十分な反復の後、評価ベクトルは固定点条件「v* = Φ(v*; N)」を満たします。これ以上反復しても評価が変化しない点——それが標準評価(v*)です。

    この固定点 v* は単なる計算結果ではありません。外部規範(外生的な原理)と整合した状態として数学的に定義されます。評価者の主観や偶然性ではなく、収束過程によって評価の正当性が担保されます。これがバナッハの不動点定理による数学的保証の意味です。

    Qメタ評価エンジンの特許における「3つの本質的特徴」を教えてください。

    第一:再構成を単発処理ではなく反復写像として定義した点。従来は「評価を一度算出する」ものでした。本発明は「外部規範に一致するまで更新し続ける」枠組みへの転換です。

    第二:評価の最終状態を固定点として定義した点。評価の到達点を「外部規範との整合状態」として数学的に定義しました。主観的な「良い評価」ではなく、収束条件を満たした客観的な状態が標準評価となります。

    第三:外部規範(外生的な原理)を評価更新の基準として組み込んだ点。評価目的そのものを数式の中に内包しています。「何のための評価か」という目的が、評価の数学的プロセスに直接反映されます。これら3点はすべて評価の絶対性を構成するための設計思想に基づくものであり、単なる技術的手段の選択にとどまらない哲学的差異を有します。

    Qメタ評価エンジンは「評価を生成する技術」とどう違うのですか?

    従来技術は「評価を生成する技術」です。一度算出すれば完了です。これに対しメタ評価エンジンは「評価の正当性を収束過程として保証する理論」です。評価を生成するのではなく、評価が正当である状態(固定点)に向かって収束していく——この枠組みの転換が本質です。

    先行技術との差異は「アルゴリズムの改良」ではありません。「評価を一度算出する枠組み」から「評価を外部規範に一致するまで更新し続ける枠組み」への転換であり、構造的かつ原理的な差異です。この点において本発明は先行技術とは原理的に異なるものであり、その新規性および進歩性は特許として認められています(特願2026-35650)。

    Qサイト上の「4つの変化」と「3つの世界」で説明が違うのはなぜですか?

    意図的に対象読者・訴求軸を変えています。TOPページの「4つの変化」は導入企業・意思決定者向けのビジネスROI訴求(透明性・品質・安定性・コスト削減)です。Meta-Engineページの「3つの世界」は評価される側・社会全体への価値訴求(信頼・質・時間)です。矛盾ではなく、同じ技術を異なる視座から描いた相互補完の構成です。

    02導入・PoCについて
    QPoCはどのような流れで進みますか?

    お問い合わせ後、1営業日以内に電子署名にてNDAを締結します。その後、既存の審査書類(直近1回分)をAIで再評価し、人手評価との比較検証を行います。期間は約3ヶ月です。

    Go/No-Go判断基準(PoC後)

    審査工数削減率 ≥60% / 審査員満足度 ≥4.0/5 / AI・人間評価一致率 ≥80% ※これらはPoC開始前の目標閾値であり、実測値はPoCを通じて取得します。

    Qどのような組織・規模がPoC対象になりますか?

    年間50件以上の審査書類を扱う組織が対象です。具体的には以下の6分野が主な対象です。

    • ① スタートアップ支援機関(JETRO・J-Startup・地域SVなど)
    • ② 企業内新規事業審査・イントレプレナー制度
    • ③ ビジネスコンテスト(経済団体・自治体・大学主催)
    • ④ 従業員表彰制度・HRアセスメント
    • ⑤ 公的機関・行政の補助金・政策評価
    • ⑥ 研究費・グラント審査(大学・研究機関)
    Q今の審査の仕組みを変えるのが怖いのですが、PoCはどの程度リスクがありますか?

    PoCは既存の審査プロセスを置き換えるものではありません。「これまでの書類をAIで再評価し、人手評価と比較するだけ」から始められます。実際の審査結果には影響を与えません。PoCを通じて見えていなかった評価のゆらぎが可視化されるため、むしろ現状の審査品質を客観的に把握できます。

    Qaward-of(Award Force)との関係は何ですか?

    eval000の事業運営主体である株式会社テンプロクシーは、コンテスト管理プラットフォーム「award-of(award-of.net)」を運営し、オーストラリア発・50カ国以上で実績あるAward Forceの日本正規パートナーです。eval000とaward-ofを統合することで、エントリー受付→AI評価→委員会→受賞者通知→式典管理までをワンストップで提供できます。

    03審査設計について
    Q500件・3ステップ審査の場合、最適な審査員数と役割は?

    eval000を前提とした3ステップの設計提案です。

    Step 1 — 一次審査
    500件 → 上位100件
    審査員5〜8名。AIが全件並列スコアリング後、審査員は1人あたり60〜100件を「確認モード」で担当。役割はAIスコアの妥当性検証と明らかな誤評価のフラグ立て。標準評価が足切りラインを出力。
    Step 2 — 二次審査
    100件 → 上位20〜30件
    審査員5〜7名(専門性高め)。1人あたり20〜30件を精査。標準評価を参照しながら「事業の本質・革新性・実現可能性」への専門的見解を加える。Step 4「標準評価の確認・承認」に向けた準備段階。
    Step 3 — 最終審査
    20〜30件 → 受賞・採択決定
    審査員3〜5名(委員会形式)。標準評価スコアを共通基盤に、評価目的「外生的な(システム外部の)原理」と照らし合わせ最終確認・承認を行うフェーズ。Step 4が最大限に発揮される。
    Qメタ評価エンジン導入後もピッチ(プレゼンテーション)は必要ですか?

    ピッチ・プレゼンテーションはメタ評価エンジンとは独立したスコープです。「情熱」「背景」「文脈」はメタ評価エンジンの評価対象外であり、ピッチにおいて評価される項目です。メタ評価エンジンは書類評価に特化し、そこにおけるノイズ・バイアス・誤差を数学的に除去します。両者は並列する独立した評価システムです。

    ピッチの再定義

    メタ評価エンジン(書類評価)とピッチ(人間評価)は、並列する独立した評価システムです。書類評価では数学的に標準評価を確立。ピッチでは「情熱・背景・文脈」を評価します。推奨形式は発表5分・質疑10分。両者のスコアを合わせた総合評価として最終的な外生的原理との照合確認を行います。

    Q審査の「目的」によってeval000の使い方は変わりますか?

    はい、大きく変わります。評価の目的が変われば、最適なルーブリック基準・重み付け・フィードバックの内容すべてが変わるためです。例えば「世界を変えるユニコーンを見つけたい」のか「次世代人材を育てるためのアドバイスを送りたい」のかでは、Step 1のルーブリック設計が根本から異なります。eval000はPoC開始時に審査目的をヒアリングし、最適なルーブリックを設計します。

    04数値・根拠について
    Q「審査工数90%削減・処理能力12倍」の根拠は何ですか?

    現時点ではPoC前の仮説値・目標値です。算出の前提は次の通りです。従来、審査員が書類精読・採点・コメント記入に1件あたり約45〜90分かかるとすると、1日で処理できるのは5〜10件程度です。eval000導入後、AIスコアと根拠コメントが事前生成されているため、審査員の作業が「確認・判断」に絞られ1件あたり約5〜8分となり、1日約100〜120件の処理が可能になると試算しています。

    重要な補足

    実際の削減率は書類量・審査基準の複雑さ・審査員の経験値によって大きく変動します。PoCを通じて実測値を取得することが最も誠実な根拠提示方法です。

    Q「同一審査員が午前・午後で19%変動」というデータの出典は?

    ダニエル・カーネマンら著『Noise: A Flaw in Human Judgment』(2021年)に基づいています。同書では保険会社の損害査定員を対象にした調査で、同一ケースに対する査定額が担当者によって平均55%のばらつきがあり、同一担当者でも時間帯・順序・気分によって有意な変動が生じることが示されています。eval000ではこの「ノイズ」問題の象徴的数値として引用しています。

    Q「技術はあくまで…強力なツールである」は誰の言葉ですか?

    eval000編集部(株式会社テンプロクシー)の表現です。特定の人物からの引用ではありません。思想的にはジョン・デューイ(目的と手段の関係論)やマーシャル・マクルーハン(技術と社会の関係論)と親和性がありますが、直接の引用ではありません。今後、里吉 竜一氏または株式会社テンプロクシーの言葉として明示する予定です。

    05データ・セキュリティについて
    Q応募者の書類データは、AIの学習に使われますか?

    一切使用しません。評価データ・応募書類・審査コメント等を、ユーザー本人の同意なく生成AIモデルの学習・訓練目的に使用することは一切ありません。生成AIはAPIレイヤーでの利用に留まります。

    Q行政・公的機関向けのセキュリティ要件に対応できますか?

    対応しています。クラウドSaaSが届きにくい中央省庁・大規模自治体向けに、データ主権・セキュリティ要件の観点からオンプレミス実装を許諾するサイトライセンスによるeval000メタ評価エンジンの提供が可能です。評価データは機関管理下に置き、第三者提供・AI学習利用なし、日本国内サーバー処理完結、個人情報保護法完全準拠です。

    Q評価データの保有期間はどのくらいですか?
    • 審査プログラム関連データ:審査終了後2年間(契約による延長あり)
    • お問い合わせ・サポート記録:対応完了後1年間
    • 契約・請求関連書類:法令上の保存義務期間(最長10年)
    • アクセスログ:取得後6ヶ月
    06料金・契約について
    Q料金体系を教えてください。

    サービス形態によって異なります。詳細は個別見積書・契約書に記載します。主な目安は以下のとおりです。

    • ① SV・スタートアップ支援:要相談(PoC期間 約3ヶ月)
    • ② 企業内新規事業:100〜1,000万円/年
    • ③ BC・ビジネスコンテスト:要相談
    • ④ HR・従業員表彰:50〜500万円/年
    • ⑤ 行政・公的機関:500〜3,000万円/年(サイトライセンス含む)
    • ⑥ 研究グラント:100〜500万円/年
    Q支払いが遅れた場合や途中解約した場合はどうなりますか?

    支払期限は請求書発行後30日以内です。遅延の場合は年14.6%(日割り)の遅延損害金が発生します。途中解約の場合は契約期間に応じた解約手数料が発生することがあります(詳細は個別契約書による)。PoC期間中に当社都合でサービスを中断した場合は、当該期間の料金を日割りで返金します。

    QNDAの締結はどのように行われますか?

    お問い合わせ後、1営業日以内に電子署名にてNDAを締結します。機密保持義務はサービス利用終了後3年間継続します。PoCに際しては、PoC結果・評価データ・アルゴリズムの詳細を機密情報として厳格に管理します。準拠法は日本法、管轄裁判所は東京地方裁判所です。

    まずはご相談ください
    解決しない疑問は、直接お聞かせください。
    NDAは1営業日以内に電子署名で締結。
    [email protected] に問い合わせる