AIセーフティにおけるデータ品質の国際標準規格ISO/IEC 5259シリーズの発行に貢献
ポイント
・ 包括的で偏りがなく、安全なAI開発のための、機械学習に特有なデータセット品質の土台となる規格
・ AIやデータ駆動型システムにおけるデータの収集、処理、利用など、データライフサイクル全体のデータ品質向上に不可欠な標準
・ AIの安全性強化のためのリスク管理と法規遵守を支援
【画像:https://kyodonewsprwire.jp/img/202503256240-O1-WJ49231Z】
人工知能(AI)やデータ駆動型システムの信頼性向上のため、データ品質の管理と評価に関する国際規格ISO/IEC 5259シリーズ(以下「本規格」という)が第1部から第5部まで発行されました。国立研究開発法人 産業技術総合研究所(以下「産総研」という)は、AIを用いた製品やシステム、サービス開発に関する国際標準化を主導的に推進し、本規格の発行に大きく貢献しました。
データはAIシステムの開発・運用に必要不可欠な「燃料」であり、その品質はAIシステムの性能や安全性に直接影響するため、極めて重要です。しかしながら、従来のデータ品質管理に関する国際標準は、バイアスの排除、データの多様性やバランスなどの確保といった要件を測定・評価できない問題がありました。本規格は、これらの課題を踏まえ、AIデータライフサイクルフレームワーク全体を通じて適切な管理を行い、さまざまな分析や機械学習のための包括的な指針を提供するものです。
これにより、安心・安全なAIシステムの社会的な活用促進、日本のAI産業の国際的な社会実装及び競争力強化に加え、異なる国や企業間でのデータ流通における信頼性向上が期待されます。
下線部は【用語解説】参照
社会課題の解決
イノベーションを妨げることなく、産業界が信頼性の高いAIシステムを継続的に開発し、その性能と安全性を保証するためには、実用的な品質評価・管理の仕組みを国際的に整備することが求められます。機械学習を活用したデータ駆動型のAIシステムにおける品質評価や品質保証には、学習データの欠落や偏り、モデルの不確実性、さらには利害関係者の異なる要件など、多くの技術的な課題が存在します。特に学習データの品質は、AIシステム全体の性能と安全性に大きく影響します。学習データの品質が不十分であれば、モデルの推論結果にバイアスや不公平性が生じ、システム全体の信頼性を損ない、社会的な受容性にも影響を与える可能性があります。特に、医療や金融、自動運転、公共インフラなどの分野では、データ品質の欠陥が重大な経済的損害や倫理的問題を引き起こす可能性も十分あります。
しかし、これまで産業で適応されてきたデータ品質管理のため国際規格であるISO 8000シリーズとISO/IEC 25000シリーズは、データ個々の品質要件に着目しており、非構造化データ(テキスト、画像、音声など)や特徴量などの機械学習向けのデータ形式、データセットの分布・バイアス・バランスなどのAI特有の品質指標、持続的な管理・改善などは考慮されていません。そのため、これまでの規格ではAIにおけるデータ品質を適正に評価できない状況でした。また、データの自由な流通を促進するDFFTの概念を実現するためには、データ品質の基準とその測定の整備が重要です。
本規格では、データ分析と機械学習のためのデータ品質の概念や、基準、管理、プロセス、ガバナンスなどの新たな体系を提供します。そのため、AIモデルの開発やAI品質評価プロセスにおけるデータ品質を定量的かつ包括的に評価できるようになり、AIの不透明性を解消し、ビジネス活用の促進が期待できます。
規格発行までの道のり
産総研は、2017年に合同技術委員会(JTC 1)の傘下にAIに関する分科委員会(ISO/IEC JTC 1/SC 42)が設立された当初から、国内専門委員会と協力しながら主導的に規格化を推進してきました。本規格は、SC 42内でデータに関する標準の策定や検討を行う作業グループ(WG 2)で日本が提案し、韓国、中国、ドイツのそれぞれのプロジェクトリーダと連携して開発された規格です。特に、産総研は、本規格の第2部(データ品質指標)のドラフト作成を含む規格開発を主導するとともに、2024年1月には暫定コンビーナーとして各パートの発行に大きく貢献しました。
今後の予定・波及効果
本規格では、技術報告書である第6部(データ品質の可視化)が最終確認段階にあり、今後第6部の発行によりデータ品質管理のための分かりやすい解析手法を提供します。また、本規格は欧州 CEN/CENELEC JTC 21(欧州標準化委員会/欧州電気標準化委員会 合同技術委員会21)から高い評価を受けており、欧州AI法(AI Actの整合規格)として採用が予定されています。これに伴い、世界的にも大きな注目を集めています。さらに、本規格は生成AIにおけるデータ品質評価の基盤を提供し、今後、安全で信頼性の高いAIシステムの開発と運用を支援するために拡張される予定です。
【表:https://kyodonewsprwire.jp/prwfile/release/M107968/202503256240/_prw_PT1fl_163dsIB8.png】
用語解説
ISO 8000(Data quality:データ品質)シリーズ
産業データの企業やシステム間におけるデータ交換の品質保証を目的とし、データの収集、処理、管理、共有 に関して、正確性、完全性、一貫性、再利用性などを確保するための指針を提供する。
ISO/IEC 25000(System and software engineering – Systems and software Quality Requirements and Evaluation(SQuaRE): システム及びソフトウェア工学―システム及びソフトウェア品質要求事項及び評価(SQuaRE))シリーズ
ISO/IEC 25000~25002。ソフトウェア製品の品質特性や測定基準を定義し、品質要求の策定、評価、管理を支援することを目的とした国際標準である。信頼性や性能、セキュリティなどの観点からソフトウェアとデータの品質を評価する体系を提供する。
DFFT(Data Free Flow with Trust)信頼性のあるデータ流通
プライバシー、セキュリティ、知的財産権に関する信頼を確保しつつ、ビジネスや社会課題の解決に役立つデータの国境を越えた利活用を促進し、デジタル経済に関する国際的なルール形成への貢献を目指すIT総合戦略の一つである。
ISO/IEC JTC 1/SC 42(国際標準化機構/国際電気標準会議/合同専門委員会1/人工知能専門委員会)
2017年に設立されたISO(国際標準化機構)とIEC(国際電気標準会議)の合同技術委員会(JTC 1)に属する人工知能(AI)に特化した分科委員会(SC 42)。AI関する国際標準を策定し、AI技術の信頼性、安全性、透明性の確保を目指す。
ISO/IEC 25012 : 2008 Software engineering -- Software product Quality Requirements and Evaluation (SQuaRE)-- Data quality model
ソフトウェア工学―ソフトウェア製品品質要求事項及び評価(SQuaRE)―データ品質モデル
データ品質の評価基準を定めた国際標準であり、データの適切な管理と利用を支援するためのフレームワークを提供する。本規格のデータ品質モデルの基盤になる。
ISO/IEC 25024:2015 Systems and software engineering -- Systems and software Quality Requirements and Evaluation(SQuaRE)-- Measurement of data quality
システム及びソフトウェア工学―システム及びソフトウェア品質要求事項及び評価(SQuaRE)―データ品質の測定
データ品質の測定指標と評価方法を定めた国際標準であり、データの正確性、完全性、一貫性、適時性などのデータ品質特性を定量的に評価する測定するための指標を提供する。
プレスリリースURL
https://www.aist.go.jp/aist_j/press_release/pr2025/pr20250327/pr20250327.html
プレスリリース詳細へ https://kyodonewsprwire.jp/release/202503256240
ポイント
・ 包括的で偏りがなく、安全なAI開発のための、機械学習に特有なデータセット品質の土台となる規格
・ AIやデータ駆動型システムにおけるデータの収集、処理、利用など、データライフサイクル全体のデータ品質向上に不可欠な標準
・ AIの安全性強化のためのリスク管理と法規遵守を支援
【画像:https://kyodonewsprwire.jp/img/202503256240-O1-WJ49231Z】
人工知能(AI)やデータ駆動型システムの信頼性向上のため、データ品質の管理と評価に関する国際規格ISO/IEC 5259シリーズ(以下「本規格」という)が第1部から第5部まで発行されました。国立研究開発法人 産業技術総合研究所(以下「産総研」という)は、AIを用いた製品やシステム、サービス開発に関する国際標準化を主導的に推進し、本規格の発行に大きく貢献しました。
データはAIシステムの開発・運用に必要不可欠な「燃料」であり、その品質はAIシステムの性能や安全性に直接影響するため、極めて重要です。しかしながら、従来のデータ品質管理に関する国際標準は、バイアスの排除、データの多様性やバランスなどの確保といった要件を測定・評価できない問題がありました。本規格は、これらの課題を踏まえ、AIデータライフサイクルフレームワーク全体を通じて適切な管理を行い、さまざまな分析や機械学習のための包括的な指針を提供するものです。
これにより、安心・安全なAIシステムの社会的な活用促進、日本のAI産業の国際的な社会実装及び競争力強化に加え、異なる国や企業間でのデータ流通における信頼性向上が期待されます。
下線部は【用語解説】参照
社会課題の解決
イノベーションを妨げることなく、産業界が信頼性の高いAIシステムを継続的に開発し、その性能と安全性を保証するためには、実用的な品質評価・管理の仕組みを国際的に整備することが求められます。機械学習を活用したデータ駆動型のAIシステムにおける品質評価や品質保証には、学習データの欠落や偏り、モデルの不確実性、さらには利害関係者の異なる要件など、多くの技術的な課題が存在します。特に学習データの品質は、AIシステム全体の性能と安全性に大きく影響します。学習データの品質が不十分であれば、モデルの推論結果にバイアスや不公平性が生じ、システム全体の信頼性を損ない、社会的な受容性にも影響を与える可能性があります。特に、医療や金融、自動運転、公共インフラなどの分野では、データ品質の欠陥が重大な経済的損害や倫理的問題を引き起こす可能性も十分あります。
しかし、これまで産業で適応されてきたデータ品質管理のため国際規格であるISO 8000シリーズとISO/IEC 25000シリーズは、データ個々の品質要件に着目しており、非構造化データ(テキスト、画像、音声など)や特徴量などの機械学習向けのデータ形式、データセットの分布・バイアス・バランスなどのAI特有の品質指標、持続的な管理・改善などは考慮されていません。そのため、これまでの規格ではAIにおけるデータ品質を適正に評価できない状況でした。また、データの自由な流通を促進するDFFTの概念を実現するためには、データ品質の基準とその測定の整備が重要です。
本規格では、データ分析と機械学習のためのデータ品質の概念や、基準、管理、プロセス、ガバナンスなどの新たな体系を提供します。そのため、AIモデルの開発やAI品質評価プロセスにおけるデータ品質を定量的かつ包括的に評価できるようになり、AIの不透明性を解消し、ビジネス活用の促進が期待できます。
規格発行までの道のり
産総研は、2017年に合同技術委員会(JTC 1)の傘下にAIに関する分科委員会(ISO/IEC JTC 1/SC 42)が設立された当初から、国内専門委員会と協力しながら主導的に規格化を推進してきました。本規格は、SC 42内でデータに関する標準の策定や検討を行う作業グループ(WG 2)で日本が提案し、韓国、中国、ドイツのそれぞれのプロジェクトリーダと連携して開発された規格です。特に、産総研は、本規格の第2部(データ品質指標)のドラフト作成を含む規格開発を主導するとともに、2024年1月には暫定コンビーナーとして各パートの発行に大きく貢献しました。
今後の予定・波及効果
本規格では、技術報告書である第6部(データ品質の可視化)が最終確認段階にあり、今後第6部の発行によりデータ品質管理のための分かりやすい解析手法を提供します。また、本規格は欧州 CEN/CENELEC JTC 21(欧州標準化委員会/欧州電気標準化委員会 合同技術委員会21)から高い評価を受けており、欧州AI法(AI Actの整合規格)として採用が予定されています。これに伴い、世界的にも大きな注目を集めています。さらに、本規格は生成AIにおけるデータ品質評価の基盤を提供し、今後、安全で信頼性の高いAIシステムの開発と運用を支援するために拡張される予定です。
【表:https://kyodonewsprwire.jp/prwfile/release/M107968/202503256240/_prw_PT1fl_163dsIB8.png】
用語解説
ISO 8000(Data quality:データ品質)シリーズ
産業データの企業やシステム間におけるデータ交換の品質保証を目的とし、データの収集、処理、管理、共有 に関して、正確性、完全性、一貫性、再利用性などを確保するための指針を提供する。
ISO/IEC 25000(System and software engineering – Systems and software Quality Requirements and Evaluation(SQuaRE): システム及びソフトウェア工学―システム及びソフトウェア品質要求事項及び評価(SQuaRE))シリーズ
ISO/IEC 25000~25002。ソフトウェア製品の品質特性や測定基準を定義し、品質要求の策定、評価、管理を支援することを目的とした国際標準である。信頼性や性能、セキュリティなどの観点からソフトウェアとデータの品質を評価する体系を提供する。
DFFT(Data Free Flow with Trust)信頼性のあるデータ流通
プライバシー、セキュリティ、知的財産権に関する信頼を確保しつつ、ビジネスや社会課題の解決に役立つデータの国境を越えた利活用を促進し、デジタル経済に関する国際的なルール形成への貢献を目指すIT総合戦略の一つである。
ISO/IEC JTC 1/SC 42(国際標準化機構/国際電気標準会議/合同専門委員会1/人工知能専門委員会)
2017年に設立されたISO(国際標準化機構)とIEC(国際電気標準会議)の合同技術委員会(JTC 1)に属する人工知能(AI)に特化した分科委員会(SC 42)。AI関する国際標準を策定し、AI技術の信頼性、安全性、透明性の確保を目指す。
ISO/IEC 25012 : 2008 Software engineering -- Software product Quality Requirements and Evaluation (SQuaRE)-- Data quality model
ソフトウェア工学―ソフトウェア製品品質要求事項及び評価(SQuaRE)―データ品質モデル
データ品質の評価基準を定めた国際標準であり、データの適切な管理と利用を支援するためのフレームワークを提供する。本規格のデータ品質モデルの基盤になる。
ISO/IEC 25024:2015 Systems and software engineering -- Systems and software Quality Requirements and Evaluation(SQuaRE)-- Measurement of data quality
システム及びソフトウェア工学―システム及びソフトウェア品質要求事項及び評価(SQuaRE)―データ品質の測定
データ品質の測定指標と評価方法を定めた国際標準であり、データの正確性、完全性、一貫性、適時性などのデータ品質特性を定量的に評価する測定するための指標を提供する。
プレスリリースURL
https://www.aist.go.jp/aist_j/press_release/pr2025/pr20250327/pr20250327.html
プレスリリース詳細へ https://kyodonewsprwire.jp/release/202503256240