Description: Microsoft Copilot, when asked medical questions, was reportedly found to provide accurate information only 54% of the time, according to European researchers (citation provided in editor's notes). Analysis by the researchers reported that 42% of Copilot's responses could cause moderate to severe harm, with 22% of responses posing a risk of death or severe injury.
Editor Notes: Citation for the research paper: Andrikyan, Wahram, Sophie Marie Sametinger, Frithjof Kosfeld, Lea Jung-Poppe, Martin F. Fromm, Renke Maas, and Hagen F. Nicolaus. "Artificial Intelligence-Powered Chatbots in Search Engines: A Cross-Sectional Study on the Quality and Risks of Drug Information for Patients." BMJ Quality & Safety, published online October 1, 2024. https://doi.org/10.1136/bmjqs-2024-017476. Incident date is April 25, 2024 to match the date of submission of the research paper. The paper was accepted on August 22, 2024 and officially published October 1, 2024.
Alleged: Microsoft developed an AI system deployed by Microsoft Copilot と Microsoft, which harmed People seeking medical advice , Microsoft Copilot users と General public.
インシデントのステータス
Risk Subdomain
A further 23 subdomains create an accessible and understandable classification of hazards and harms associated with AI
3.1. False or misleading information
Risk Domain
The Domain Taxonomy of AI Risks classifies risks into seven AI risk domains: (1) Discrimination & toxicity, (2) Privacy & security, (3) Misinformation, (4) Malicious actors & misuse, (5) Human-computer interaction, (6) Socioeconomic & environmental harms, and (7) AI system safety, failures & limitations.
- Misinformation
Entity
Which, if any, entity is presented as the main cause of the risk
AI
Timing
The stage in the AI lifecycle at which the risk is presented as occurring
Post-deployment
Intent
Whether the risk is presented as occurring as an expected or unexpected outcome from pursuing a goal
Unintentional
インシデントレポート
レポートタイムライン

- ドイツとベルギーに拠点を置く研究者らが最近、Microsoft Copilot に、よくある医療に関するさまざまな質問をした。
- 結果を分析した結果、Microsoft Copilot が科学的に正確な情報を提供したのは 54% に過ぎなかったことがわかった。
- また、生成された回答の 42% が「深刻な危害」につながる可能性があり、極端なケースでは 22% が死亡につながる可能性もあることがわかった。
- これは、「AI 検索」にとってさらなる打撃となる。検索大手の Google…
バリアント
「バリアント」は既存のAIインシデントと同じ原因要素を共有し、同様な被害を引き起こし、同じ知的システムを含んだインシデントです。バリアントは完全に独立したインシデントとしてインデックスするのではなく、データベースに最初に投稿された同様なインシデントの元にインシデントのバリエーションとして一覧します。インシデントデータベースの他の投稿タイプとは違い、バリアントではインシデントデータベース以外の根拠のレポートは要求されません。詳細についてはこの研究論文を参照してください
よく似たインシデント
Did our AI mess up? Flag the unrelated incidents
よく似たインシデント
Did our AI mess up? Flag the unrelated incidents