「治験」とは新薬の製造もしくは輸入承認を求めるために行われる臨床試験のことで、この言葉は薬事法によって定められています。また「臨床試験」とは「人間への介入の効果と価値を対照群と比較する前向きな研究 a prospective study comparing the effect and value of intervention(s) against a control in human beings」(Friedman LM, Furberg CD & DeMets DL, Fundamentals of Clinical Trial, 3rd ed., Springer, 1998, p.2) と定義されており、要するに、何らかの医療的措置が期待された効果をもたらすのか、また、その効果はどれだけの意義があるのかを調べるために、その医療的措置を行った人々の状態を行わなかった人々の状態と新たに比較検討する人体実験のことを指します(ここでいう「医療的措置」とは必ずしも薬の投与とは限らず、手術など他の治療法やそれ以外の医療措置も含みます。また、臨床試験の目的は新薬の製造もしくは輸入承認を得るためとは限りませんので、「臨床試験」のほうが「治験」よりも幅広い概念です)。今回は薬の人体実験である「治験」が実際にどのように行われているのかを解説し、その倫理的問題点について考察します。
1. 治験の段階
治験は主に「第I相」「第II相」「第III相」の三段階で行われます。第I相試験に入る前に、動物実験や組織を用いた試験管内の試験などの「非臨床試験」が行われ、成分の薬効や安全性に関するデータが集められます。人間を用いた臨床試験に入る前に、そうした非臨床試験をきちんと行い、データを検討しておくことが大前提です。
第I相試験は、開発中の新薬(医薬品候補物質、治験薬)の人間に対する安全性を確認することを主な目的として行われます。被験者になるのは原則として自由意志により志願した健康な男性です(ただし抗癌剤、抗不整脈薬、抗精神病薬、麻薬など侵襲性の高い薬の場合は第I相から患者に対して行われます)。安全性の確認とはいいかえれば危険性の確認ということでもあり、段階的に量を増やしながら、どのくらいの量を超えれば危険になるか(臨床安全用量の範囲ないし最大安全量)を調べるので、十分な医学的管理が行える数名程度の被験者ごとに慎重に行い、最終的には20名〜80名の被験者のデータを集めます。被験者は一定量の投与が行われる毎に、自覚症状・他覚症状や血圧・脈拍・体温などをチェックされるほか、血液検査のために採血されます。安全量の推定のほかに、薬の成分の吸収・分布・代謝・排泄といった状況(薬物動態)についても検討されます。
第II相試験は前期と後期に分けられます。その主な目的は適応症(その薬を用いる疾病)と用量および用法を決めることです。第II相全体で100名から200名程度の被験者が必要です。
前期第II相試験は原則として治験薬が初めて患者に用いられる段階で、安全性と有効性、および薬物動態を検討します。この前期第II相試験において、治験薬が開発に値するかどうか決定されます。まだ実験性の高い段階なので、被験者の数はせいぜい50人程度で十分といわれています。
後期第II相試験は、前期第II相試験に引き続いて薬効動態や適応症について明らかにするほか、どのくらいの投与量で目標とする状態(評価項目、エンドポイント)が現れるのか(臨床推奨[至適]用量[幅])を、用量設定(用量-反応)試験によって調べ、第III相試験における用量を決めます。
第III相試験は市販される前の最終段階の試験で、治験薬を実際に患者に用いる際の投与量の幅や用法、有効性や安全性、特徴などを「比較試験」と「一般臨床試験」を通して検証します。比較試験とは、治験薬を用いる患者群と、対照薬を用いる患者群の間で、有効性や安全性や有用性の比較検討を行う試験です。対照薬としては、日本では適応症に対して有用であることがすでに確立している既存の薬(標準薬)を一般に用いますが、米国では有効成分を含まないプラセボ(有効成分を含まないこと以外は治験薬そっくりに作った薬、偽薬)を用いるのが原則となっています。一方、一般臨床試験とは、治験薬が市販された場合に使用される状況に近い条件下での有効性や安全性について、第II相試験よりも年齢・病態・重症度などにおいて幅のある被験者群を用いて検討し、比較試験を補う役割を果たします。第III相試験では100人以上の患者が被験者となります。
以上の三つの段階において有効性や安全性が確認されると、市販する許可が与えられます(以前は抗癌剤については第III相試験を行わずに承認されていましたが、2005年から原則として第III相試験を行わなければならないことになりました。ただし「高い臨床的有用性を推測させる相当の理由が認められる場合」には、第II相試験までしか行っていなくても承認されます)。しかし、市販した後で、他の薬と併用したり、長期間使用したり、第III相までの臨床試験では被験者になっていなかった患者(高齢者、子ども、妊婦、肝臓と腎臓に機能障害のある患者など)に投与したりした結果、予期されていなかった重い副作用が明らかになることもあります。そこで、市販後も安全性の監視や調査研究を続ける必要があります。こうした市販後の観察的研究を総称して「市販後サーベイランス(市販後調査)」と呼びます。また、市販後に大規模な臨床試験が行われることもあり、これを「第IV相試験(市販後臨床試験)」と呼びます。これはとくに欧米では「代替評価項目(サロゲイト・エンドポイント)」に基づいて認可された薬(たとえば「血圧を下げる」ことを評価項目として認可された降圧薬)の「真の評価項目(真のエンドポイント)」(降圧薬の場合は「虚血性心疾患や脳血管疾患の予防、延命」)に対する効果を確認するために行われますが、日本においてはこの種の市販後臨床試験が行われた例は少数に留まっています。
2. 群間比較試験の方法
新薬が市販された場合に使用されるかもしれない患者すべてに対して治験を行うことは不可能であり、どうしても何らかの方法でサンプルとして選ばれた被験者に対してだけ行わざるを得ません。そこでまず、治験の結果が、その薬が市販され実際に用いられた場合の結果と同じであるといえること(一般化可能性、外的妥当性)が重要です。一般化可能性を確保する上で最も理想的なのは、使用される可能性のあるすべての患者から被験者を「無作為抽出」することですが、実際にはこれは不可能ですし、リスクが高い高齢者や肝・腎機能障害のある患者などには治験薬を直ちに用いるべきではないので、なるべくそれに近いモデル的な患者からなるグループを被験者とします。
また、サンプルとして選ばれた被験者は、さらに治験薬を用いるグループ(治験薬群)と、対照薬を用いるグループ(対照群)に分けられることになりますが、治験薬群と対照群は、治験薬と対照薬の違い以外の条件については均質であること(比較可能性、内的妥当性)が、治験薬の有効性や安全性を確かめる上で不可欠になります。そのために、治験薬群と対照群に分ける際には「無作為割り付け」が行われます。
こうして設定された治験薬群の患者に治験薬が、また対照群の患者には対照薬(標準薬またはプラセボ)が投与されることになりますが、被験者や治験を行う医師が、投与された薬剤が治験薬なのか対照薬なのかを知っていると、症状の自覚や結果の評価に影響を及ぼすことがあるので、治験薬か対照薬かを知らせない「目隠し blinding(盲験化)」が行われます。被験者にだけ治験薬か対照薬かを知らせず、処方する医師は知っているというやり方を「一重目隠し法 single blind method(単盲法)」と呼び、被験者も処方する医師も治験薬か対照薬かわからないというやり方を「二重目隠し法 double blind method(双盲法、二重盲験法)」と呼びます。
こうした方法により集められたデータは、点検を経た後で統計解析にかけられます。統計解析の役割は、データに現れた有効性や安全性の差が偶然に現れたものである確率を見積もることです。そして、有効性の差が偶然によって生じたとはいえないことが明らかになれば、治験薬の有効性が証明されたことになります。
3. その他の比較試験の方法
臨床試験としては、無作為割り付けを行い、二重目隠し法を用いた群間比較試験が最も科学的信頼のおけるやり方ですが、被験者の間で治験薬に対する反応が大きく異なる場合は統計的推論の精度が低下してしまいます。また、十分に統計的に信頼のおけるだけの数の被験者を集められるとは限りません。こうした場合、それぞれの被験者に複数の実験的措置を行って比較検討すれば、被験者は少なくてすみ、被験者間の反応のばらつきも抑えられます。
「被験者内同時試験」はそうしたやり方の一つで、各被験者の二箇所以上の治療部位が、治験薬か対照薬かに無作為に割り付けられます。ただし、この試験が行えるのは、たとえば皮膚の疾患で広い範囲に病変があるとか、両眼に疾患がある場合のように特殊な場合に限られます。また、血液などを通して、治験薬の有効成分が対照となる部位に影響してしまう場合などもあり、取扱いには慎重を要します。
一方「クロスオーバー試験」は、各被験者に時期を変えて複数の実験的措置を行うもので、治験薬と対照薬を用いる時期がそれぞれ無作為に割り付けられることになります。これは状態のあまり変化しない慢性疾患などで、一時的かつ短期的な症状の緩和や測定値の変化に関する試験の場合に行われます。しかし、一つの治療法で治癒したり状態が大きく変化する場合や、被験者の脱落(試験中止)が多い場合は、そもそも比較ができないのでクロスオーバー試験を行うことができません。また、効果が長持ちする治療法について検討する場合には、いったんその治療法の効果が消滅して元の状態に戻るまで、次の実験的措置を控えなければなりません。
その他、実際には、無作為割り付けされた対照群でない試験、同時期の対照群がない試験、そもそも対照群がない試験、標準薬の過去の治療成績を対照群(歴史的対照群 historical control)にする試験も行われています。しかし、いずれも無作為割り付け・二重目隠し法による群間比較試験に比べると、信頼性は低くなります。
4. 治験をめぐる日本の政策
日本で医薬品が安全で有効であることの科学的証拠が要求されるようになったのは、1967年の厚生省による「医薬品の製造承認等に関する基本方針」以降といわれています。いいかえれば、それまでは薬の安全性や有効性の科学的根拠は求められていなかったということになります。この基本方針は、米国が1962年に「キーフォーヴァー・ハリス修正法」により食品医薬品化粧品法を改正し、新薬の認可に当たって有効性と安全性の「実質的証拠」を示すよう義務づけたことにならったものでした。
1979年には薬事法が改正され、ここで新しい医薬品の臨床試験が「治験」と呼ばれて法的な性格を持つようになります。同時に、治験を依頼する際の基準(文書によって依頼すること、被験者の同意を得ること、治験中の事故に対して賠償すること、など)や、治験計画を届け出る制度などが定められました。
1983年、厚生省は臨床試験の適正化のために専門家会議を設置し、「医薬品の臨床試験の実施に関する基準」(いわゆる「GCP」)を1989年に正式に通知します。そこでは、治験を実施する医療機関は「治験審査委員会」を設けて、実施計画書や被験者への説明内容などについて審査するよう定められました。また、被験者には文書または口頭で治験について説明し承諾を得ることとされました。1992年には「新医薬品の臨床評価に関する一般指針」「臨床試験の統計解析に関するガイドライン」も発効しています。
しかしながら、日本の治験はなお国際的な基準に耐えうるものではありませんでした。1989年に、日本・米国・欧州連合の三極間で、新医薬品の製造ないし輸入の承認に際して要求される資料について調整を行う「日米EU医薬品規制調和国際会議(ICH)」が創設され、1996年には国際的な治験の基準として「ICH-GCP」が定められました。これに応じて日本国内の治験制度を再整備する必要が生じ、厚生省は1997年に改めて「医薬品の臨床試験の実施の基準に関する省令(厚生省令第28号)」(いわゆる新GCP)を制定します。新GCPでは、1989年の旧GCPが定めていた「治験総括医師」を廃止し、治験を依頼する製薬企業が直接に実施計画書を作成し、治験の実施状況をモニターすることになりました。また、治験を実際に担当する医師(治験責任医師)は被験者に対する説明文書を作り、文書による同意を被験者から得なければならないことになりました。さらに、治験審査委員会には、その医療機関に所属する者以外の外部委員を必ず含めなければならないことになりました。このようにして、日本の治験実施基準はようやく国際的基準を満たすものになりました。
ですが、従来きちんとしたインフォームド・コンセントを被験者から得ずに行っていたので、新GCPで文書によるインフォームド・コンセントが義務づけられると、被験者の確保が困難になってきました。そこで、被験者に治験参加に伴う実費を補填したり、報酬を支給することも検討されるようになりました。また、韓国や中国など海外で治験を行う動きも出てきています。
●参考図書
椿広計・藤田利治・佐藤俊哉編『これからの臨床試験:医薬品の科学的評価──原理と方法』朝倉書店、1999年
B. Furberg & C. Furberg『臨床試験とは何か』南江堂、1998年
内藤周幸編『臨床試験──医薬品の適正評価と適正使用のために』薬事日報社、1996年
日本消化器関連学会合同会議・DDW-Japan 1998 運営委員会監修、山岡義生・寺野彰編『臨床試験(新GCP)をめぐる諸問題』学会センター関西(販売・学会出版センター)1999年
日本消化器学会倫理委員会監修、中村孝司・寺野彰編『薬剤治験におけるプラセボと倫理』学会センター関西(販売・学会出版センター)1998年
片平洌彦『ノーモア薬害──薬害の歴史に学び、その根絶を』桐書房、増補改訂版1997年
浜六郎『薬害はなぜなくならないか──薬の安全のために』日本評論社、1996年
砂原茂一『臨床医学研究序説』医学書院、1988年
北澤京子『患者のための「薬と治験」入門』岩波ブックレット、2001年