GeneChip®遺伝子発現解析用プローブアレイの信頼性、感度、特異性、汎用性を左右する最も重要なポイントのひとつは、プローブ選択とアレイデザインです。GeneChip製造技術では、塩基配列、位置や長さを規定して、プローブ合成をすることができます。したがって、アレイの性能は、複数のデータベースから得たデータや、バイオインフォマティクス・ツール、さらに実験学習型のコンピュータモデルを使用して最適化されています。
GeneChip プローブアレイを選択ならびに設計する上で重要な要素のうちのいくつかは、応用分野にかかわらず、すべてのアレイ製品の製造に共通です。例えば、プローブのハイブリダイゼーション条件の最適化は、常にプローブ選択のプロセスに含まれています。特定のpHや塩濃度、または温度条件下でのハイブリダイゼーションは、Tm値を考慮した上で、より一層望ましいハイブリダイゼーション条件に関与する経験則を利用することによって最適化されています。アフィメトリクス社では、複雑な混合物中のターゲット配列のハイブリダイゼーションをモニターする目的で実施された数千におよぶ実験データに基づき、プローブのハイブリダイゼーション強度と濃度依存性の予測にコンピュータモデルを使用しています。したがって、プローブ数を最少限に抑えながら、データの質を最大限に高めることができます。
Perfect Match/Mismatchプローブ戦略はアレイデザインの中核要素ですが、この要素技術はGeneChipアレイ の製造にも幅広く応用されています。ターゲット配列と完全に相補的に設計された各プローブについて、中央部の1塩基のミスマッチ置換以外はまったく同一の配列をもつプローブペアを作製しています。
Perfect Match probe (PM) およびMismatch probe (MM)と呼ばれるこうしたプローブ・ペアによって、非特異的なクロスハイブリダイゼーションを定量し、シグナル値から減算することが可能です。特定ターゲットの存在量を示す指標としては、プローブペア(PM/MM)間のハイブリダイゼーションのシグナル強度比と同様に、シグナル差も有用です。
プローブ選択とアレイデザインに関する要素のなかには、アレイの応用目的に依存するものもあります。遺伝子発現解析用アレイ用プローブの選択には、複数のデータベースに由来する配列とアノテーションのデータを統合して利用しています。アフィメトリクス社では、酵母、シロイヌナズナ、ショウジョウバエ、マウス、ラット、ヒトの遺伝子のグローバルな発現をモニターするアレイを製造しています。それ以外にも、その他のモデル生物用や研究者が独自に所有する配列用、さらに既知遺伝子の特定サブセットの発現解析用カスタムアレイもデザイン・製造いたします。
ヒトアレイに関しては、 GenBank®, RefSeq, および dbEST等のデータベース由来の、発現が確認されている配列を収集し、類似配列グループごとにクラスター分類しています。さらに塩基配列は、UniGeneデータベース が提供するクラスターを用いて、識別可能な転写産物を代表例とするサブクラスター別に再分類しています。
この分類を行うプロセスには、ヒトゲノムとのアライメント(配列比較)が関与していますが、これによってスプライシングならびにポリアデニル化バリアントが示されます。またこのアライメントによって、質の低い配列から得られたアノテーション情報も拡張されます。またこれらは、次段階に質の高いコンセンサス配列用としてトリミングすることも可能です。その他、クオリティーランキングを イグゼンプラーと呼ばれるプローブ構築用典型配列の選択に利用することも可能です。
イグゼンプラーもしくはコンセンサス配列のどちらか由来の個別のプローブを選択する前に、各転写産物の5’→3’への配向を決定しなければなりません。アフィメトリクス社は、公表されているアノテーション由来情報と、スプライスシグナル、ポリアデニル化部位、アンチセンス鎖とセンス鎖を識別するポリアデニル化シグナルのin-house解析を組み合わせたコンピュータ・アルゴリズムを採用しています。相反する情報の存在によって配向性が明確に定まらない場合は、両鎖に対応するプローブが作られます。
通常、各転写産物をモニターするために1遺伝子につき11~16個の25-merのプローブが選択されています。予想されるハイブリダイゼーション特性に基づいてプローブを選択することに加え、特異性によっても候補シークエンスを選択します。そして、それらと類似はしていても関連性のないシークエンスとのクロスハイブリダイゼーションの可能性を評価します。
遺伝子発現について完全に理解する目的で、マルチプルスプライスもしくはポリアデニル化変異体との共有領域からプローブを選択することがあります。場合によっては、バリアント間を識別可能な、ユニークなプローブが好まれるケースもあります。またプローブ間距離も、プローブ選択の要素になります。プローブは当社のサンプル増幅法のターゲット作製特性にマッチする3’バイアス型ですが、各転写産物のサンプルの多様な領域にもスペースをもっており、検出の安定化に有用です。
ジェノタイピング用アレイのプローブ選択には、別の方法が用いられますが、これはシークエンス内の個別のヌクレオチドを、マルチプルプローブで決定するという方法です。ターゲットとなるヌクレオチドは、ターゲットとする場所の配列をのみを変えて、その他は同一の4種類のプローブを用いることによって同定することができます。この場合、各プローブには可能な塩基4種類のうちの1個が含まれています。
その他のオプションとしては、コンセンサス配列の存在を、特定の対立遺伝子(allele)を検出するプローブを用いて決定することができます。ヘテロ接合体もしくは遺伝的にミックスしたサンプルのジェノタイピングには、プローブを多数搭載したアレイを作製し、重複した情報を提供可能であり、明確なジェノタイピング結果が得られます。さらに、一般的なプローブは、柔軟性を最大化するような用途に応用可能です。たとえばGenFlexTM probe arrayは複雑な混合物から生ずる個別の反応物質の分離と解析に利用できます。具体的には、1塩基多型(SNPs)同定用のプロトコルにも使用されています。
プローブの選択とアレイデザインのプロセスにおける各ステップをモニターするために、品質管理用アプリケーションを採用しています。さらに、シークエンス情報の連続的アップデートや、データベース処理用ならびにハイブリダイゼーション効率予測用の新しいアルゴリズムの開発によって、質の高いソリューションの提供が確保されています。
GeneChipアレイの製造 >>