PROTEIN 0TH-ORDER STRUCTURES AND THE ORIGIN OF LIFE

Kenji Ikehara1,2
1Narasaho College and 2International Institute for Advanced Studies
1806 Rokuyaon-cho, Nara, Nara 630-8566, Japan and 29-3 Kizugawa-dai, Kizugawa, Kyoto 619-0225, Japan
E-mail:i k e h a r a @ c c . n a r a- w u . a c.j p, i k e h a r a @ na ra s a h o -c . a c . j p
(Received July 30, 2009; Accepted September 9, 2009)


タンパク質の0次構造と生命の起原

池原健二1,2
1奈良佐保短期大学・生涯学習教育センター, 2国際高等研究所フェロー
1奈良市鹿野園町806,2京都府木津川市木津川台9丁目3番地

(Abstract)

     Based on the fact that RNA might possess not only genetic function but also catalytic function, RNA world hypothesis on the origin of life was proposed by W. Gilbert in 1986. He suggested that life emerged from RNA world formed by RNA self-replication. At present, the hypothesis is accepted by many researchers as the key idea for explanation of the origin of life. But, there are major weak points in the RNA world hypothesis as that it is very difficult to synthesize nucleotides under pre-biotic conditions through a random combinatory process and that it is also difficult to synthesize RNA by joining nucleotides in the absence of enzyme catalysts.
     Contrary to that, we have a counterproposal called [GADV]-protein world hypothesis, abbreviated as GADV hypothesis, in which we have suggested that life originated from a [GADV]-protein world, which comprised proteins composed of four amino acids: Gly [G], Ala [A], Asp [D], and Val [V]. A new concept, “protein 0th-order structure” or a specific amino acid composition, in which water-soluble globular proteins can be synthesized by random polymerization at a high probability, is crucial for the description of the emergence of life.
     The notion of the protein 0th-order structures led us to another new concept on the origin of life, assuming that water-soluble globular [GADV]-proteins could be created by random polymerization of [GADV]-amino acids with a high probability, even in the absence of any genetic function, i.e., before the creation of the first gene.
     In this article, I will describe the significance of the protein 0th-order structure in the origin of life.

(Keywords)

Protein 0th-order structure, Origin of Proteins, Origin of Genes, Origin of Life, GADV Hypothesis

要旨

  RNAが遺伝的機能と触媒機能を同時に持ち得ることを主な根拠として,RNAワールド仮説が1986年にW. Gilbertによって提案された.彼は,生命はRNAの自己複製によって形成されたRNAワールドから生まれたと考えたのだ.そしてこの考えが,現時点では生命の起原を説明するための主な考えとなっている.しかし,この仮説はヌクレオチドやRNAを無生物的に生成することが困難であるなど多くの問題を抱えている. それに対して,私たちは生命はGly [G], Ala [A], Asp [D] そして,Val [V] の4種のアミノ酸からなるタンパク質で構成された [GADV]-タンパク質ワールドから生まれたとの[GADV]-タンパク質ワールド仮説,略して,GADV仮説を提案している.
  一般に,既存の考えとは大きく異なる考えを新たに生み出すためには,新しい概念の導入が必要である.私たちの主張する生命の起原の提案にとっては,タンパク質のデータ解析から得られたタンパク質の0次構造,即ち,高い確率で水溶性で球状のタンパク質をランダム重合によって合成できる特異なアミノ酸組成という新しい概念の導入が重要なポイントとなった.
  即ち,遺伝的機能の存在しない条件下,言い換えれば,最初の遺伝子が形成される以前であっても,水溶性で球状の[GADV]-タンパク質を[GADV]-アミノ酸のランダム重合によって高い確率で生成できるという一つのタンパク質の0次構造に気づいたことが生命の起原に関する新たな概念を生み出したのである.本論文ではタンパク質の0次構造を中心に記載する一方で,私達の主張するGADV仮説の可能性も議論したい.

1. 序論

  タンパク質の構造形成は,一般に,遺伝情報に基づいて行われるタンパク質のアミノ酸配列(一次構造)の形成で始まり,続いて,α-へリックスやβ-シート構造,ターン/コイル構造などの部分構造としての二次構造の形成が行われ,それらが水溶性で球状の構造(三次構造)へと折りたたまれることによって行われると考えられている.このように,タンパク質の構造形成は一次構造を構造形成の起点とし,続いて,二次構造,三次構造の形成のように順に段階を追って行われると考えられているのである[1].
  一方,わずか100個のアミノ酸で構成された小さなタンパク質であっても,その配列多様度は,20100 = 約10130 にも達する膨大なものである.したがって,単純に考えると,それ以前に存在したどのタンパク質のアミノ酸配列とも有意な相同性(一致度で約30% 以上)を持たないタンパク質を生み出すためには,この膨大な数の多様度の中から,ある一つの有効なアミノ酸配列を選択しなければならない(新規タンパク質の形成に関するアミノ酸配列仮説,以下では簡略化して,アミノ酸配列仮説と呼ぶ)ことになる.しかし,このことは確率的にみて事実上不可能である[2].
  そのため,このアミノ酸配列仮説が成立しないことを前提に,全く新規なタンパク質を形成するための考えとして,疎水性相互作用を中心的相互作用とする格子モデルによって計算されたタンパク質構造仮説も提唱されている[2].この考えによれば,同じ機能を持つタンパク質は莫大な数の相同な三次構造を採るタンパク質の中から独立に選択されたもので,三次構造は似ていてもアミノ酸配列自体は互いに似ていなくても良いことになる.しかし,同じ機能を持つタンパク質ファミリーに属する相同なタンパク質(ただし,同じ機能は持っていてもアミノ酸配列や構造の異なるものは除く)はほとんどの場合,アミノ酸配列を比較すると有意な相同性を持っている.そのため,独立に選択されたものではなく,一つの共通祖先から生まれたと考えざるを得ない.したがって,この事実はタンパク質ファミリー内の新規なタンパク質がタンパク質構造仮説にしたがって形成されているのではないことを示している.
  それではタンパク質ファミリー内に属するタンパク質はどのようにして形成されたのであろうか.これについては,大野乾が提唱した遺伝子重複仮説で上手く説明することができる[3].即ち,ある一つの機能タンパク質をコードしている遺伝子から新しい機能を持った新規遺伝子が形成される過程を考えてみよう.この場合,遺伝子に塩基置換が起こり,ある別の機能を持つタンパク質をコードする新規遺伝子が生まれたとすると,新規遺伝子の形成を説明することはできても,元の機能が失われることとなる.この問題点を避けながら,新規遺伝子とそれがコードする新規タンパク質の形成過程を説明しているのが遺伝子重複仮説である(Fig. 1)[3].この遺伝子重複仮説にしたがえば,遺伝子が重複した後なら一方の遺伝子を元の機能を発揮するタンパク質の遺伝子として保持できる.したがって,重複後のもう一方の遺伝子に塩基置換が起こり元のものとは別の機能を持つタンパク質をコードする新規遺伝子に変化しても何も問題は生じない.こうして,タンパク質ファミリー内の相同なタンパク質は遺伝子重複によって生み出された新規遺伝子がコードするタンパク質として新規に形成されてきたのであろう.実際,あるタンパク質ファミリー内に属するタンパク質は互いにかなりの割合(一般に,30% 以上)のアミノ酸一致度を示す.そのようなこともあって,遺伝子重複仮説の正しいことは多くの人の認めるところとなっている.
  しかし,大野の提唱する遺伝子重複仮説は上でも書いたように同じ遺伝子ファミリー内に属する相同な遺伝子群(同時に,同じタンパク質ファミリーに属するタンパク質群)の形成過程についてのみ説明できる考えである.そのため,ある時点以前に存在したどのタンパク質のアミノ酸配列とも有意な相同性を持たないタンパク質(タンパク質ファミリーの最初のタンパク質(First Family Protein:FFP))の形成に関しては,残念ながらこれまでの遺伝子重複仮説では説明できない.したがって,タンパク質ファミリーを形成する第一歩となった第一ファミリータンパク質(FFP)の形成,即ち,「それまで存在したどのタンパク質のアミノ酸配列とも有意な相同性を持たないタンパク質はどのようにして形成されてきたのか」という問にはこれまで全く答えることができなかったのである.
  それではどのようにしてFFPが形成されたのかについて考えてみることにしよう.本論文では,これらFFPの形成機構とタンパク質の0次構造(水溶性で球状のタンパク質を形成するための6つ,または,4つの条件を満足できる特異なアミノ酸組成)の関係および生命の起原についての私たちの考えを解説することにしたい.



Fig. 1. Formation of homologous proteins belonging in a protein family can be explained with gene-duplication theory proposed by S. Ohno [3].

2. タンパク質のアミノ酸組成の遺伝子GC含量依存性

  これまですでに総説[4]や論文[5]の中でタンパク質内のアミノ酸含量の遺伝子GC含量依存性については述べてきたので,ここでは簡単にその要点だけを述べることにしたい.
  多くの場合,どのアミノ酸をコードするのかは遺伝暗号の前二つの塩基によって決まっている.そのこともあって,前二つがGまたはCの遺伝暗号(GCコード)によってコードされているアミノ酸は遺伝子のGC含量が大きくなるにつれてタンパク質内のアミノ酸含量は大きくなり,逆に,前二つがAまたはU の遺伝暗号(AUコード)によってコードされるアミノ酸は遺伝子のGC含量が大きくなるとタンパク質内のアミノ酸含量が小さくなることが予想される.確かに,20種のアミノ酸の内,10種のアミノ酸は遺伝子のGC含量に伴ってタンパク質内のアミノ酸含量を大きく変化させることが分かった.即ち,GCコードによってコードされる4種のアミノ酸:Ala, Gly, Pro, Argおよび混合コードでコードされているVal(唯一の例外であるが)はGC含量が大きくなるにつれてタンパク質内のアミノ酸含量も大きくなり,AUコードによってコードされる5種のアミノ酸:Lys, Ile, Phe, AsnおよびTyr はGC含量が大きくなるとタンパク質内のアミノ酸含量が小さくなることを確認できた [4].

3. アミノ酸組成から求められるタンパク質の6つの性質

  上で述べたように,タンパク質内の約半数のアミノ酸含量は遺伝子のGC含量に伴って大きく変化するが,GC含量の高いゲノムを持つ細菌であっても,AT含量の高いゲノムを持つ細菌であっても,細胞内は水が主成分である。そのため,タンパク質の細胞内環境はそれほど大きく変化しないはずであり,アミノ酸含量が大きく変化しても,疎水性や親水性などのタンパク質の基本的性質はあまり変化しないはずである.私たちはこの点についてもすでに確かめており,タンパク質のデータベースから入手した個々のタンパク質のアミノ酸組成と,対応するアミノ酸の構造因子(アミノ酸固有の値)を用いて計算によって求めた6つの性質((1)疎水性/親水性度,(2)α-へリックス形成能,(3)β-シート形成能,(4)ターン/コイル形成能と,(5)酸性アミノ酸含量,および(6)塩基性アミノ酸含量)は遺伝子のGC含量に依存せず,ほぼ一定であることを確認している[4, 5].
  このことは,水溶性で球状のタンパク質を形成するためにはアミノ酸組成を用いて計算できる6つの条件(GADVタンパク質の場合には,酸性アミノ酸含量および塩基性アミノ酸含量を除いた4つの条件)を満足する必要のあることを意味している.言い換えれば,これらの性質をタンパク質が水溶性で球状となるための必要条件として使用できることを意味しており,このような6つ,または,4つの条件を満足できるアミノ酸組成こそが,第一ファミリータンパク質となるFFP形成のための重要な鍵を握っていることを示している.このことは,6つ,または,4つの性質をFFPになり得るかどかを判定するのに使用できることを意味している.

4. 新規タンパク質(FFP)形成原理とタンパク質の三つの0次構造

  もちろんよく知られているように,現在の生命システムの中ではタンパク質は遺伝子の情報にしたがって合成される.そのため,全く新規なタンパク質を形成する仕組みが,同時に全く新規な遺伝子の形成過程と密接に関連しているのは明らかである.    一方,単純な配列からなるポリヌクレオチドを合成する酵素,例えば,ポリAポリメラーゼや5’-NDPを基質としてランダムに重合するポリヌクレオチドホスホリラーゼの存在は知られていても,新規に遺伝子(コドンの3つの塩基位置毎に特異な塩基組成を持つポリヌクレオチド(コドン配列))を合成する酵素の存在は知られていない.
  そこで,私たちはアミノ酸組成と個々のアミノ酸の持つ因子を使って計算によって求めたタンパク質の6つの基本的性質(疎水性/親水性度,α-へリックス,β-シート,ターン/コイル形成能,酸性アミノ酸含量および塩基性アミノ酸含量)を用いて,どのような場ならFFPを形成できるのかを検討した.その結果,現在の普遍遺伝暗号を使用する細菌内では,GC含量の大きな遺伝子のアンチセンス鎖(GC-NSF(a))[6] や,SNS原始遺伝暗号を使用している頃には (SNS)n 遺伝子のアンチセンス鎖上の配列なら水溶性で球状の構造を形成するための6つの条件を満足することが分かった[5, 7].また,GNC 原初遺伝暗号を使用している時期には (GNC)n 原初遺伝子のアンチセンス鎖上の配列なら,6つのタンパク質の構造形成条件から酸性アミノ酸含量と塩基性アミノ酸含量を除いた4つの条件を満足できることも確認している[5].
  言い換えれば,これら三つの時期の遺伝子(いずれもGC含量の高い遺伝子)のアンチセンス鎖上のコドン配列は,アンチセンス鎖上の配列として限定されてはいても,実質上はある特定のアミノ酸組成内(タンパク質の0次構造内)でアミノ酸をランダムに並べながら,それぞれの時代のセンス鎖上のコドン配列(使用されている遺伝子)がコードするタンパク質のアミノ酸組成とほぼ同じアミノ酸組成を持つタンパク質をコードできることが分かったのである.
  このようにして,上で記載したような事実に基づいて,私たちは最初の二重鎖遺伝子が形成されてから以降は (GNC)nや(SNS)n,あるいはGC含量の高い遺伝子のアンチセンス鎖(GC-NSF(a))など,GC含量の高い遺伝子のアンチセンス鎖から新規遺伝子が生み出され,そうして生み出された新規遺伝子によってコードされるタンパク質がFFPとなったとの考えを提唱している(Fig. 2)[6, 8].逆に言うと,それまでに存在したことのないようなアミノ酸配列を持つタンパク質は,ある特定のアミノ酸組成(タンパク質の0次構造)の中でアミノ酸をランダムに連結できるアンチセンス鎖のコドン配列を利用していること,加えて,これが新規遺伝子や新規タンパク質を生み出す経路の候補として有力なのだということが分かるであろう(Fig. 2およびFig. 3).




Fig. 2. Two routes for creation of new genes. While new genes homologous with parental gene were produced from GNC, SNS or presently existing codon sequences on the sense strand (route 1), entirely-new genes encoding FFP had or have been created from GNC, SNS or present GC-rich codon sequences on the anti-sense strands (route 2), when necessary, always after creation of the first double-stranded (GNC)n gene.





Fig. 3. Effective synthesis of water-soluble globular proteins by random polymerization in protein 0th-order structures.

5. タンパク質の0次構造と生命の起原に関するGADV仮説

  次に,遺伝子(2重鎖RNAまたは2重鎖DNA)が形成されるよりも以前にはどのようにして新たな機能と新たなアミノ酸配列を持つタンパク質が形成されたのかについて考えることにしよう.その頃は,遺伝子が存在しなかったため,遺伝子機能とは無関係に,ランダムなアミノ酸配列を持つタンパク質しか合成できなかった.それでも効果的に有効な機能を持つタンパク質を形成できたと推測できるのはランダムにアミノ酸を連結しても高い確率で,水溶性で球状のタンパク質を形成できるアミノ酸組成(この場合は,4種のGADVアミノ酸をほぼ均等に含むアミノ酸の集団),即ち,タンパク質の0次構造の一つであるGADVアミノ酸を利用することができたからなのである [9, 10].
  このような考えに到達できたのは,最初の遺伝暗号が GNC であり,その時期の遺伝子は (GNC)n遺伝子でしかなく,そのような遺伝子の情報にしたがって合成されていたタンパク質はGADVの4種のアミノ酸でコードされたタンパク質だったはずであること,しかも,GADVアミノ酸がタンパク質の0次構造の一つだという考えに思い当たったからである.即ち,4種のGADVアミノ酸(この時点で,ADVの3種のアミノ酸はホモキラルでなければならなかったが)をランダムにつないでも高い確率で,水溶性・球状のタンパク質を形成できるはずだとのことに思いをめぐらせていた時,突然,これまで言われてきたように,生命はRNAワールドから生まれたのではなく,遺伝子が形成される以前に,GADVの4種のアミノ酸をランダムにつなぐことによって同じではないが,水溶性で球状という意味で,よく似たタンパク質を擬似複製によって多数合成していたGADVタンパク質ワールドから生命は生まれたのだとの考えが閃いたのである[9, 10].このような考えに到達してみると,これまで言われてきたRNAワールド仮説にはいくつもの欠点の存在することが分かった[4, 9, 10].たとえば,RNAワールド仮説では,最初の遺伝暗号や,遺伝子,したがって,タンパク質がどういうものであり,どのようにして形成され,現在に至っているのかを説明できない(説明できそうにない)考えであることに気がついた[10].
  それは,RNAワールド仮説はリボザイムの発見にともなって,遺伝子とタンパク質の間に見られるいわゆる「ニワトリと卵」の関係の成立過程を説明することを主眼に考えつかれたものであり,Eigenによるハイパーサイクル説 [11-13] や根本・伏見によるウイルス的ハイパーサイクル戦略モデル [14, 15] などの理論的・実験的検証はあるものの,タンパク質の構造形成とRNAの塩基配列との関係や最初に形成されたRNAがどのようにして遺伝暗号を形成できたのかなどについてはほとんど具体的に考察されることなく,単にRNAが形成できれば遺伝的機能を発揮できたはずだとの漠然とした思いの上に打ち立てられた考えだからである[16].

6. タンパク質の0次構造と最初の遺伝子形成との関係

  さらに私たちは,最初の遺伝子を形成できたのもタンパク質の0次構造があったからだと考えている[8].なぜなら,原理的にある特定の機能を発揮するタンパク質のアミノ酸配列を設計することも,そのような特定のアミノ酸配列をコードするヌクレオチド配列を設計することもできないことは明白だからである.それではどのように,最初の遺伝子を形成できたのかについて考えてみることにしよう.その過程は,次のようなものだったに違いない[8-10].
  GADVアミノ酸を直接ランダムに重合することによって,有効な機能を発揮できる水溶性で球状のGADVタンパク質を形成していた時代に引き続いて,遺伝暗号や遺伝子とは無関係にGADVタンパク質による擬似複製によってGADVタンパク質を効果的に合成していた時代(GADVタンパク質ワールドの時代)があったと思われる.その後,GADVタンパク質の合成をより効果的に行うため,
(1) GNCを含むオリゴヌクレオチド(原初GNC-tRNA)とGADVアミノ酸との特異的結合を介してそれまでに比べてはるかに効果的にGADVタンパク質を合成できるようになった時代(GNC原初遺伝暗号の確立)があり(Fig. 4),続いて,
(2) 原初tRNAの中に含まれるGNCコドンを連結することによって形成された原初一本鎖 (GNC)n 遺伝子を利用しながらGADVタンパク質を合成していた時代が到来し(Fig. 4),引き続いて,
(3) 原初一本鎖 (GNC)n 遺伝子の相補鎖を合成することによって形成された最初の二重鎖(GNC)n 遺伝子のコドン配列を利用しながらGADVタンパク質を合成できるようになった時代が到来したのであろう(Fig. 4).





Fig. 4. Three types of random GADV protein syntheses carried out (1) by direct synthesis, (2) with GADV amino acid-GNC containing oligo-nucleotide complexes and (3) with codon sequences of anti-sense strands of by (GNC)n genes ((GNC)n(a)).

  こうして,最初の二重鎖(GNC)n遺伝子が形成されたと推定することができる.GADV仮説に思い当たった私たちからすると,生命の起原を考えるには,単に,RNAワールド説が提案されるきっかけとなったように,遺伝子とタンパク質の間に見られる「ニワトリと卵」の関係がどのようにして生み出されたのかを説明することが重要なのではなく,生命の基本システムの構成メンバーである,遺伝子や遺伝暗号,タンパク質がどのように形成されたのかを基礎に生命の起原を説明する方がはるかに重要だと考えている[10].もちろん,私たちのGADV仮説は遺伝子と遺伝暗号の間に見られる「ニワトリと卵」の関係の成立過程についても上手く説明できる.というのは,アミノ酸の直接的なランダム重合によって形成されたGADVタンパク質の世界から始まり,続いて,GNC原初遺伝暗号の形成,そして,(GNC)n遺伝子の形成というように,現在の生命体が持つ遺伝情報の流れを遡るようにして形成されたと説明することができるからである.GADV仮説が想定するように,「ニワトリと卵」の関係が「触媒機能から遺伝的機能」の形成へと進んで確立されたと考える方が,RNAワールド説が言うように,漠然と遺伝的機能と触媒機能をあわせ持つRNAから生命が生まれ,後になって,遺伝的機能をDNAに,触媒機能をタンパク質に移すことによってDNAからRNAへ,そして,タンパク質へと遺伝情報が流れていくシステムが形成されたと考えるよりもはるかに合理的なように思われる[4, 9, 10].
  このように,私たちのGADV仮説が想定しているように,タンパク質の0次構造の存在がGADVタンパク質ワールドを生み出し生命の誕生へと導いたのだと考えている.

References

1. Berg, J. M., Tymoczko, J. L. and Stryer, L. “Biochemistry, 5th Ed”. W. H. Freeman and Company: New York, 2002.
2. Dill, K. A. Dominant forces in protein folding. Biochemistry, Biochem. 29, 7133-7155 (1990).
3. Ohno, S. “Evolution by Gene Duplication”, Springer: Heidelberg, 1970.
4. Ikehara, K. Origins of gene, genetic code, protein and life: Comprehensive view of life system from a GNC-SNS primitive genetic code hypothesis, J. Biosci. 27, 165-186 (2002).
5. Ikehara, K., Omori, Y., Arai, R. and Hirose, A. A novel theory on the origin of the genetic code: A GNC-SNS hypothesis, J. Mol. Evol. 54, 530-538 (2002).
6. Ikehara, K., Amada, F., Yoshida, S., Mikata, Y. and Tanaka, A. A possible origin of newly-born bacterial genes: significance of GC-rich nonstop frame on antisense strand, Nucl. Acids Res. 24, 4249-4255 (1996).
7. Ikehara, K and Yoshida, S. SNS hypothesis on the origin of the genetic code, Viva Origino 26, 301-310 (1988).
8. Ikehara, K. Mechanisms for creation of original ancestor genes, J. Biol. Macromol. 5, 21-30 (2005).
9. Ikehara, K. Possible steps to the emergence of life: The [GADV]-protein world hypothesis, Chem. Rec. 5, 107-118 (2005).
10. Ikehara, K. Pseudo-replication of [GADV]-proteins and Origin of Life, Int. J. Mol. Sci., 10, 1525-1537 (2009).
11. Eigen, M. Selforganization of matter and the evolution of biological macromolecules, Die Naturwissenschaften 58, 465-523 (1971).
12. Eigen, M. and Schuster, P. The hypercycle. A principle of natural self organization. Part A: Emergence of the hypercycle, Naturwissenschaften 64, 541-565 (1977).
13. Eigen, M., McCaskill, J. and Schuster, P. Molecular quasi-species, J. Phys. Chem. 92, 6881-6891 (1988).
14. Nemoto, N. and Husimi, Y. A model of the virus-type strategy in the early stage of encoded molecular evolution, J. Theor. Biol. 176, 67-77 (1995).
15. Nemoto, N., Miyamoto-Sato, E., Husimi, Y. and Yanagawa, H. In vitro virus: Bonding of mRNA bearing puromycine at the 3'-terminal end to the C-terminal end of its encoded protein on the ribosome in vitro, FEBS Lett. 414, 405-408 (1997).
16. Gilbert, W. The RNA world, Nature, 319, 618-618 (1986).


Return to Japanese Contents

Return to English Contents