気になるケータイの中身

“スマート・マルチコア”でクアッドコアに対抗する「OMAP」


 4インチ超のHDディスプレイ、LTEなどの高速通信方式への対応、そしてクアッドコアCPUの登場と、スマートフォンの進化は今なおとどまるところを知らない。本誌では、スマートフォン・タブレットに搭載される技術の中でも、CPUやモデムなど、チップセットの進化に注目し、エヌビディア、クアルコム、テキサス・インスツルメンツの3社の担当者にそれぞれインタビュー取材を行った。3社が描く未来や戦略は、その出自の違いもあり、それぞれに異なっている。

 第3回目は、「OMAP」シリーズを手がけるテキサス・インスツルメンツ(TI)。インタビューでは、日本テキサス・インスツルメンツ 営業・技術本部 モバイルソリューションビジネス スマートフォングループ OMAPビジネスディベロップメント 主事の田渕宏亨氏と、同グループ 半導体グループ上級主任技師 シニアマネージャーの宮崎昌浩氏の2名にお話を伺った。

 



左から宮崎昌浩氏、田渕宏亨氏

 

いち早くLinux/Androidに投資、端末を差別化しやすく

――最初に、これまでのOMAPシリーズの経緯や特徴を教えてください。

宮崎氏
 2Gの時代からチップは提供していましたが、「OMAP」という形になったのは、ちょうど3Gの時代、アプリプロセッサーとモデムが分かれた時からですね。その頃に、OMAPの第1号である「OMAP1」を出しました。この頃はARM9の時代で、OMAP2でARM11、OMAP3でARMのCortex A8と移ってきました。OMAP3の時代には「OMAP3430」「OMAP3630」などの、周波数を上げたり周辺チップの性能を向上させたりした、時代に合わせたマイナーチェンジさせたようなものが、ひとつのシリーズの中で派生して登場します。

 OMAP4ではこれが3種類になり、主流の「OMAP4430」、これから容易に移行できる、周波数を上げた「OMAP4460」、さらにグラフィックス処理を強化した最新の「OMAP4470」という製品を、2012年第4四半期に量産予定です。このOMAP4シリーズからはデュアルコアで、現在のスマートフォンに搭載されているのはOMAP4シリーズが中心になっていると思います。

――「OMAP4」はGoogleのリードデバイス(GALAXY NEXUS)に採用されたことで、スマートフォン向けとして突然注目が集まった印象があるのですが、そこに至る経緯や、スマートフォン向けに注力し始める経緯は、どういったものだったのでしょうか。

宮崎氏
 スマートフォンの定義も移り変わってきていますが、タッチパネルディスプレイとハイレベルOSの組み合わせで、かつアプリケーションをダウンロードできるという、今で言うところのスマートフォン向け、という意味では、OMAP4からですね。

田渕氏
 OMAP2の頃、ドコモのほとんどの機種に採用されていた時期がありました。OMAP4の時代になると、スマートフォンやAndroidが主流になり、端末メーカーから指名を受けることが再び多くなりました。

 これまでは、TIはOSについて全方位体制で取り組んでいましたが、いち早く、特にLinuxとAndroidに集中投資することを決め、リソースも投入してきました。また、Google主導のAndroidの取り組みにも早期から参加し、Androidの仕様や実装に対し、コントリビューターとして数々の提案も行ってきました。Androidが更新される度に、最新のソフトウェアとハードウェアをセットで動かせるという環境を作ってきたことが(リードデバイス採用の)要因のひとつとしてあると思います。OMAP4では、デュアルコアになったことでよりパフォーマンスが要求されるケースに早く対応できます。

 我々の競合他社と比べて、差別化できるような種を毎回用意していますので、そうしたものを端末メーカーが活用し、基本性能を満たしつつハンドセットを差別化できるといった点も、OMAP4が注目されている土壌になっていると思います。


OMAPのロードマップ。デュアルコアで最大1.8GHzの「OMAP4470」は2012年中旬以降、デュアルコアで最大2GHzのOMAP5、「OMAP5430」は2012年後半以降に投入される

 

柔軟性・安定性、ローカルサポートに強み

――競合というとクアルコムやエヌビディアなどでしょうが、差別化のポイントは、例えば「OMAP4430」ではどういった点になるのでしょうか。

田渕氏
 まずAndroidプラットフォームとして完成度が高くなければいけません。今の時代、最新のプロセッサーを搭載し、最新のバージョンのAndroidを搭載することで商品価値が生まれる部分があるので、ソフトウェアの完成度を高めた上で早期の投入に対応できることは最低限クリアしなければいけない部分でしょう。

 リファレンス設計に手を加えると動作は保証しない、となれば、差別化のバリエーションは限られてきます。一方、OMAPでは柔軟性と安定性のある基本プラットフォームを提供しています。これに加えて新しいユーザー体験を実現できるようなサードパーティのソフトの紹介や、それらを早期にTIのプラットフォーム上で実装・検証した上で、合わせて提供するといった取り組みを行っています。

 例えば「OMAP3630」「OMAP4430」の頃は、世の中で3D立体視が立ち上がりかけていた時期でした。OMAPには特有のディスプレイ・サブシステムがあり、メモリを縦横自由な幅で読み出せるという仕組みと合わせてうまく使うと、表示メモリの書き換え回数を減らすことができます。こうしたソリューションで3Dをパフォーマンス良くサポートしてきました。また、ジェスチャリングといったナチュラル・ユーザーインターフェースなどもサポートしています。

 ほかにも、セキュリティを重視し「M-Shield」と呼ばれるセキュリティのアーキテクチャーを入れています。OMAP1の頃から搭載しており、現在はさらに進化しています。元々はARMでも採用しているTrustZoneをベースにしたアーキテクチャーですが、耐タンパ性(内部データの解析に対する耐久性)が上がるようなキーの仕組みがあり、これまでハッキング対象にされたことはあっても、セキュリティを破られた実績はないという堅牢性の高いものになっています。

 日本では特に、OMAP2の頃に(ドコモ端末で多く採用されたことなどから)優秀なエンジニアが育ったという点もあります。そうした日本TIのメンバーが支えているローカルサポート力の強みは、今でも大きいと思います。

宮崎氏
 OMAP1の頃からある「SmartReflex」という電流削減のための技術は、現在「SmartReflex 3」にまで進化しており、動作可能な周波数が上がっても、可能なレベルまで周波数を落とすテクニックを提供することで、電流を上げないように工夫することもできます。

 

複数種類のコアを組み合わせる「スマート・マルチコア」と分散処理

――消費電力の削減は各社でいろいろな方法があるようですが、TIの場合は具体的にどういう工夫になっているのでしょうか。

宮崎氏
 まず、「DVFS」(Dynamic Voltage and Frequency Scaling)と呼ぶ、動作周波数と必要動作電圧の組み合わせで複数の動作ポイント(OPP)を用意し、プロセッサーの負荷が低い処理では動作電圧と動作周波数を下げます。非常に一般的な手法ですが、コツコツと実装しています。

田渕氏
 次に、「スマート・マルチコア(Smart multi-core)」と呼んでいる技術で、複数のCPUコア、それも同じCPUコアを3つも4つも並べるのではなく、用途を予め想定した複数のコアと、ハードウェアアクセラレーターの組み合わせで構成しています。

 例えばOMAP4ではメインとしてARM Cortex A9コアが2個、サブとしてARM Cortex M3コアが2個搭載されています。このほかにも、MP3オーディオのオーディオ・バックエンド、グラフィックス処理用のSGX540、カメラISPアクセラレーター、動画の処理を行うIVA HDといったハードウェア・アクセラレーターなど、ハードで構成したほうが消費電力とパフォーマンスの面で有利なものがコアとして搭載されています。動画についてはコーデックの流行り廃りに柔軟に対応する必要があるので、プログラマブルなDSPも合わせて搭載されています。

 これはOMAP5でも同様で、コアの中身はCortex A9からA15になったり、Cortex M3からM4になったりと進化していますが、SOC(System On Chip)としてのスマート・マルチコア・アーキテクチャーはそのままで分散処理をする仕組みです。

宮崎氏
 OMAP1の時代からコンセプトは同様ですが、コ・プロセッサーとして小さなコアが搭載されたのはOMAP4からです。このサブのコアは、ハードウェアアクセラレーターをシーケンサーとして動かしています。例えばUIを動かしているときはメインのコアが処理しますが、動画再生時もメインのコアで処理すると消費電力が多くなります。そうした場合にサブのコアがハードウェアアクセラレーターを駆動し、メインのコアは休んでいる状態に入れます。我々はこれを分散処理と呼んでいます。

田渕氏
 中に複数のパワードメイン、およびクロック・ノードがあり、使用していない部分の電力をカットできます。例えて言うなら、家庭で電球などの数を減らしたり、コンセントからケーブルを抜いたりして節電しているイメージです。CPUは停止・起動できますが、早く起動しなければならない場合は、待機状態でクロックを下げておくこともできるので、その分だけ電源電圧を下げられます。

 例えばMP3ファイルの再生は、CPUが完全にオフの状態でも可能です。I/Oのバッファとオーディオ・バックエンドには電源電圧がかかりますが、それ以外はオフになっている動作モードです。

宮崎氏
 これは「Audio Back End Processor」という非常に小さなプロセッサーが動くのみで、そこ以外は電力をカットしている状況ですね。なので、小さい音楽用プロセッサー1個で動いているような電力で利用できます。この時、CPUはI/Oピンからの割り込みなどで起動できるようになっています。


OMAP4におけるSOCの内容。デュアルコアに加えて、サブのコアを搭載した「スマート・マルチコア」で、OMAP5も同様のコンセプト

 

――スマートフォンでは、背後で自動的にパケット通信が発生し、インストールしているアプリによってはそうした挙動による消費電力の増加も影響が小さくないと感じます。こうしたことへの対策はあるのでしょうか。

田渕氏
 実際の利用では、ネットワーク側にアクセスして情報を取りに行ったり、通信速度を考慮して判断したりといった最適化動作のきめ細かい制御と、消費電力はトレードオフの関係です。ユーザーからすると、常に最速のネットワークに接続していて欲しいのですが、移動中などちょっと環境が変わる度に最適なネットワークを探し続けていたのでは、どんどん電力を消費していきます。どれぐらいの頻度でネットワークを探すか、あるいはどれぐらいまでビットレートが落ちれば切り替えるか、そうした挙動の味付けの部分は、どちらかというと端末メーカーが戦略として決める部分だと思います。

 我々からは、こうすれば速くなる、あるいは、このぐらいのバランスならあまり無駄にはならない、といったアドバイスはできます。ただ、最終的には、キャリアの方針に沿う形でメーカーが決めることになります。

 

モデムとは進化の速度に違い。あらゆるメーカーのモデムと繋ぐ方針

――他社ではワンチップソリューションから、モデムを分離したソリューションを増やしているところもありますが、TIにおいては、あくまでもモデムを分けた、アプリケーションプロセッサーが中心ということでしょうか。

田渕氏
 モデムはこれまでの2G、2.5G、3Gなどといったように、常に進化して置き換わっていきますが、アプリケーションプロセッサーとの進化の速度が違います。なので、アプリケーションプロセッサー側の進化のタイミングと、モデム側の進化がなかなか同期しないのです。

 ネットワーク側が進化する時、顧客としては、最速のアプリケーションプロセッサーと最新のモデムの組み合わせで製品を発売したいわけです。そうした時に、ワンチップ化にこだわっているとタイムリーに製品化できません。

 また、2.5GまではTIでもモデムのビジネスを手がけていましたが、3Gの半ばの時期で、新規のモデムビジネスからは撤退しました。それ以降、OMAPはあらゆるメーカーのモデムと繋ぐという方針です。このために、モデムインターフェースはLTEを含め複数を用意しています。

 OMAP3以降、一部ではモデムメーカーと協業し、プリインテグレーションという形で双方のソフトウェアを組み合わせ、動作検証した上で提供するといったことも行っています。

宮崎氏
 開発をアプリケーションプロセッサーに集中しているのは、モデムと開発のスピードが違うという点で、その時点で最適なものを選んで組み合わせて下さい、というコンセプトですね。

 

組込機器向けの展開は拡大

――進化という意味では、Androidのバージョンアップも早いという印象ですが、実際のところ、早すぎるのでしょうか?

田渕氏
 最近までは、年に3回も4回もOSを更新しなければいけないという状況でしたが、ここへきて落ち着いてきており、J(Jelly Bean)やKでは年2回ぐらいのリリースに落ち着きつつあるようです。TIでは、バージョンアップしたAndroidの公式リリースから2週間で最初のOMAP対応版をリリースし、8週間後には量産品質版のリリースを心がけています。

――今後の、Android以外のOSのサポートも気になるところです。同じプラットフォームの上で、異なるOSが動く時代になってきた印象はありますが。

田渕氏
 Windowsは社内にも別の部隊があり、着々と進めているところです。

 OMAP自体、携帯電話だけではなくほかの機器にも幅広く使われてきており、その用途によってはただのLinuxでかまわないというケースもあります。Linuxについては、Androidの下位レイヤーがLinuxなので再利用できます。

――例えば車載機器で通信機能が付くとなった時に、OMAPを提案していくといったことは。

田渕氏
 社内に携帯電話・タブレット以外の、組込機器向けにも拡大していこうという動きがあり、今年の春に組織変更を行って、組込機器向けの展開を推進するグループが創設されています。実際にカーナビやアクセサリー機器向けにも売り込んでいる状況です。

――さまざまなデバイスに搭載するとなると、製品としてもバリエーションが登場すると思いますが、サイズや用途が違えば求められる内容も違ってくると思います。そうしたロードマップはどう描いているのでしょうか。

田渕氏
 組込機器向けとしては過去に、OMAP-DMと呼ばれるデジタルカメラ向けのチップなど、OMAP共通のコアを使いながら冗長な構成を外したものなどがありました。OMAP3の時代になると、組込機器向けとしてOMAP3611やOMAP35xシリーズなど、基本部分は同じで細部が異なるものをリリースしました。

 携帯電話の場合は体積を小さくして実装しなければいけないので、0.4mmピッチのパッケージになりますが、組込機器では携帯電話のように多層基板も8~10層など使わず、できれば4~6層ぐらいで済ませたいということになります。また、サイズの制約も、携帯電話よりは大きくてもいい、といったケースが多い。そうした用途に向け、いくつかのOMAPシリーズについて、ピンピッチを広くした別パッケージのバリエーションも作ってきました。

――パッケージのバリエーションを増やして対応するのは、今後も継続していく方針でしょうか?

宮崎氏
 いままではバラバラに展開してきましたが、携帯電話向けの製品が幅広い機器に応用できるようになったので、統合した上でパッケージ分けしたり、違うOSを搭載したりと、1つの製品を横に広げていく方針になっています。

 

OMAP5はOMAP4のコンセプトを継承

――OMAP4460、今後登場するOMAP4470について、スペックの違いを具体的に教えていただけますか。

田渕氏
 OMAP3まではARM Cortex A8のCPUで1GHzまででしたが、OMAP4430ではCortex A9になり、スペシャルバージョンで1.2GHzまで対応しました。

 次は、その周波数を引き上げたもので、デバイス内部のクリティカル・パス(性能を決定づける経路)を最適化し、CPUとキャッシュの結合を密結合にして、若干コア性能とクロックを上げたのがOMAP4460です。今夏モデルとして市場に出てきているのがこの4460で、1.5GHzまで動作します。チップの中の周辺構成は基本的に4430と同じです。

 その先はOMAP4470で、これにはOMAP5で搭載される予定の「SGX544」というグラフィックスコア(GPU)を1コア、搭載しています。ベンチマークの項目にもよりますが、従来の「SGX540」と比較して1.4~2倍ほど性能が向上しています。ビデオ性能に関しては、4430で既に1080p、30fpsのエンコード・デコードに対応しています。ステレオスコピック(立体視)の3D表示では差が出て、4430では720pで30fpsですが、4460、4470では1080pの24fpsに対応します。クロックレートは、4470では1.8GHzを目指しています。

 その先はOMAP5となり、CPUはARM Cortex A15になります。これまでと同じように、CPUが2コア、Cortex-M4が2コア、各種ハードウェアアクセラレーターを搭載し、最大2GHzで動作します。グラフィックス性能はSGX544をデュアルコア化して搭載し、OMAP4460と比較して5倍ぐらい、ピークで8倍ぐらいの向上でしょうか。ビデオ性能も上がり、1080pのフルHD動画は60fpsでエンコード・デコードできるようになります。ステレオスコピックにしても30fpsで動作が可能です。

 プロセスは、OMAP4では45nmプロセスでしたが、OMAP5は28nmになります。

 さらにその先は……OMAP3、4、5ときて、「?」かな? というところですが(笑)、OMAP5の経験などを活かしながら、内部の機能モジュールの設計を進めている段階です。


「OMAP5430」の概要

 

クアッドコアは「マーケティング上の対立軸」

――スペック重視のユーザーにとっては、デュアルコア、クアッドコアといった部分は、関心が高い話題です。少なくとも次のOMAP5はデュアルコアということですが、コア数に対する考えは、どういうものでしょうか。

田渕氏
 4コア、2コアの論争について、ケータイ Watchではどう考えていますか?(笑)

――うまく制御できるなら4コアでもいいと思いますが、今出ているものを見る限りでは、それほど効果はないのかなという印象もあります。ただ、例えばフルHD動画などで、端末に接続した外部の機器まで活用しようとなると、やはり絶対的なパフォーマンスは必要だと感じます。

田渕氏
 そうですね。いろいろな切り口から、いろいろなことが言えると思います。

 他社のものを採用した端末の設計では、4コア化されたものの、パワーを食う割に性能が出ない、コストが上がる、という問題に直面しているようです。4コアを採用しながらも、できるだけそれらを動かさないよう実装している、というような話を聞いています。

 単にマーケティング上の対立軸としてクアッドコアが求められているようにも見受けられますね。4コアの実際の製品を見ていると、タブレットはまだいいのですが、“ケータイ”としてバランスのいい製品を作るのは、かなり難しい印象です。OMAP5、あるいはその次の製品の開発でも、いろいろ悩み、当然ながら4コア化した場合にどうなるかといったシミュレーションも行っています。

 では4コア化すると何が必要か。まず十分な量のキャッシュが必要です。45nmプロセスのOMAP4では、L2キャッシュとして1MB搭載しています。これが28nmプロセスでは倍ぐらいを搭載できます。ではキャッシュが倍になった28nmなら4コアでも大丈夫かというと、コアあたりで同じようにキャッシュにアクセスしにいくので、アプリケーションによってはキャッシュミスが多発し、2コアと比較しても性能が落ちる場合があります。ベンチマークでもそうしたいくつかの例が出てきました。

 そこから逆算し、4コアとして生きるキャッシュの容量を計算すると、4MBが必要となりました。ところが、今発表されている4コア製品で4MBのL2キャッシュを搭載している製品はありません。ということで、キャッシュがまずボトルネックになるでしょう、という点があります。

 次は、内部のバスです。バスへ4つのコアがフルにアクセスします。さらにキャッシュミスが多発すれば内部バスへのアクセス数はさらに増えます。4コアではバスのバンド幅も問題で、バスの幅を広げないといけません。

 さらにメモリのバンド幅も十分にないと、性能のボトルネックになります。例えばOMAP4460は、32ビット幅×2プレーン、6.4GB/秒、OMAP5430では8.5GB/秒で動作します。ビデオ撮影はファインダーにも出力しますので、メモリのバンド幅が要求されるケースの一例です。


OMAPは内部のバス、バンド幅などを最適化し、バランスの良いプラットフォームとする

 

 一方、仮に28nmプロセスでCortex A15を4コアで搭載し、キャッシュを4MB以上と十分に搭載すると、非常に大きなサイズになり、しかも価格も高くなります。

 我々は、OMAPを次の製品に移行させる際、パフォーマンスは上げても、価格はあまり上げない、同じ処理内容ならより消費電力を下げる、そういう方針でずっと進化させてきたのです。4コアというキャッチフレーズよりも、エンドユーザーにとっての使いやすさを選択しています。

 携帯電話はトレードオフの世界です。消費電力をとるかパフォーマンスをとるか、多機能・クイックなレスポンスへチューニングするか早期市場投入と低コストを目指すかなど、さまざまです。パソコンの市場では某社から8コアのCPUも登場し、競合他社と比較して高い動作クロックで、倍のコア、倍のスレッドになっているのですが、ベンチマークで上回ったのは僅かな項目でしかなかったという例があります。前述のように、キャッシュミスやバスの競合、バンド幅などの問題次第では、コアの数を増やしても必ずしも性能が向上するわけではないという点は重要だと思います。

 パソコンの世界で経験できますが、仮に4コア8スレッドの「Core i7」を使っても、投資に見合ったパフォーマンスが出ない場面は多々あります。例えば動画変換で4タスクを走らせて変換するのであれば、性能は発揮されるでしょう。グラフィックスの画面分割処理などで、マルチコアを前提にプログラムが書かれたゲームなどでもそうでしょう。しかし、ほとんどのアプリケーション、OSは、平均して2コアぐらいしか使っていないのです。たとえパソコンでも、です。

 マルチコア対応があまりできていなかったAndroidではなおさらです。例えばAndroidのWebブラウジングでは、解析してみると、3つめ、4つめのスレッド(コア)はあまり使われていません。実はTIではシングルコアからデュアルコアに移行した際、本当に効果があるのか心配していましたが、2コアまではパフォーマンス向上に寄与することがシミュレーションでは分かっていました。改めて今のブラウザで解析してみると、3コア、4コア目に負荷がかかる機会は稀で、2コアで代替できるレベルです。逆に、多くのコアが動作している分、余分に電力を消費していることになります。

 GoogleではAndroid 4.1からマルチコア化を進める方針と聞いていますが、一度に状況が変わるわけではありません。未だにパソコンの世界でも4コア8スレッドをフルに使い切るケースは少なく、CPUロードのグラフなどでも平均して2スレッドぐらいという状況です。

 メーカーによってはコアごとに動作を制御し、余計な電力を消費しない仕組みを取り入れていますが、これまで説明した内容を考えると、それなら最初からそのコアはいらないのでは? となります。コアが待機中の電力消費も無視できませんから。

 YouTubeには、OMAP5のエンジニアリングサンプルの動作の様子をアップしています。最初のサンプルなので800MHzでしか動作していませんが、ブラウザで次々にWebサイトをロードして、某社とどちらが早く表示を終えられるかという比較動画です。OMAP5は800MHz駆動、もう一方は某社のクアッドコア、CPUはCortex A9で1.5GHz駆動です。この動画では、OMAP5は規定のWebサイトを95秒で終えましたが、もう一方は201秒でした。つまり、A15の性能があれば2コアで十分なんですね。

宮崎氏
 この比較では、Webブラウジングだけではなく、裏でファイルをロードしたり再生したりといった動作も行っています。

田渕氏
 グラフィック性能を比較した動画では、市場でもっともシェアの高いタブレット型端末を対象に、ベンチマークで平均のフレームレートを比較しています。OMAP5はこのシェアの高いタブレットより勝る結果になっています。ただ、こうした性能でも、携帯電話に搭載できるよう内部は最適化されているのもポイントです。

――クアッドコアといったカタログ表記のスペックだけではなく、実際に触ってみるのも重要ということですね。

宮崎氏
 この夏~秋にかけて、クアッドコアの製品が市場に出てきて、どういう反応になるのか、我々も楽しみですね。

――本日はどうもありがとうございました。

 




(編集部)

2012/7/23 10:00