こんにちは。
2022年度秋学期ラーニングサポート金曜日担当の南です。
今回は私の自己紹介をさせていただきます!
プロフィール
- 学年:修士1年
- 学科:物理情報工学科
- 研究室:堀豊研究室
- 研究内容:強化学習を用いた制御機設計法の改良
- 趣味:手芸、散歩
研究内容
制御工学
制御工学とは、機械などのシステムを良い感じに動かしたりコントロールするための学門です。”良い感じ”を具体的に説明すると、機械がおかしい挙動にならない様に安全に動かしたり、小さなコストで動かしたり、外からの影響に強かったり……といったことを意味します。
制御理論は様々な場所で使われていて、自動車やプリンターといった身近な機械から、ロケット、送電システムといった大規模な対象にまで利用されています。制御なしでは現代の暮らしは崩壊してしまいますね。
強化学習
強化学習とは試行錯誤を通じてより良い方法を見つける学習方法のことです。一時期、AlphaGoという囲碁プログラムがプロ棋士を負かしたことが話題になっていました。強化学習はこのプログラムの学習に使用されています。
これまではゲームに勝つプログラムの作成などで利用されていた強化学習ですが、最近は車の効率的な配車や広告の最適化など、より広い領域での使用に注目が集まっています。
強化学習の制御工学への応用
強化学習を制御工学へ用いる、つまり制御器の設計に強化学習を使用することに注目が集まっています。この方法のメリットは、制御対象(機械やロボット等)の数理モデル(運動方程式など、現象を数式で書き表したもの。)が分からなくても使用できるということです。多くの制御機設計法は制御対象の数理モデルを用いるので、これは大きなメリットです。
しかし、強化学習を制御機設計に用いることには課題が存在します。それは、学習の途中に制御したい対象が摩耗してしまうことです。強化学習は試行錯誤を通じてよい方法を見つけます。これは、学習対象がゲームなどの、コンピュータ上のデータの場合、比較的大きな問題になりません(時間がかかる等のデメリット自体はあり、問題になることはあります)。しかし、実際の機械が学習対象の場合、何回も何回も機械を動かす必要が出てきてしまいます。この試行の中には機械に無茶をさせてしまうことも多いでしょう。「この無茶の回数を減らす=摩耗を減らした学習方法を作ろう」ということが私の研究テーマになっています。
ちなみに、私の所属する研究室では、「生体分子システムを制御しよう」という研究をしている方が多いので、こちらについても少しご紹介します。
生体分子システム
生体分子システムとは、バクテリアなどの微生物やDNAなどの生体分子を用いて作られた、化学反応で駆動するシステムのことです。このシステムを人工的に設計し、行いたい反応(特定のたんぱく質を合成したい等)を実現する人工遺伝子回路の設計に注目が集まっています。このようなシステムを構築し、発展させることで、がんの治療や分子ロボットの作成に役立てることができるのではないかと期待されています。
この人工システムを使用するためには、回路内で起こる化学反応を設計し、制御する必要があります。しかし、この分野はまだまだ発展途中の段階であるため、ほしい回路をすぐに作って使用することはできません。そのため、私の所属する研究室では、適切なデバイス作りや数理モデルの構築の、遺伝子回路の解析や設計の研究が行われています。
最後に
ラーニングサポートには色々な専門の方がいらっしゃいます。皆さん是非に足を運んでみてください!