読者です 読者をやめる 読者になる 読者になる

simplestarの技術ブログ

目的を書いて、思想と試行、結果と考察、そして具体的な手段を記録します。

3目ならべ(〇×ゲーム)で最強のAIを作る

AI

表題の通り、今回は3目ならべで最強のAIを作りました。 最も勝利確率の高いマスを赤く示してくれるツールとなっています。具体的にどうしたかというと 前回作った強化学習のコードの一部を次の通り、変更してみました。 変更の意図としてはBellman方程式のMo…

3目ならべで強化学習すると、どうなる?→こうなる

AI

前回の記事ははじめての強化学習ということで、Bellman方程式を使ってきわめて単純な経路分岐問題を解いてみました。 今回はもう少し複雑な経路問題を解いてみたいと思います。お題は「3目ならべ」です。先攻後攻が決まったら、まずは 3x3 のマス目の 9つの…

とっても簡単!強化学習の実践

AI

強化学習とは? それは、行動の結果得られる報酬が最も大きくなる行動を選択する仕組みにおいて その報酬を計算して求めることです。例えば「働けばお金がもらえる」という場合は「お金」が報酬となります。 報酬の設定のしかたは問題によって、また設定する…

強化学習の Value Iteration と Q-Learning の違い

AI

強化学習には Value Iteration と Q-Learning の2通りの学習方法が存在します。Value Iteration で登場する Model が既知か、未知かを見て 未知の場合は、試行錯誤を繰り返す Q-Learning しか選べません。Value Iteration にて登場する報酬は人間のさじ加減…

エピソード(思い出)を記録し、呼び起こす強化学習

AI

強化学習について(私が知識を増やすために)学んでいますが、Value Iteration と Q-Learning の違いを書く前に(この後書こうと思っています。) 一つ昔に高校時代の友人から教えてもらった、エピソードに紐づく知識というものとの組み合わせを思いつきまし…

AI的な調べもの

AI

最近、社内の勉強会でその存在を再確認したのですが、みなさんは OpenAI をご存知ですか?OpenAI は組織名のようです。 コンテンツは Gym にあるとのことです。OpenAI Gymは、強化学習を開発、評価するための プラットフォームです。 色々な環境が用意されて…

ナイーブベイズとは

AI

基本から確かめてみたくなったので もう一度ナイーブベイズについて確認します。確率の加法定理と乗法定理の式を使うと、ベイズの定理が導けます。確率の加法定理とは、ベン図を使うと次のイメージです。 確率の乗法定理とは、ベン図を使うと次のイメージで…

人工知能:歴史から学んでみる 3

AI

1950年代から、1990年代前半くらいまで見てきました。 その後の人工知能研究で注目されるようになった手法というものを見ていきたいと思います。【決定ツリー(決定木)】 これだけだと、ただの木構造のグラフになってしまいますが、ここではID3 - Wikipedia…

人工知能:歴史から学んでみる 2

AI

1980年ころの人工知能の研究を見ていく前回までのおさらい 人工知能の研究の成果がマイクロワールド(限定された世界)から外に出ようとして 組み合わせ爆発を起こし計算が終わらず、知識の記述も終わらず、研究中だったのに 世間の人工知能に対する熱が冷め…

人工知能:歴史から学んでみる

AI

なぜ人工知能(AI)について調べているのか? ここまでの経緯(いきさつ)を紹介します。最初は音声認識を使って、マイク入力をテキストに起こすところからスタートします。 simplestar-tech.hatenablog.com 起こしたテキストをコンピュータにしゃべってもら…

人工知能:これまでのアプローチを調べてみた

AI

何か新しいことをするには過去の業績を調べようということで、前回 simplestar-tech.hatenablog.com の中盤から、AIの歴史について学び始めましたよく引き合いに出る、チェスのAIについてその原理を調べてみましょう。 オセロの方が簡単だったかもしれません…

人工知能:単語から経験に基づくエピソードが思い起こされる

AI

最近、人工知能ネタばかり書いていますが そのことを物理に詳しい高校の友人に聞いてみたところ (人に聞いてばっかりですみません)単語から、それにまつわるエピソードが思い起こされるから その後の心配とかするわけですよと言われました。なるほど、単語…

人工知能:エディタの作成 その1

筆者はUnityに詳しいので、人工知能エディタをUnityで実装してみたいと思います。 ある単語は何に属するのかこれを設定し易いエディタというものを考えていきましょう。たとえば、ソクラテスという単語があったとして ソクラテスが属しているカテゴリを考え…

人工知能:学習と整理

AI

前回の記事で、演繹的思考とは何か、どうプログラムを組むと演繹的な思考、推論を構築できるかを書きました。(参考文献なしで、自分なりに…)simplestar-tech.hatenablog.comそこで、まだ説明していない部分があったので補足すると 作成したプログラムは学…

Unity:3層ニューラルネットワークプログラム

AI

人工知能とか機械学習とかを勉強していきたいと思います。 3層ニューラルネットワークをご存知でしょうか?まずは解説されている書籍を読んでみます。 「ディジタル画像処理」のニューラルネットワークの説明を参考にしました。 書籍リンク:CG-ARTS協会 | …