表題の通り、今回は3目ならべで最強のAIを作りました。 最も勝利確率の高いマスを赤く示してくれるツールとなっています。具体的にどうしたかというと 前回作った強化学習のコードの一部を次の通り、変更してみました。 変更の意図としてはBellman方程式のMo…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。