python

[sklearn][SHAP][モデル可視化]マーケティングデータを分析してみた

2020/6/24  

概要 データ分析の一連を解説してみます。 はじめに 一通り、データセットがある状態から、 前処理、モデル作成、結果の解釈まで一通りよく行われるデータ分析の流れについて解説していきたいと思います。 使用 ...

[OpenAI][jukebox]最新の音楽自動生成モデルを動かしてみる

2020/6/18  

概要 人工知能研究の非営利団体「OpenAI」が発表した楽曲生成のAI「Jukebox」ついて解説します。 はじめに 人工知能を研究する非営利団体「OpenAI」が、ニューラルネットワークを使って指定 ...

[相関分析]特徴量の設計と確認方法について解説してみる。

2020/6/18  

概要 データの特徴量化のコツについて解説したいと覆います。 はじめに 今回は、2次元以上の表データを想定した時系列データなどから特徴量作成についての説明になります。 1次元のデータの場合は、そのまま各 ...

モデルの評価指標について解説してみる

2020/6/18  

概要 作成した判別モデルの評価について説明します。 はじめに 評価には、以下の指標を用いられます。 Accuracy(正確度) 正例、負例の重要度が同じ場合 Recall(再現性) 検出率の精度を重要 ...

[SHAP][PermutationImportance]モデルの判別結果の解釈

2020/6/18  

概要 モデルの判定結果の説明方法について解説します。 はじめに クライアントビジネスにおいても、モデルの根拠を求められる場合が多いので、その手法をご紹介したいと思います。 どうしてもAIは、入力から出 ...

[optuna]パラメータ探索について解説してみる

2020/6/18  

概要 作成したモデルの精度を上げるためのハイパーパラメータの調整について解説します。 はじめに 作成したモデルの精度を上げるために、モデルのハイパーパラメータの調整を機械的にする作業になります。 パラ ...

[sklearn][SMOTE]データセットの作成方法について解説してみる

2020/6/18  

概要 判定モデルに入力する前のデータ加工作業について解説したいと思います。 はじめに 大まかな流れとしては、 標準化/正規化 ダミー変数化 (アップサンプリング/ダウンサンプリング) データセットの分 ...

[RPA][Webスクレピング]データの収集方法について解説してみる。

2020/6/18  

概要 判別モデルを作成することを前提に、データの収集について説明していきます。 【データの数と精度の図】 データ量 モデル作成にあたり、データの数は多ければ多いほど良いです。 データ量の目安としては、 ...

[PySpark]ビッグデータを分析用にPySparkを使用してみる

2020/6/18  

概要 作成したもの ワインの品質用のデータセットをPySparkで前処理 使用した技術・ライブラリ Pyspark EMR 動機 仕事でTBサイズのCSVファイルを扱うことがあり、前処理でPySpar ...

[PRNet]画像から3Dモデルを生成できる3D Face Reconstructionを試してみる

2020/6/18  

概要 作成したもの PRNetを使って芸能人の顔画像から3Dモデルを作成 使用した技術・ライブラリ Position Map Regression Network 動機 VRchatのアバターをble ...

[tensorflow/AutoEncoder]中国人の視点で日本語を翻訳してみる

2020/6/18  

概要 作成したもの 日本人が雰囲気で中国語を翻訳するAI 挨拶 → 誤:挨拶 訳:拷問 手紙 → 誤:手紙 訳:トイレットペーパー 愛人 → 誤:愛人 訳:奥さん 维生素 → 誤:繊維? 訳:ビタミン ...

Copyright© AIなんて気合いダッ! , 2021 All Rights Reserved Powered by AFFINGER5.