-
-
【python】正規性の検定(コルモゴロフ・スミルノフ検定)
2023/8/15
「正規性の検定(コルモゴロフ・スミルノフ検定)」についてわかりやすく解説します。正規分布を前提とする統計的手法が数多くあるため、得られたデータが「正規分布に従うかどうか」を適切に把握し、データ分析の信頼性を高めましょう!
-
-
【python】正規確率プロット(正規QQプロット)の作成方法
2023/8/14
「正規確率プロット(正規QQプロット)の作成方法」についてわかりやすく解説します。正規確率プロットの作成方法と様々な分布の正規確率プロットの特徴を理解し、データ分析の信頼性を高めましょう!
-
-
【python】大量のcsvファイルをpickleに保存して高速化
2023/8/5
Pythonを使って大量のCSVファイルを一度に読み込み、pickleファイルに保存して高速化する方法を解説します。これにより、次回からのデータの取り扱いが迅速になり、データの前処理時間を大幅に削減することができます。
-
-
【python】単変量の外れ値除去:3つの手法を比較
2023/7/30
「pythonを用いた単変量の外れ値除去」についてわかりやすく解説します。外れ値を除去する3つの手法について、比較しながらそれぞれの特徴について詳しく解説します。
-
-
【python】プロセスデータ の平滑化(savgol_filter)
2023/7/27
「プロセスデータの平滑化(savgol_filter)」についてわかりやすく解説します。本記事では、Savitzky-Golay法という平滑化手法を紹介し、最適な平滑化パラメータの決定方法について具体的に解説していきます。
-
-
【python】プロセスデータの特徴量エンジニアリング
2023/7/25
「プロセスデータの特徴量エンジニアリング」についてわかりやすく解説します。pythonを使ってプロセスデータに特有の特徴量を作り出す手段として、時間遅れ変数(ラグ特徴量)、二乗項、交差項の作成方法を紹介します。
-
-
【SHAP】プロセスデータにおける機械学習の解釈
2023/7/23
「機械学習を解釈する技術」という本で紹介されているPFI、PD、ICE、SHAPといった機械学習の解釈手法を、化学プラントのプロセスデータを題材に解説します。「予測精度」と「解釈性」のトレードオフから解放されましょう!
-
-
【python】ヒストグラムの作成方法(スタージェスの公式)
2023/8/11
「【python】ヒストグラムの作成方法(スタージェスの公式)」についてわかりやすく解説します。スタージェスの公式やその他の手法を用いて「ビン数」を適切に設定し、正しくデータ分布を確認する手法を解説します。
-
-
【python】pandasによるプロセスデータの抽出方法
2023/7/22
「pandasによるプロセスデータの抽出方法」についてわかりやすく解説します。特徴量(列)を指定して抽出したり、期間(行)を指定して抽出する方法を詳しく解説します。pandasを使った効率的なデータの取り扱いについて学びましょう!
-
-
【Python】化学プロセスのサンプルデータ入手方法
2023/7/22
化学プロセスのサンプルデータ入手方法について解説します。化学プロセスのような時系列データのサンプルはなかなか見つからないため、入手方法をまとめてみました。データの前処理やモデル構築の検証に役立ててください。