- 概要: 入力データの構造上の問題点(例:欠損値、整形不備、形式のばらつきなど)を特定する。
- 入力: CSVファイルのパス
- 出力: 問題点
- 概要: 検出された問題に基づき、それを解決するためのPythonコードを生成する。
- 入力: 問題点
- 出力: Pythonコード
- 概要: 生成されたPythonコードを実行し、CSVデータを整形する。
- 入力: Pythonコード
- 出力: 実行結果
- 概要: 整形後のデータに問題が残っていないかを評価し、改善が必要な場合には再度ループを回す。
- 入力: 実行結果
- 出力: 評価結果
-
リポジトリをクローン:
git clone [ repository-url ] cd IR -
依存関係をインストール:
pip install -r requirements.txt
-
.env.example を .env にコピーし、必要な環境変数を設定:
cp .env.example .env
-
解析したいcsvファイルを input/sample ディレクトリに配置
-
プログラムを実行:
python main.py
-
csvファイルが整形されて保存されます