使用方法

環境構築

python -m venv venv 
pip install -r requirements.txt

eval.sh スクリプトで使用する環境変数を設定します。あなたのWeights & Biases APIキー、Azure OpenAIエンドポイント、そしてAzure OpenAIキーを以下のようにエクスポートしてください。

export WANDB_API_KEY=<YOUR_WANDB_API>
export AZURE_OPENAI_ENDPOINT=<YOUR_AZURE_OPENAI_ENDPOINT>
export AZURE_OPENAI_KEY=<YOUR_AZURE_OPENAI_KEY>

llm-jpモデルを評価するには、configs/llm-jp-config.yaml ファイル内の以下の項目を変更します。ただし、chat templateを変えて指示チューニングを行った場合適切に設定をする必要があります。

事前訓練済みモデルの指定にはpretrained_model_name_or_pathの変更のみが必要ですが、ロギングのためにrun_nameとbasemodel_nameも変更することが推奨されます。

評価を開始するには、以下のコマンドを実行します。

bash eval.sh

現在、モデルはAzure gpt-4-0613で固定しています。詳細はこのコミットを参照してください。