動的計画法（プログラム例）

　　動的計画法は，システムを複数の状態で表現し，初期状態から目標状態まで遷移させていき，その過程を通して最大値（最小値）を求めようとするものです．上図に示すように，ステップ (k+1) の状態 j におけるコストは，ステップ k の各状態におけるコスト（ステップ k に至るまでのコストの和）に，その状態からステップ (k+1) の状態 j に遷移（全ての状態から遷移できるとは限らない）するためにかかるコストを加えたものの内最小（最大）のものになります．これを，初期状態から目標状態まで繰り返せば解が得られます．ステップ (k+1) におけるコストは，ステップ k のコストだけで決まるため，最小（最大）を求めることだけが目的であれば，前後する 2 つのステップにおける状態だけを記憶しておけば良いことになります．

１．資源配分問題（0-1 ナップザック問題）ー投資先（品物）毎のデータを出力したい場合ー

　　資源配分問題は，n_toshi 種類の投資先に，max_t 単位の資金を配分し（資金は単位でしか配分できない），利益を最大にしようとするものです．このプログラム例では，以下に示すように（コメント部分は除く），n_toshi，及び，max_t の値と，各投資先に 1 から max_t 単位の資金を投資した場合に得られる利益を入力すれば結果を得ることができます．

n_toshi max_t
p_1,1 p_1,2 ･･･ p_{1,max_t}   // 1 番目の投資先によって得られる利益
p_2,1 p_2,2 ･･･ p_{2,max_t}   // 2 番目の投資先によって得られる利益
　　・・・
p_{n_toshi,1} p_{n_toshi,2} ･･･ p_{n_toshi,max_t}

具体的には，例えば，投資先が 3，資金が 4 の場合，以下のようになります（コメント部分は除く）．

3 4
8 18 22 24   // 1 番目の投資先に 1 単位投資するとその利益は 8，2 単位投資するとその利益は 18，・・・
3 6 9 12   // 2 番目の投資先に 1 単位投資するとその利益は 3，2 単位投資するとその利益は 6，・・・
6 7 8 10   // ・・・

　　資源配分問題においては，投資資金が状態になります（ 0 の場合も含めるため，状態数は (max_t+1) 個）．プログラムの table[i][j] には，ステップ (i+1) において j 単位の資金を投資した場合の利益が記憶されます．また，各投資先に対する投資額も知りたい場合には，table[i-1][k] から table[i][j] に遷移するする際，どの状態（ k の値）から遷移する際に table[i][j] が最大になるかを記憶しておく必要があります．これを行うのが，変数 prev です．

　　0-1 ナップザック問題も，データを適切に記述すれば，同じプログラムで解くことが可能です．0-1 ナップザック問題では，n_toshi 種類の品物からいくつか選んでナップザックに入れるものとします．各品物を入れることによって，その品物固有の効用が得られます．ただし，ナップザックに入れることができる最大重量は max_t であり，この条件のもとで効用が最大になるように入れる品物を選ぶことになります．例えば，品物の数が 4，最大重量が 6 の場合，以下に示すような入力データになります（コメント部分は除く）．なお，0-1 ナップザック問題においては，ナップザック内に入っている品物の重量が状態になります．

4 6
2 0 0 0 0 0   // 1 番目の品物の重さは 1 で，その効用は 2
0 0 5 0 0 0   // 2 番目の品物の重さは 3 で，その効用は 5
0 0 4 0 0 0   // 3 番目の品物の重さは 3 で，その効用は 4
0 0 3 0 0 0   // 4 番目の品物の重さは 3 で，その効用は 3

/***************************************************/
/* 動的計画法：資源配分問題（0-1 ナップザック問題）*/
/* ー投資先（品物）毎のデータを出力したい場合ー    */
/*      coded by Y.Suganuma                        */
/***************************************************/
import java.io.*;
import java.util.*;

public class Test {
	public static void main(String args[]) throws IOException
	{
				// データの入力と領域の確保
		Scanner sc = new Scanner(System.in);
		int n_toshi = sc.nextInt();   // 投資先数（品物数）
		int max_t   = sc.nextInt();   // 最大投資額（最大重量）
		max_t++;   // 投資を行わない（品物を入れない）場合を含めるため
		int table[][] = new int [n_toshi][max_t];   // 投資額と利益（重さと効用）
		int rieki[][] = new int [n_toshi][max_t];   // 投資した際の利益（品物を入れた際の効用）
		int prev[][]  = new int [n_toshi][max_t];   // 前段までの投資額（前段までの重さ）
		for (int i1 = 0; i1 < n_toshi; i1++) {
			table[i1][0] = 0;
			for (int i2 = 1; i2 < max_t; i2++)
				table[i1][i2] = sc.nextInt();
		}
				// 動的計画法
						// 初期設定（1段目）
		for (int i1 = 0; i1 < max_t; i1++) {
			rieki[0][i1] = table[0][i1];
			prev[0][i1]  = -1;
		}
						// 2段目以降
		for (int i1 = 1; i1 < n_toshi; i1++) {
			for (int i2 = 0; i2 < max_t; i2++) {
				rieki[i1][i2] = rieki[i1-1][i2];
				prev[i1][i2]  = prev[i1-1][i2];
			}
			for (int i2 = 0; i2 < max_t; i2++) {
				for (int i3 = 0; i2+i3 < max_t; i3++) {
 	 				if (rieki[i1-1][i3]+table[i1][i2] > rieki[i1][i2+i3]) {
						rieki[i1][i2+i3] = rieki[i1-1][i3]+table[i1][i2];
						prev[i1][i2+i3]  = i3;
					}
				}
			}
		}
				// 結果の出力
		int k = -1, max = -1;
		for (int i1 = 0; i1 < max_t ; i1++) {
			if (rieki[n_toshi-1][i1] > max) {
				max = rieki[n_toshi-1][i1];
				k   = i1;
			}
		}
		System.out.printf("最大利益（最大効用） %d\n", max);

		for (int i1 = n_toshi-1; i1 > 0; i1--) {
			int k1 = 0;
			if (rieki[i1][k] != rieki[i1-1][k]) {
				k1 = k - prev[i1][k];
				k  = prev[i1][k];
			}
			System.out.printf("   投資先（品物） %d 投資単位（重さ） %d 利益（効用） %d\n", 
			                  i1+1, k1, table[i1][k1]);
		}
		System.out.printf("   投資先（品物） 1 投資単位（重さ） %d 利益（効用） %d\n", 
		                  k, table[0][k]);
	}
}

２．資源配分問題（0-1 ナップザック問題）ー投資先（品物）毎のデータを必要としない場合ー

　　資源配分問題（0-1 ナップザック問題）において，最大利益（最大効用）だけを知りたい場合には，table[i-1][k] から table[i][j] に遷移するする際，どの状態（ k の値）から遷移する際に table[i][j] が最大になるかを記憶する必要がありませんので，変数 prev は不必要です．また，前後 2 つのステップにおける状態だけを記憶しておけば良いので，変数 rieki の配列サイズを小さくすることができます．

/***************************************************/
/* 動的計画法：資源配分問題（0-1 ナップザック問題）*/
/* ー投資先（品物）毎のデータを必要としない場合ー  */
/*      coded by Y.Suganuma                        */
/***************************************************/
import java.io.*;
import java.util.*;

public class Test {
	public static void main(String args[]) throws IOException
	{
				// データの入力と領域の確保
		Scanner sc = new Scanner(System.in);
		int n_toshi = sc.nextInt();   // 投資先数（品物数）
		int max_t   = sc.nextInt();   // 最大投資額（最大重量）
		max_t++;   // 投資を行わない（品物を入れない）場合を含めるため
		int table[][] = new int [n_toshi][max_t];   // 投資額と利益（重さと効用）
		int rieki[][] = new int [2][max_t];   // 投資した際の利益（品物を入れた際の効用）
		for (int i1 = 0; i1 < n_toshi; i1++) {
			table[i1][0] = 0;
			for (int i2 = 1; i2 < max_t; i2++)
				table[i1][i2] = sc.nextInt();
		}
				// 動的計画法
						// 初期設定（1段目）
		int k1 = 0, k2 = 1;
		for (int i1 = 0; i1 < max_t; i1++)
			rieki[0][i1] = table[0][i1];
						// 2段目以降
		for (int i1 = 1; i1 < n_toshi; i1++) {
			for (int i2 = 0; i2 < max_t; i2++)
				rieki[k2][i2] = rieki[k1][i2];
			for (int i2 = 0; i2 < max_t; i2++) {
				for (int i3 = 0; i2+i3 < max_t; i3++) {
					if (rieki[k1][i3]+table[i1][i2] > rieki[k2][i2+i3])
						rieki[k2][i2+i3] = rieki[k1][i3]+table[i1][i2];
				}
			}
			k1++;
			k1 %= 2;
			k2++;
			k2 %= 2;
		}
				// 結果の出力
		int max = -1;
		for (int i1 = 0; i1 < max_t ; i1++) {
			if (rieki[k1][i1] > max)
				max = rieki[k1][i1];
		}
		System.out.printf("最大利益（最大効用） %d\n", max);
	}
}

３．0-1 ナップザック問題ー品物毎のデータを出力したい場合ー

　　0-1 ナップザック問題を資源配分問題に対するプログラムで解く場合，上の例で示したように，入力データとして余分な 0 を記述する必要があります．しかし，一般的には，以下に示すように，品物の数 N，ナップザックに入れることができる最大重量 W，及び，各品物の重さ w_i とその効用 v_i を入力するだけで十分です（コメント部分は除く）．

N W
w₁ v₁   // 1 番目の品物の重さとそれを入れた場合の効用
w₂ v₂   // 2 番目の品物の重さとそれを入れた場合の効用
　　・・・
w_N v_N

例えば，先に挙げた例の場合，以下のようになります．

/***************************************/
/* 動的計画法（0-1ナップザック問題）   */
/* ー品物毎のデータを出力したい場合ー  */
/*      coded by Y.Suganuma            */
/***************************************/
import java.io.*;
import java.util.*;

public class Test {
	public static void main(String args[]) throws IOException
	{
				// データの入力と領域の確保
		Scanner sc = new Scanner(System.in);
		int N = sc.nextInt();   // 品物の数
		int W = sc.nextInt();   // 重さの上限
		int w[] = new int [N];   // 各品物の重さ
		int v[] = new int [N];   // 各品物の効用
		for (int i1 = 0; i1 < N; i1++) {
			w[i1] = sc.nextInt();
			v[i1] = sc.nextInt();
		}
				// 動的計画法
						// 初期設定（1段目）
		int prev[][] = new int [N][W+1];   // 前段までの品物の重さ
		int dp[][]   = new int [N][W+1];   // ナップザック内の品物の重さ
		for (int i1 = 0; i1 <= W; i1++)
			dp[0][i1] = -1;
		if (w[0] <= W)
			dp[0][w[0]] = v[0];
		for (int i1 = 0; i1 <= W; i1++)
			prev[0][i1] = -1;
						// 2段目以降
		for (int i1 = 1; i1 < N; i1++) {
			for (int wt = 0; wt <= W; wt++) {
				dp[i1][wt]   = dp[i1-1][wt];
				prev[i1][wt] = prev[i1-1][wt];
			}
					// 最初の品物である場合
			if (w[i1] <= W && dp[i1][w[i1]] < v[i1]) {
				dp[i1][w[i1]]   = v[i1];
				prev[i1][w[i1]] = 0;
			}
					// 過去に品物が入っている場合
			for (int wt = 1; wt <= W; wt++) {
				if (dp[i1-1][wt] > 0 && wt+w[i1] <= W) {
					if (dp[i1-1][wt]+v[i1] > dp[i1][wt+w[i1]]) {
						dp[i1][wt+w[i1]]   = dp[i1-1][wt] + v[i1];
						prev[i1][wt+w[i1]] = wt;
					}
				}
			}
		}
				// 結果の出力
		int k = -1, ans = -1;
		for (int i1 = 0; i1 <= W; i1++) {
			if (dp[N-1][i1] > ans) {
				ans = dp[N-1][i1];
				k   = i1;
			}
		}
		System.out.printf("最大効用　%d\n", ans);

		for (int i1 = N-1; i1 > 0; i1--) {
			int k1 = 0;
			if (dp[i1][k] != dp[i1-1][k]) {
				k1 = k - prev[i1][k];
				k  = prev[i1][k];
			}
			int vv = (k1 <= 0) ? 0 : v[i1];
			System.out.printf("   品物 %d 重さ %d 効用 %d\n", i1+1, k1, vv);
		}
		int vv = (k <= 0) ? 0 : v[0];
		System.out.printf("   品物 1 重さ %d 効用 %d\n", k, vv);
	}
}

４．0-1 ナップザック問題ー品物毎のデータを必要としない場合ー

　　資源配分問題と同様，最大効用だけを知りたい場合には，プログラムはより簡単になります．

/*****************************************/
/* 動的計画法（0-1ナップザック問題）     */
/* ー品物毎のデータを必要としない場合ー  */
/*      coded by Y.Suganuma              */
/*****************************************/
import java.io.*;
import java.util.*;

public class Test {
	public static void main(String args[]) throws IOException
	{
				// データの入力と領域の確保
		Scanner sc = new Scanner(System.in);
		int N = sc.nextInt();   // 品物の数
		int W = sc.nextInt();   // 重さの上限
		int w[] = new int [N];   // 各品物の重さ
		int v[] = new int [N];   // 各品物の効用
		for (int i1 = 0; i1 < N; i1++) {
			w[i1] = sc.nextInt();
			v[i1] = sc.nextInt();
		}
				// 動的計画法
						// 初期設定（1段目）
		int dp[][]   = new int [2][W+1];   // ナップザック内の品物の重さ
		for (int i1 = 0; i1 <= W; i1++)
			dp[0][i1] = -1;
		if (w[0] <= W)
			dp[0][w[0]] = v[0];
		int k1 = 0, k2 = 1;
						// 2段目以降
		for (int i1 = 1; i1 < N; i1++) {
			for (int wt = 0; wt <= W; wt++)
				dp[k2][wt] = dp[k1][wt];
					// 最初の品物である場合
			if (w[i1] <= W && dp[k2][w[i1]] < v[i1])
				dp[k2][w[i1]] = v[i1];
					// 過去に品物が入っている場合
			for (int wt = 1; wt <= W; wt++) {
				if (dp[k1][wt] > 0 && wt+w[i1] <= W) {
					if (dp[k1][wt]+v[i1] > dp[k2][wt+w[i1]])
						dp[k2][wt+w[i1]] = dp[k1][wt] + v[i1];
				}
			}
			k1++;
			k1 %= 2;
			k2++;
			k2 %= 2;
		}
				// 結果の出力
		int ans = 0;
		for (int i1 = 0; i1 <= W; i1++) {
			if (dp[k1][i1] > ans)
				ans = dp[k1][i1];
		}
		System.out.printf("最大効用　%d\n", ans);
	}
}

５．グラフにおける最短距離問題ー経路を出力したい場合ー

　　ここでは，グラフにおける最短経路問題を扱います．初期ノードから目標ノードに至る最短経路を求める問題です．最短経路問題において，状態はノードとなりますので，状態の数はノードの数となります．例えば，上図に示すグラフにおいては，状態の数は 7 となり，ノード 0 からノード 6 に至る最短経路を求めることになります．また，上図における枝上に記述された数字はノード間の距離を示しており，最短経路は赤で示した経路になります．このプログラムに対しては，以下に示すようなデータを入力します（コメント部分は除く）．

N M   // ノードの数，接続データの数（接続データが無いノード間は移動できない）
n_i n_j r_ij   // ノード n_i と ノード n_j 間の距離は r_ij
　　・・・

例えば，上に示した図に対する入力データは以下のようになります．

/*******************************************/
/* 動的計画法（グラフにおける最短距離問題）*/
/* ー経路を出力したい場合ー                */
/*      coded by Y.Suganuma                */
/*******************************************/
import java.io.*;
import java.util.*;

public class Test {
	public static void main(String args[]) throws IOException
	{
				// データの入力と領域の確保
		Scanner sc = new Scanner(System.in);
		int N = sc.nextInt();   // ノードの数
		int M = sc.nextInt();   // 接続状況データ数
		int r[][] = new int [N][N];   // ノード間の距離
		for (int i1 = 0; i1 < N; i1++) {
			for (int i2 = 0; i2 < N; i2++)
				r[i1][i2] = 0;
		}
		for (int i1 = 0; i1 < M; i1++) {
			int k1 = sc.nextInt();
			int k2 = sc.nextInt();
			r[k1][k2] = sc.nextInt();
		}
		for (int i1 = 0; i1 < N-1; i1++) {
			for (int i2 = i1+1; i2 < N; i2++)
				r[i2][i1] = r[i1][i2];
		}
				// 動的計画法
						// 初期設定（1段目）
		int prev[][] = new int [N][N];   // 前のノード
		int dp[][]   = new int [N][N];   // ノードへ達するまでの距離
		for (int i1 = 0; i1 < N; i1++) {
			for (int i2 = 0; i2 < N; i2++) {
				prev[i1][i2] = -1;
				dp[i1][i2]   = -1;
			}
		}
		dp[0][0] = 0;
						// 2段目以降
		int n = 0, sw = 1;
		while(sw > 0) {
			sw = 0;
			for (int i1 = 0; i1 < N; i1++) {
				dp[n+1][i1]   = dp[n][i1];
				prev[n+1][i1] = prev[n][i1];
			}
			for (int i1 = 0; i1 < N; i1++) {
				for (int i2 = 0; i2 < N; i2++) {
					if (dp[n][i1] >= 0 && r[i1][i2] > 0) {
						if (dp[n+1][i2] < 0 || (dp[n][i1]+r[i1][i2] < dp[n+1][i2])) {
							dp[n+1][i2]   = dp[n][i1] + r[i1][i2];
							prev[n+1][i2] = i1;
							sw            = 1;
						}
					}
				}
			}
			if (sw > 0)
				n++;
		}
				// 結果の出力
		System.out.printf("最短距離　%d\n", dp[n][N-1]);

		int k = N - 1;
		System.out.printf("   ノード番号 %d\n", k);
		while (n > 0) {
			System.out.printf("   ノード番号 %d\n", prev[n][k]);
			k = prev[n][k];
			n--;
		}
	}
}

６．グラフにおける最短距離問題ー経路を出力する必要が無い場合ー

　　上のプログラムでは最短経路も出力されますが，このプログラムでは，最短経路長だけが出力されます．

/*******************************************/
/* 動的計画法（グラフにおける最短距離問題）*/
/* ー経路を出力する必要が無い場合ー        */
/*      coded by Y.Suganuma                */
/*******************************************/
import java.io.*;
import java.util.*;

public class Test {
	public static void main(String args[]) throws IOException
	{
				// データの入力と領域の確保
		Scanner sc = new Scanner(System.in);
		int N = sc.nextInt();   // ノードの数
		int M = sc.nextInt();   // 接続状況データ数
		int r[][] = new int [N][N];   // ノード間の距離
		for (int i1 = 0; i1 < N; i1++) {
			for (int i2 = 0; i2 < N; i2++)
				r[i1][i2] = 0;
		}
		for (int i1 = 0; i1 < M; i1++) {
			int k1 = sc.nextInt();
			int k2 = sc.nextInt();
			r[k1][k2] = sc.nextInt();
		}
		for (int i1 = 0; i1 < N-1; i1++) {
			for (int i2 = i1+1; i2 < N; i2++)
				r[i2][i1] = r[i1][i2];
		}
				// 動的計画法
						// 初期設定（1段目）
		int dp[][]   = new int [2][N];   // ノードへ達するまでの距離
		for (int i1 = 0; i1 < 2; i1++) {
			for (int i2 = 0; i2 < N; i2++)
				dp[i1][i2] = -1;
		}
		dp[0][0] = 0;
						// 2段目以降
		int sw = 1, k1 = 0, k2 = 1;
		while(sw > 0) {
			sw = 0;
			for (int i1 = 0; i1 < N; i1++)
				dp[k2][i1]   = dp[k1][i1];
			for (int i1 = 0; i1 < N; i1++) {
				for (int i2 = 0; i2 < N; i2++) {
					if (dp[k1][i1] >= 0 && r[i1][i2] > 0) {
						if (dp[k2][i2] < 0 || (dp[k1][i1]+r[i1][i2] < dp[k2][i2])) {
							dp[k2][i2] = dp[k1][i1] + r[i1][i2];
							sw         = 1;
						}
					}
				}
			}
			if (sw > 0) {
				k1++;
				k1 %= 2;
				k2++;
				k2 %= 2;
			}
		}
				// 結果の出力
		System.out.printf("最短距離　%d\n", dp[k1][N-1]);
	}
}