生成AIは膨大なデータを扱うための有用なツールですが、業務で活用するためには、事前にデータをAIが利用できる形式に整える必要があります。このプロセスは手間がかかることが多く、特に企業が保有する様々な形式のデータを整理する作業は負荷がかかります。今回は、その具体的な手順について紹介します。
Step1: データの現状を把握する
たとえば、紙資料をスキャンしてPDFとして保存していたり、エクセルで日々の報告書を作成していたりする場合、これらを生成AIに活用するには、まずデータをAIが読み込めるフォーマットに変換し、再登録する必要があります。この段階で、どのようなデータが存在し、それぞれをどのように仕分けるべきか、またその作業にかかる期間や予算を概算する必要があります。
Step2: データの仕訳ルールを作成する
次に、データを再登録するための仕訳ルールを作成します。たとえば、紙の報告書ではどの部分をデータベースのどの項目に対応させるか、エクセルデータの中でどの項目が重要で、どの形式で保存すべきかなどを決定します。これには、実務に詳しい担当者と、データ処理に精通したスタッフが協力して進める必要があります。
デジタルフォーマットに変換するだけでは意味がありません。プロジェクトの目的を明確にし、その目的を達成するために、どのデータをどのタイミングで、どのように読み込むかを計画しなければなりません。状況に応じて柔軟に変更する必要があり、手間がかかることが多いです。
Step3: データの整理と登録を行う
仕訳ルールが整った後は、実際にデータを整理し、登録する作業が必要です。この作業は可能であれば自動化したいところですが、現実的には多くの場面で手作業が必要です。たとえば、手書きの資料をデジタル化する作業や、異なる形式のエクセルファイルを統一する作業には多くの時間と労力がかかります。また、ここで仕分け方法に不備が見つかった場合にはSTEP2に戻る必要があります。
生成AIを活用するには、このようにデータ整理という工程を経る必要があります。通常業務と並行して進めるには負荷のかかる作業ですが、データ整理は生成AI活用の出発点となります。