
【AWS】Rclone × S3 Selectによるデータ取り込み自動化で効率的なデータ活用を実現!~Rclone編~



 今回、事業部の取り組みとしてCSV出力によるエクスポートが可能な社内の電子帳簿保存システムと販売管理システムのデータをAWS基盤に取り込み、一元的に情報を確認できるアプリケーションの開発を行っています。そこで、RPAによってGoogleドライブに日次で出力されるCSVファイルをAmazon Simple Storage Service(Amazon S3、以下「S3」と記載)にコピーし保管したい、保管しているCSVデータをデータベースに取り込みたいという要望がありました。また、Googleドライブ内のCSVを日次でS3に取り込む作業を自動化することで、手動実行の手間を削減したいと思い、定期実行のプログラムの実装を行いました。
 また本記事(Rclone編)は、下記のリンクに記載のS3 Select編との2部構成となっており、外部のストレージサービスに保管されているCSVファイルをS3にコピーし、ファイル内のデータをRDSに反映させるまでの処理と処理の自動化について解説しています。
 S3からRDSへのデータ取り込みについては下記のS3 Select編をご覧ください。

AWS】Rclone × S3 Selectによるデータ取り込み自動化で効率的なデータ活用を実現!~S3 Select編~





  • Windows10
  • WSL(Ubuntu 20.04.6 LTS (GNU/Linux 4.4.0-19041-Microsoft x86_64))
  • Java 17.0.9
  • SpringBoot 3.2.2
  • AWS SDK for Java 2.23.3(S3 Select編で使用)
  • openCSV 5.7.1(S3 Select編で使用)
  • MyBatis 3.0.3(S3 Selectで編使用)







実行環境(今回の場合はAmazon EC2)にログインし以下のコマンドを実行

$ curl https://rclone.org/install.sh | sudo bash


$ rclone config を実行

Current remotes:

Name                 Type
====                 ====
No remotes found, make a new one?
n) New remote
s) Set configuration password
q) Quit config
n/s/q> n    #新しいリモートを設定するためnを選択

Enter name for new remote.
name> s3    #任意の名前を入力

Option Storage.
Type of storage to configure.
Choose a number from below, or type in your own value.
 1 / 1Fichier
   \ (fichier)
 2 / Akamai NetStorage
   \ (netstorage)
 3 / Alias for an existing remote
   \ (alias)
 4 / Amazon Drive
   \ (amazon cloud drive)
 5 / Amazon S3 Compliant Storage Providers including AWS, Alibaba, ArvanCloud, Ceph, ChinaMobile, Cloudflare, DigitalOcean, Dreamhost, GCS, HuaweiOBS, IBMCOS, IDrive, IONOS, 
LyveCloud, Leviia, Liara, Linode, Minio, Netease, Petabox, RackCorp, Rclone, Scaleway, 
SeaweedFS, StackPath, Storj, Synology, TencentCOS, Wasabi, Qiniu and others
Storage> 5    #今回はS3を使用するため5を選択

Option provider.
Choose your S3 provider.
Choose a number from below, or type in your own value.
Press Enter to leave empty.
 1 / Amazon Web Services (AWS) S3
   \ (AWS)
provider> 1    #プロバイダはAWSのため1を選択

Option env_auth.
Get AWS credentials from runtime (environment variables or EC2/ECS meta data if no env 
Only applies if access_key_id and secret_access_key is blank.
Choose a number from below, or type in your own boolean value (true or false).
Press Enter for the default (false).
 1 / Enter AWS credentials in the next step.
   \ (false)
 2 / Get AWS credentials from the environment (env vars or IAM).
   \ (true)
env_auth> 2    #認証情報は入力するため2を選択

Option access_key_id.
AWS Access Key ID.
Leave blank for anonymous access or runtime credentials.
Enter a value. Press Enter to leave empty.
access_key_id> ○○○○○○○○    #AWS IAM セキュリティ情報にあるアクセスキーを入力

Option secret_access_key.
AWS Secret Access Key (password).
Leave blank for anonymous access or runtime credentials.
Enter a value. Press Enter to leave empty.
secret_access_key> ××××××××    #IAMユーザ作成時に表示されるシークレットアクセスキー(作成したタイミングでのみの表示のため要確認)を入力

Option region.
Region to connect to.
Choose a number from below, or type in your own value.      
Press Enter to leave empty.
   / Asia Pacific (Tokyo) Region.
14 | Needs location constraint ap-northeast-1.
   \ (ap-northeast-1)
   / Asia Pacific (Seoul).
15 | Needs location constraint ap-northeast-2.
   \ (ap-northeast-2)
   / Asia Pacific (Osaka-Local).
16 | Needs location constraint ap-northeast-3.
   \ (ap-northeast-3)
region> 14    #今回は東京リージョンを選択

Option endpoint.
Endpoint for S3 API.
Leave blank if using AWS to use the default endpoint for the region.
Enter a value. Press Enter to leave empty.
endpoint>    #デフォルトのS3 APIエンドポイントを使用するため入力しない

Option location_constraint.
Location constraint - must be set to match the Region.
Used when creating buckets only.
Choose a number from below, or type in your own value.
Press Enter to leave empty.
13 / Asia Pacific (Sydney) Region
   \ (ap-southeast-2)
14 / Asia Pacific (Tokyo) Region
   \ (ap-northeast-1)
15 / Asia Pacific (Seoul) Region
   \ (ap-northeast-2)
location_constraint> 14    #今回は東京リージョンを選択

Option acl.
Canned ACL used when creating buckets and storing or copying objects.
This ACL is used for creating objects and if bucket_acl isn't set, for creating buckets too.
For more info visit https://docs.aws.amazon.com/AmazonS3/latest/dev/acl-overview.html#canned-acl
Note that this ACL is applied when server-side copying objects as S3
doesn't copy the ACL from the source but rather writes a fresh one.
If the acl is an empty string then no X-Amz-Acl: header is added and
the default (private) will be used.
Choose a number from below, or type in your own value.
Press Enter to leave empty.
   / Owner gets FULL_CONTROL.
 1 | No one else has access rights (default).
   \ (private)
   / Owner gets FULL_CONTROL.
 2 | The AllUsers group gets READ access.
   \ (public-read)
acl> 1    #ACLはprivateにするため1を選択

Option server_side_encryption.
The server-side encryption algorithm used when storing this object in S3.
Choose a number from below, or type in your own value.
Press Enter to leave empty.
 1 / None
   \ ()
 2 / AES256
   \ (AES256)
 3 / aws:kms
   \ (aws:kms)
server_side_encryption> 1    #サーバーサイドの暗号化は使用しないため1を選択

Option sse_kms_key_id.
If using KMS ID you must provide the ARN of Key.
Choose a number from below, or type in your own value.
Press Enter to leave empty.
 1 / None
   \ ()
 2 / arn:aws:kms:*
   \ (arn:aws:kms:us-east-1:*)
sse_kms_key_id> 1    #KMSキーは使用しないため1を選択

Option storage_class.
The storage class to use when storing new objects in S3.
Choose a number from below, or type in your own value.
Press Enter to leave empty.
 1 / Default
   \ ()
 2 / Standard storage class
storage_class> 2    #ストレージクラスはスタンダードを使用するため2を選択

Edit advanced config?
y) Yes
n) No (default)
y/n> n    #詳細設定は行わないためnを選択

Configuration complete.
- type: s3
- provider: AWS
- env_auth: true
- access_key_id: アクセスキー
- secret_access_key: シークレットアクセスキー
- region: ap-northeast-1
- location_constraint: ap-northeast-1
- acl: private
- storage_class: STANDARD
Keep this "s3" remote?
y) Yes this is OK (default)
e) Edit this remote
d) Delete this remote
y/e/d> y    #設定内容に問題なければyを選択

Current remotes:

Name                 Type
====                 ====
s3                   s3    #作成したものが表示される

e) Edit existing remote
n) New remote
d) Delete remote
r) Rename remote
c) Copy remote
s) Set configuration password
q) Quit config
e/n/d/r/c/s/q> q    #上部にS3が表示されていればOK、qを選択


再度 $ rclone config を実行

Current remotes:

Name                 Type
====                 ====
s3                   s3

e) Edit existing remote
n) New remote
d) Delete remote
r) Rename remote
c) Copy remote
s) Set configuration password
q) Quit config
e/n/d/r/c/s/q> n

Enter name for new remote.
name> google-drive

Option Storage.
Type of storage to configure.
Choose a number from below, or type in your own value.
18 / Google Drive
   \ (drive)
Storage> 18

Option client_id.
Google Application Client Id
Setting your own is recommended.
See https://rclone.org/drive/#making-your-own-client-id for how to create your own.    
If you leave this blank, it will use an internal key which is low performance.
Enter a value. Press Enter to leave empty.
client_id> ○○○○○○○○    #GoogleCloudで発行したクライアントID

Option client_secret.
OAuth Client Secret.
Leave blank normally.
Enter a value. Press Enter to leave empty.
client_secret> ××××××××    #GoogleCloudで発行したクライアントシークレット

Option scope.
Comma separated list of scopes that rclone should use when requesting access from drive.
Choose a number from below, or type in your own value.
Press Enter to leave empty.
 1 / Full access all files, excluding Application Data Folder.
   \ (drive)
 2 / Read-only access to file metadata and file contents.
   \ (drive.readonly)
scope> 2    #今回は読み取りだけのため2を選択

Option service_account_file.
Service Account Credentials JSON file path.
Leave blank normally.
Needed only if you want use SA instead of interactive login.
Leading `~` will be expanded in the file name as will environment variables such as `${RCLONE_CONFIG_DIR}`.
Enter a value. Press Enter to leave empty.
service_account_file>    #使用しないため何も入力せずにEnter

Edit advanced config?
y) Yes
n) No (default)
y/n> n

Use web browser to automatically authenticate rclone with remote?
 * Say Y if the machine running rclone has a web browser you can use
 * Say N if running rclone on a (remote) machine without web browser access
If not sure try Y. If Y failed, try N.

y) Yes (default)
n) No
y/n> n    #手動で認証を行うためnを選択

Option config_token.
For this to work, you will need rclone available on a machine that has
a web browser available.
For more help and alternate methods see: https://rclone.org/remote_setup/
Execute the following on the machine with the web browser (same rclone
version recommended):
        rclone authorize "drive" "~~~"   
Then paste the result.
Enter a value.
config_token> ○○○○○○○○    
Configure this as a Shared Drive (Team Drive)?

y) Yes
n) No (default)
y/n> y    #共有ドライブの設定が問題なければyを選択

Option config_team_drive.
Shared Drive
Choose a number from below, or type in your own string value.
Press Enter for the default (0APIj9wqnJalTUk9PVA).
 1 / ○○○○○○○○
   \ (○○○○○○○○)
 2 / ××××××
   \ (××××××)
config_team_drive> 1    #共有ドライブ一覧から使用するフォルダを選択

Configuration complete.
- type: drive
- client_id: ○○○○○○○○
- client_secret: ××××××××
- token: {"access_token":○○○○}- team_drive:×××× 
- root_folder_id:
Keep this "google-drive" remote?
y) Yes this is OK (default)
e) Edit this remote
d) Delete this remote
y/e/d> y

Current remotes:

Name                 Type
====                 ====
google-drive         drive
s3                   s3

e) Edit existing remote
n) New remote
d) Delete remote
r) Rename remote
c) Copy remote
s) Set configuration password
q) Quit config
e/n/d/r/c/s/q> q






$ rclone copy google-drive:コピーしたいファイルのパス s3:保存したいフォルダのパス



$ rclone copy google-drive:./file1.csv s3:C


$ rclone copy google-drive:B/file2.csv s3:C/D


 今回はGoogleドライブからS3、S3からRDSまでの処理を一貫して行いたかったため、Spring Bootの@Scheduledアノテーションを用いてRcloneの処理を記載したシェルスクリプトの実行から、S3 Select、RDSへのデータ取り込みまでを定期実行します。



sudo vi sample.sh


rclone copy google-drive:○○○○○○○○ s3:××××××


package com.aws.sample.controller;

import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.CrossOrigin;
import org.springframework.web.bind.annotation.RestController;

public class SampleController {

    @RequestMapping(method = RequestMethod.GET)
    public ResponseEntity<Map<String, Object>> sample() {
        try {
            ProcessBuilder processBuilder = new ProcessBuilder("sh",

            Process process = processBuilder.start();
            int exitCode = process.waitFor();
            System.out.println("Script execution finished with exit code: " + exitCode);

            if (exitCode != 0) { // exitCodeが0以外(Rclone失敗)の場合RDS取り込みはやらない


            } else { // exitCodeが0(Rclone成功)の場合RDS取り込みを実行

                //S3 Selectの処理を記載


        } catch (Exception e) {

        String sample = "s";

        Map<String, Object> map = new HashMap<>();

        map.put("test", sample);

        return new ResponseEntity<Map<String, Object>>(map, HttpStatus.OK);




package com.aws.sample;

import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.scheduling.annotation.EnableScheduling;

public class SampleApplication {

	public static void main(String[] args) {
		SpringApplication.run(SampleApplication.class, args);



package com.aws.sample.controller;

import org.springframework.web.bind.annotation.CrossOrigin;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.scheduling.annotation.Scheduled;

public class SampleController {
    @Scheduled(cron = "0 30 12 * * *", zone = "Asia/Tokyo")

    public void sample() {
        try {
            ProcessBuilder processBuilder = new ProcessBuilder("sh",

            Process process = processBuilder.start();
            int exitCode = process.waitFor();
            System.out.println("Script execution finished with exit code: " + exitCode);

            if (exitCode != 0) { // exitCodeが0以外(Rclone成功失敗)の場合RDS取り込みはやらない


            } else { // exitCodeが0(Rclone成功)の場合RDS取り込みを実行

                //S3 Selectの処理を記載


        } catch (Exception e) {



 crontabで実施する際には* * * * * が基礎コマンドになり、左から分、時、日、月、曜日を指します。

※今回使用しているSpringBoot では* * * * * *が基礎コマンドで一番左に秒指定が必要になります。

* は全て指定されているイメージで、時間を指定する際は以下の例のように記述します。

  0 30 9 * * *
  0 30 9 5 * *



 以下のS3 Select編では、今回RcloneでS3に保存したCSVファイルのデータをS3 Selectを使用して抽出し、RDSに反映するまでの処理について記載しています。

