Kaggle 上很多竞赛数据集比较大,下载是个问题,不过,其提供了 kaggle api,一遍快速下载.

1. Kaggle api 配置

1.1. kaggle api 安装

pip install kaggle

1.2. API Token 申请

在 Kaggle 账户的 My Account 页面申请,找到如下图处:

注:没有 Kaggle 账户的话需要注册一个.

点击 Create New API Token,即可下载一个 kaggle.json 文件.

然后,在Ubuntu系统中,将该 kaggle.json 文件放在 /home/username/.kaggle/ 路径.(如果该路径不存在,则手动新建.)

cd ~ ls -a mkdir .kaggle cd ~/.kaggle/ # 设置权限 chmod 600 ~/.kaggle/kaggle.json

2. Kaggle 数据集下载

在配置完成以后,即可在 Kagge 竞赛的 Data 页面下载数据,如:

cd /path/to/save/datas kaggle competitions download -c diabetic-retinopathy-detection

速度还是比较快的.

3. Kaggle API 参数

Kaggle API 命令行工具:

#competitions kaggle competitions {list, files, download, submit, submissions, leaderboard} #datasets kaggle datasets {list, files, download, create, version, init} #kernels kaggle kernels {list, init, push, pull, output, status} #config kaggle config {view, set, unset}

具体可参考:Github - kaggle-api.

Last modification:May 14th, 2019 at 04:55 pm