Kaggle 上很多竞赛数据集比较大,下载是个问题,不过,其提供了 kaggle api,一遍快速下载.
1. Kaggle api 配置
1.1. kaggle api 安装
pip install kaggle
1.2. API Token 申请
在 Kaggle 账户的 My Account
页面申请,找到如下图处:
注:没有 Kaggle 账户的话需要注册一个.
点击 Create New API Token
,即可下载一个 kaggle.json
文件.
然后,在Ubuntu系统中,将该 kaggle.json
文件放在 /home/username/.kaggle/
路径.(如果该路径不存在,则手动新建.)
cd ~
ls -a
mkdir .kaggle
cd ~/.kaggle/
# 设置权限
chmod 600 ~/.kaggle/kaggle.json
2. Kaggle 数据集下载
在配置完成以后,即可在 Kagge 竞赛的 Data 页面下载数据,如:
cd /path/to/save/datas
kaggle competitions download -c diabetic-retinopathy-detection
速度还是比较快的.
3. Kaggle API 参数
Kaggle API 命令行工具:
#competitions
kaggle competitions {list, files, download, submit, submissions, leaderboard}
#datasets
kaggle datasets {list, files, download, create, version, init}
#kernels
kaggle kernels {list, init, push, pull, output, status}
#config
kaggle config {view, set, unset}
具体可参考:Github - kaggle-api.