Ketika menggunakan wget
di script untuk men-download beberapa file dari Google Docs, nama file yang tidak diawetkan. Misalnya:
wget 'http://spreadsheets.google.com/pub?key=pyj6tScZqmEfbZyl0qjbiRQ&output=xls'
menyimpan file sebagai pub?kunci=pyj6tScZqmEfbZyl0qjbiRQ
bukan indicatorhivestimatedprevalence15-49.xls
, yang adalah apa yang saya dapatkan jika saya klik pada link di browser. Apakah ada cara untuk menegakkan ini "browser-seperti" perilaku wget
?
wget --content-disposition 'http://spreadsheets.google.com/pub?key=pyj6tScZqmEfbZyl0qjbiRQ&output=xls'
akan melakukan trik untuk anda.
Yang masih belum sepenuhnya dilaksanakan dan tampaknya bug sedikit kadang-kadang tidak ada pilihan default di wget
, menggunakannya di risiko anda sendiri.
Anda dapat mencoba untuk menggunakan keriting untuk men-download dan menyimpan nama berkas asli:
curl -OJL ${your_url}
lihat curl command line options.
Google Docs link adalah benar-benar mengatakan sebuah script pada server untuk menjalankan, parsing ke dalam file yang anda inginkan. File, untuk yang terbaik dari pengetahuan saya, tidak ada yang pernah di server di els bentuk, tetapi dihasilkan pada saat runtime ketika anda meminta untuk itu. Dengan demikian, ada isn't apa pun untuk wget untuk mendapatkan.
Dalam rangka untuk men-download file, anda akan perlu untuk menggunakan google API http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#DownloadingDocs/.