Lebih

Question

Dapatkan ukuran file sebelum men-download di Python

I'm men-download seluruh direktori dari web server. Bekerja OK, tapi aku bisa't mencari cara untuk mendapatkan ukuran file sebelum men-download untuk membandingkan jika telah diperbarui di server atau tidak. Hal ini dapat dilakukan karena jika saya men-download file dari server FTP?

import urllib
import re

url = "http://www.someurl.com"

# Download the page locally
f = urllib.urlopen(url)
html = f.read()
f.close()

f = open ("temp.htm", "w")
f.write (html)
f.close()

# List only the .TXT / .ZIP files
fnames = re.findall('^.*<a href="(\w+(?:\.txt|.zip)?)".*$', html, re.MULTILINE)

for fname in fnames:
    print fname, "..."

    f = urllib.urlopen(url + "/" + fname)

    #### Here I want to check the filesize to download or not #### 
    file = f.read()
    f.close()

    f = open (fname, "w")
    f.write (file)
    f.close()

@Jon: terima kasih untuk jawaban cepat. Ia bekerja, tetapi filesize pada web server adalah sedikit kurang dari ukuran file dari file yang didownload.

Contoh:

Local Size  Server Size
 2.223.533  2.115.516
   664.603    662.121

Ia memiliki sesuatu untuk dilakukan dengan CR/LF konversi?

Pertanyaan edit 6 Juli 2013 в 1:43

Solution / Answer

8 Agustus 2008 в 2:21

Lebih

Saya telah direproduksi apa yang anda lihat:

import urllib, os
link = "http://python.org"
print "opening url:", link
site = urllib.urlopen(link)
meta = site.info()
print "Content-Length:", meta.getheaders("Content-Length")[0]

f = open("out.txt", "r")
print "File on disk:",len(f.read())
f.close()

f = open("out.txt", "w")
f.write(site.read())
site.close()
f.close()

f = open("out.txt", "r")
print "File on disk after download:",len(f.read())
f.close()

print "os.stat().st_size returns:", os.stat("out.txt").st_size

Output ini:

opening url: http://python.org
Content-Length: 16535
File on disk: 16535
File on disk after download: 16535
os.stat().st_size returns: 16861

Apa yang saya lakukan salah di sini? Ini os.stat().st_size tidak kembali ke ukuran yang benar?

Edit: OK, saya tahu apa masalahnya:

import urllib, os
link = "http://python.org"
print "opening url:", link
site = urllib.urlopen(link)
meta = site.info()
print "Content-Length:", meta.getheaders("Content-Length")[0]

f = open("out.txt", "rb")
print "File on disk:",len(f.read())
f.close()

f = open("out.txt", "wb")
f.write(site.read())
site.close()
f.close()

f = open("out.txt", "rb")
print "File on disk after download:",len(f.read())
f.close()

print "os.stat().st_size returns:", os.stat("out.txt").st_size

ini output:

$ python test.py
opening url: http://python.org
Content-Length: 16535
File on disk: 16535
File on disk after download: 16535
os.stat().st_size returns: 16535

Pastikan anda membuka kedua file biner membaca/menulis.

// open for binary write
open(filename, "wb")
// open for binary read
open(filename, "rb")

Jawaban edit 8 Agustus 2008 в 2:26

8 Agustus 2008 в 1:47

Lebih

Menggunakan kembali-urllib-objek metode info(), anda bisa mendapatkan berbagai informasi di retrived dokumen. Contoh menyambar saat ini logo Google:

>>> import urllib
>>> d = urllib.urlopen("http://www.google.co.uk/logos/olympics08_opening.gif")
>>> print d.info()

Content-Type: image/gif
Last-Modified: Thu, 07 Aug 2008 16:20:19 GMT  
Expires: Sun, 17 Jan 2038 19:14:07 GMT 
Cache-Control: public 
Date: Fri, 08 Aug 2008 13:40:41 GMT 
Server: gws 
Content-Length: 20172 
Connection: Close

It's sebuah dict, sehingga untuk mendapatkan ukuran file yang anda lakukan urllibobject.info()['Content-Length']

print f.info()['Content-Length']

Dan untuk mendapatkan ukuran file lokal (untuk perbandingan), anda dapat menggunakan os.stat() perintah:

os.stat("/the/local/file.zip").st_size

8 Agustus 2008 в 1:41

Lebih

Ukuran file yang dikirim sebagai header Content-Length. Berikut adalah cara untuk mendapatkannya dengan urllib:

>>> site = urllib.urlopen("http://python.org")
>>> meta = site.info()
>>> print meta.getheaders("Content-Length")
['16535']
>>>

Jawaban edit 8 Agustus 2008 в 1:44

4 Desember 2016 в 10:21

Lebih

A permintaan-solusi berbasis menggunakan KEPALA bukannya MENDAPATKAN (juga mencetak header HTTP):

#!/usr/bin/python
# display size of a remote file without downloading

from __future__ import print_function
import sys
import requests

# number of bytes in a megabyte
MBFACTOR = float(1 << 20)

response = requests.head(sys.argv[1], allow_redirects=True)

print("\n".join([('{:<40}: {}'.format(k, v)) for k, v in response.headers.items()]))
size = response.headers.get('content-length', 0)
print('{:<40}: {:.2f} MB'.format('FILE SIZE', int(size) / MBFACTOR))

Penggunaan

$ python filesize-remote-url.py https://httpbin.org/image/jpeg ... Content-Length : 35588 FILE SIZE (MB) : 0.03 MB

Jawaban edit 2 Juni 2017 в 1:24

26 Agustus 2014 в 9:31

Lebih

Di Python3:

>>> import urllib.request
>>> site = urllib.request.urlopen("http://python.org")
>>> print("FileSize: ", site.length)

yukashima huksay

27 September 2017 в 5:33

Lebih

Untuk python3 (diuji pada 3.5) pendekatan I'd merekomendasikan:

with urlopen(file_url) as in_file, open(local_file_address, 'wb') as out_file:
    print(in_file.getheader('Content-Length'))
    out_file.write(response.read())

yukashima huksay

Jawaban edit 8 Januari 2018 в 6:38

Related communities 6

Python Indonesia

Python Indonesia

25 972 pengguna

Programmer Python Indonesia. Group ini dikelola oleh sejumlah admin. Baca pesan tersemat / pinned message: https://t.me/pythonID/217588

Indonesian Python Warriors

Indonesian Python Warriors

1 564 pengguna

Di grup ini tidak ada kewajiban untuk menggunakan username dan foto. Yang tidak boleh adalah spamming. Gak boleh baper, kalau nanya yang bener, eror jangan difoto pake HP, gunakan screenshot, code copas ke dpaste.org lalu share link ke sini.

Python-ID Jogja

Python-ID Jogja

947 pengguna

Python Newbie Indonesia

Python Newbie Indonesia

471 pengguna

Peraturan grup Python Newbie 🌻Dilarang spam 🌻Dilarang menggunakan bahasa kasar 🌻Dilarang beriklan di grup tanpa seizin admin Beberapa video dasar python dapat diliat melalui channel youtube juan aditya Jangan lupa untuk subscribe ya🙏

BASIC PYTHON INDONESIA

BASIC PYTHON INDONESIA

351 pengguna

PythonWealth Indonesia 🇮🇩

PythonWealth Indonesia 🇮🇩

14 pengguna

Tambahkan pertanyaan

Kategori

Teknologi

Budaya / Rekreasi

Kehidupan / Seni

Ilmu Pengetahuan

Profesional

Bisnis

Pengguna

Ксения Комарова

Terdaftar 3 minggu yang lalu

Артур «Апер»

Terdaftar 2 bulan yang lalu

Viktor Malyutin

Terdaftar 2 bulan yang lalu

Viktor Malyutin

Terdaftar 2 bulan yang lalu

Syahputra Zhedenk

Terdaftar 2 bulan yang lalu

Anda punya pertanyaan? Tambahkan di situs dan dapatkan jawabannya secara instan