Menghapus karakter tertentu dari sebuah string dalam Python

7.2. re — Regular expression operations — Python 2.7.18 documentation

cod3monk3y

25 Januari 2014 в 10:39

Lebih

Untuk inverse persyaratan hanya memungkinkan karakter tertentu dalam sebuah string, anda dapat menggunakan ekspresi reguler dengan melengkapi operator [^ABCabc]. Misalnya, untuk menghapus semuanya kecuali ascii huruf, angka, dan tanda hubung:

>>> import string
>>> import re
>>>
>>> phrase = '  There were "nine" (9) chick-peas in my pocket!!!      '
>>> allow = string.letters + string.digits + '-'
>>> re.sub('[^%s]' % allow, '', phrase)

'Therewerenine9chick-peasinmypocket'

Dari python ekspresi reguler dokumentasi:

Karakter yang tidak berada dalam kisaran yang dapat dicocokkan dengan melengkapi set. Jika karakter pertama dari set'^', semua karakter yang tidak di set akan dicocokkan. Misalnya, [^5] akan cocok karakter apapun kecuali '5', dan [^^] akan cocok dengan karakter apapun kecuali '^'. ^ tidak memiliki arti khusus jika itu bukan karakter pertama dalam set.

docs.python.org

19

mgold

14 Desember 2011 в 6:03

Lebih

Penanya hampir memilikinya. Seperti kebanyakan hal dalam Python, jawabannya adalah lebih sederhana dari yang anda pikirkan.

>>> line = "H E?.LL!/;O:: "  
>>> for char in ' ?.!/;:':  
...  line = line.replace(char,'')  
...
>>> print line
HELLO

Anda don't harus melakukan nested if/untuk loop hal, tetapi anda perlu untuk memeriksa setiap karakter individual.

18

Muhammad Alkarouri

15 Oktober 2010 в 3:59

Lebih

line = line.translate(None, " ?.!/;:")

14

eatkin

8 Oktober 2015 в 8:24

Lebih

>>> s = 'a1b2c3'
>>> ''.join(c for c in s if c not in '123')
'abc'

10

Greg Hewgill

15 Oktober 2010 в 3:50

Lebih

String tidak dapat diubah dalam Python. Metode replace mengembalikan string baru setelah penggantian. Coba:

for char in line:
    if char in " ?.!/;:":
        line = line.replace(char,'')

9

Jawaban edit 28 Oktober 2017 в 10:31

Dan Temkin

1 Januari 2017 в 6:49

Lebih

Saya terkejut bahwa tidak ada yang memiliki namun dianjurkan menggunakan pertamax filter fungsi.

    import operator
    import string # only for the example you could use a custom string

    s = "1212edjaq"

Katakanlah kita ingin menyaring segala sesuatu yang isn't nomor. Menggunakan filter builtin metode "...setara dengan generator ekspresi (item untuk item di iterable fungsi if(item))" [Python 3 Builtins: Filter]

    sList = list(s)
    intsList = list(string.digits)
    obj = filter(lambda x: operator.contains(intsList, x), sList)))

Di Python 3 ini kembali

    >>  <filter object @ hex>

Untuk mendapatkan cetak string,

    nums = "".join(list(obj))
    print(nums)
    >> "1212"

Saya tidak yakin bagaimana filter jajaran dalam hal efisiensi, tetapi itu adalah hal yang baik untuk mengetahui bagaimana untuk menggunakan ketika melakukan daftar pemahaman dan semacamnya.

UPDATE

Logikanya, karena filter ini berfungsi anda juga bisa menggunakan daftar pemahaman dan dari apa yang saya baca hal ini seharusnya menjadi lebih efisien karena lambdas adalah wall street manajer hedge fund dari fungsi pemrograman dunia. Kelebihan lainnya adalah bahwa ini adalah satu-kapal yang tidak memerlukan impor. Misalnya, menggunakan string yang sama 's' yang didefinisikan di atas,

      num = "".join([i for i in s if i.isdigit()])

Yang's ini. Kembali akan sebuah string dari semua karakter yang ada angka dalam string asli.

Jika anda memiliki daftar khusus yang dapat diterima/tidak dapat diterima karakter anda hanya perlu menyesuaikan 'jika' bagian dari daftar pemahaman.

      target_chars = "".join([i for i in s if i in some_list])

atau sebagai alternatif,

      target_chars = "".join([i for i in s if i not in some_list])

Dan Temkin

8

2. Built-in Functions — Python 2.7.18 documentation

serv-inc

25 Oktober 2017 в 10:44

Lebih

Menggunakan filter, anda'a hanya perlu satu baris

line = filter(lambda char: char not in " ?.!/;:", line)

Ini memperlakukan string sebagai iterable dan memeriksa setiap karakter jika lambda mengembalikan True:

membantu(filter) Bantuan pada built-in fungsi filter dalam modul builtin:

filter(...) filter(fungsi atau Tidak, urutan) -> list, tuple, atau string

Return item-item dari urutan yang function(item) adalah benar. Jika fungsi ini Tidak ada, mengembalikan barang-barang yang benar. Jika urutan adalah sebuah tuple atau string, kembali jenis yang sama, yang lain kembali daftar.

docs.python.org

7

Jawaban edit 22 Juli 2018 в 1:36

BPL

22 Juli 2018 в 1:04

Lebih

Berikut ini's beberapa cara yang mungkin untuk mencapai tugas ini:

def attempt1(string):
    return "".join([v for v in string if v not in ("a", "e", "i", "o", "u")])

def attempt2(string):
    for v in ("a", "e", "i", "o", "u"):
        string = string.replace(v, "")
    return string

def attempt3(string):
    import re
    for v in ("a", "e", "i", "o", "u"):
        string = re.sub(v, "", string)
    return string

def attempt4(string):
    return string.replace("a", "").replace("e", "").replace("i", "").replace("o", "").replace("u", "")

for attempt in [attempt1, attempt2, attempt3, attempt4]:
    print(attempt("murcielago"))

PS: Bukannya menggunakan " ?.!/;:" contoh penggunaan vokal... dan ya, "murcielago" adalah kata spanyol untuk mengatakan bat... kata lucu karena mengandung semua vokal :)

PS2: Jika anda're tertarik pada kinerja anda bisa mengukur upaya ini dengan kode sederhana seperti:

import timeit

K = 1000000
for i in range(1,5):
    t = timeit.Timer(
        f"attempt{i}('murcielago')",
        setup=f"from __main__ import attempt{i}"
    ).repeat(1, K)
    print(f"attempt{i}",min(t))

Di dalam kotak saya, anda'd dapatkan:

attempt1 2.2334518376057244
attempt2 1.8806643818474513
attempt3 7.214925774955572
attempt4 1.7271184513757465

Jadi sepertinya attempt4 adalah yang tercepat untuk input tertentu.

BPL

4

Bryce Guinta

3 Agustus 2016 в 4:07

Lebih

Berikut ini's my Python 2/3 versi yang kompatibel. Sejak translate api telah berubah.

def remove(str_, chars):
    """Removes each char in `chars` from `str_`.

    Args:
        str_: String to remove characters from
        chars: String of to-be removed characters

    Returns:
        A copy of str_ with `chars` removed

    Example:
            remove("What?!?: darn;", " ?.!:;") => 'Whatdarn'
    """
    try:
        # Python2.x
        return str_.translate(None, chars)
    except TypeError:
        # Python 3.x
        table = {ord(char): None for char in chars}
        return str_.translate(table)

3

Wariat

24 Maret 2015 в 7:53

Lebih

Bagaimana dengan ini:

def text_cleanup(text):
    new = ""
    for i in text:
        if i not in " ?.!/;:":
            new += i
    return new

Djidiouf

11 Agustus 2015 в 6:36

Lebih

Anda juga dapat menggunakan fungsi dalam rangka untuk mengganti jenis yang berbeda dari ekspresi reguler atau pola lainnya dengan menggunakan sebuah daftar. Dengan itu, anda dapat dicampur ekspresi reguler, kelas karakter, dan benar-benar dasar pola teks. It's benar-benar berguna ketika anda perlu untuk mengganti banyak elemen seperti HTML yang.

*NB: bekerja dengan Python 3.x

import re  # Regular expression library

def string_cleanup(x, notwanted):
    for item in notwanted:
        x = re.sub(item, '', x)
    return x

line = "<title>My example: <strong>A text %very% $clean!!</strong></title>"
print("Uncleaned: ", line)

# Get rid of html elements
html_elements = ["<title>", "</title>", "<strong>", "</strong>"]
line = string_cleanup(line, html_elements)
print("1st clean: ", line)

# Get rid of special characters
special_chars = ["[!@#$]", "%"]
line = string_cleanup(line, special_chars)
print("2nd clean: ", line)

Dalam fungsi string_cleanup, dibutuhkan string x dan daftar notwanted sebagai argumen. Untuk setiap item dalam daftar elemen-elemen atau pola, jika pengganti yang dibutuhkan itu akan dilakukan.

Output:

Uncleaned:  <title>My example: <strong>A text %very% $clean!!</strong></title>
1st clean:  My example: A text %very% $clean!!
2nd clean:  My example: A text very clean

oisinvg

10 Juni 2016 в 7:30

Lebih

Saya metode I'd gunakan mungkin tidak't bekerja secara efisien, tetapi secara besar-besaran yang sederhana. Saya dapat menghapus beberapa karakter pada posisi yang berbeda sekaligus, menggunakan mengiris dan format. Berikut ini's contoh:

words = "things"
removed = "%s%s" % (words[:3], words[-1:])

Hal ini akan mengakibatkan 'dihapus' memegang kata-kata 'ini'.

Format dapat sangat membantu untuk pencetakan variabel midway melalui cetak string. Hal ini dapat memasukkan tipe data menggunakan a % diikuti oleh variabel's tipe data; semua tipe data dapat menggunakan %s, dan mengapung (alias desimal) dan bilangan bulat dapat menggunakan %d.

Mengiris dapat digunakan untuk kontrol yang rumit di atas senar. Ketika saya menempatkan kata-kata[:3], itu memungkinkan saya untuk memilih semua karakter dalam string dari awal (usus besar sebelum nomor, ini akan berarti 'dari awal sampai') untuk ke-4 karakter (termasuk 4 karakter). Alasannya sama dengan 3 sampai 4 posisi ini karena Python dimulai dari 0. Kemudian, ketika saya menempatkan kata[-1:], itu berarti 2 karakter terakhir sampai akhir (usus besar di balik nomor). Menempatkan -1 akan membuat Python menghitung dari karakter terakhir, bukan yang pertama. Lagi, Python akan dimulai dari 0. Jadi, kata[-1:] pada dasarnya berarti 'dari kedua karakter terakhir ke akhir dari string.

Jadi, dengan memotong karakter sebelum karakter saya ingin menghapus dan karakter setelah dan mengapit mereka bersama-sama, saya dapat menghapus karakter yang tidak diinginkan. Anggap saja seperti sosis. Di tengah itu's kotor, jadi saya ingin menyingkirkan itu. Saya hanya memotong kedua ujung saya inginkan kemudian menempatkan mereka bersama-sama tanpa bagian yang tidak diinginkan di tengah.

Jika saya ingin menghapus beberapa berturut-turut karakter, saya hanya menggeser angka-angka di dalam [] (mengiris bagian). Atau jika saya ingin menghapus beberapa karakter dari posisi yang berbeda, saya hanya dapat sandwich bersama beberapa potong sekaligus.

Contoh:

 words = "control"
 removed = "%s%s" % (words[:2], words[-2:])

dihapus sama 'keren'.

words = "impacts"
removed = "%s%s%s" % (words[1], words[3:5], words[-1])

dihapus sama 'mac'.

Dalam hal ini, [3:5] berarti karakter di posisi 3 melalui karakter di posisi 5 (tidak termasuk karakter pada posisi akhir).

Ingat, Python mulai menghitung dari 0, sehingga anda akan perlu untuk juga.

pkm

25 Mei 2014 в 9:34

Lebih

#!/usr/bin/python
import re

strs = "how^ much for{} the maple syrup? $20.99? That's[] ricidulous!!!"
print strs
nstr = re.sub(r'[?|$|.|!|a|b]',r' ',strs)#i have taken special character to remove but any #character can be added here
print nstr
nestr = re.sub(r'[^a-zA-Z0-9 ]',r'',nstr)#for removing special character
print nestr

Samuel Muldoon

23 Oktober 2019 в 6:20

Lebih

String metode menggantikan tidak memodifikasi string asli. Daun asli sendirian dan kembali salinan dimodifikasi.

Apa yang anda inginkan adalah sesuatu seperti: line = garis.replace(char,'')

def replace_all(line, )for char in line:
    if char in " ?.!/;:":
        line = line.replace(char,'')
    return line

Namun, menciptakan sebuah string baru masing-masing dan setiap kali karakter yang dihapus adalah sangat tidak efisien. Saya sarankan berikut ini sebagai gantinya:

def replace_all(line, baddies, *):
    """
    The following is documentation on how to use the class,
    without reference to the implementation details:

    For implementation notes, please see comments begining with `#`
    in the source file.

    [*crickets chirp*]

    """

    is_bad = lambda ch, baddies=baddies: return ch in baddies
    filter_baddies = lambda ch, *, is_bad=is_bad: "" if is_bad(ch) else ch
    mahp = replace_all.map(filter_baddies, line)
    return replace_all.join('', join(mahp))

    # -------------------------------------------------
    # WHY `baddies=baddies`?!?
    #     `is_bad=is_bad`
    # -------------------------------------------------
    # Default arguments to a lambda function are evaluated
    # at the same time as when a lambda function is
    # **defined**.
    #
    # global variables of a lambda function
    # are evaluated when the lambda function is
    # **called**
    #
    # The following prints "as yellow as snow"
    #
    #     fleece_color = "white"
    #     little_lamb = lambda end: return "as " + fleece_color + end
    #
    #     # sometime later...
    #
    #     fleece_color = "yellow"
    #     print(little_lamb(" as snow"))
    # --------------------------------------------------
replace_all.map = map
replace_all.join = str.join

Joseph Lee

31 Oktober 2017 в 8:01

Lebih

Coba yang satu ini:

def rm_char(original_str, need2rm):
    ''' Remove charecters in "need2rm" from "original_str" '''
    return original_str.translate(str.maketrans('','',need2rm))

Metode ini bekerja dengan baik dengan python 3.5.2

Arihant Bansal

31 Oktober 2017 в 8:06

Lebih

>>> # Character stripping
>>> a = '?abcd1234!!'
>>> t.lstrip('?')
'abcd1234!!'
>>> t.strip('?!')
'abcd1234'

Related communities 6

Python Indonesia

25 972 pengguna

Programmer Python Indonesia. Group ini dikelola oleh sejumlah admin. Baca pesan tersemat / pinned message: https://t.me/pythonID/217588

Indonesian Python Warriors

1 564 pengguna

Di grup ini tidak ada kewajiban untuk menggunakan username dan foto. Yang tidak boleh adalah spamming. Gak boleh baper, kalau nanya yang bener, eror jangan difoto pake HP, gunakan screenshot, code copas ke dpaste.org lalu share link ke sini.

Python-ID Jogja

947 pengguna

Python Newbie Indonesia

471 pengguna

Peraturan grup Python Newbie 🌻Dilarang spam 🌻Dilarang menggunakan bahasa kasar 🌻Dilarang beriklan di grup tanpa seizin admin Beberapa video dasar python dapat diliat melalui channel youtube juan aditya Jangan lupa untuk subscribe ya🙏

BASIC PYTHON INDONESIA

351 pengguna

PythonWealth Indonesia 🇮🇩

14 pengguna

Tambahkan pertanyaan

Kategori

Semua

Teknologi

Budaya / Rekreasi

Kehidupan / Seni

Ilmu Pengetahuan

Profesional

Bisnis

Pengguna

Semua

Baru

Populer