de-vraag
  • 질문
  • 태그
  • 사용자
알림
보상
등록
등록을 마치면 질문에 대한 답변과 의견이 통보됩니다.
로그인
계정이 이미 있는 경우 로그인하여 새 알림을 확인합니다.
추가 질문, 답변 및 코멘트에 대한 보상이 제공됩니다.
더보기
원본
편집
 abuteau
abuteau
Question

Python Panda 데이터 토큰화 오류

팬더를 사용하여 .csv 파일을 조작하려고 하는데 다음과 같은 오류가 발생합니다.

parser.parser.>파서.CParserError: 데이터를 토큰화하는 중 오류가 발생했습니다. C 오류: 3행에는 2개의 필드가 있어야 하는데 12개가 있습니다.

판다의 문서를 읽어보려고 노력했지만 아무것도 찾지 못했어요.

내 코드는 간단합니다:

path = 'GOOG Key Ratios.csv'
#print(open(path).read())
data = pd.read_csv(path)

어떻게 해결할 수 있을까요? 'csv' 모듈을 사용해야 합니까 아니면 다른 언어를 사용해야 합니까?

파일은 Morningstar에서 가져옵니다.

281 2013-08-04T01:54:45+00:00 20
Ronak Shah
Ronak Shah
편집된 질문30일 12월 2017 в 3:00
Growth, Profitability, and Financial Ratios for Alphabet Inc Class C (GOOG) from Morningstar.com
See Alphabet Inc Class C's 10 year historical growth, profitability, financial, efficiency, and cash flow ratios.
financials.morningstar.com
프로그래밍
csv
python
pandas
Popular videos
판다스에서 파일경로 확인과 불러오기 (FileNotFoundError 오류 해결하기)
판다스에서 파일경로 확인과 불러오기 (FileNotFoundError 오류 해결하기)
3년 전
[SOLVED] ParserError: Error tokenizing data. C error - Solve in 10 Secs
[SOLVED] ParserError: Error tokenizing data. C error - Solve in 10 Secs
1년 전
판다와 손잡은 파이썬 (파이썬 엑셀 다루기)
판다와 손잡은 파이썬 (파이썬 엑셀 다루기)
11개월 전
Pandas의 기본 사용법 [ Python 데이터 분석과 이미지 처리 ]
Pandas의 기본 사용법 [ Python 데이터 분석과 이미지 처리 ]
2년 전
파이썬 판다스로 회사 엑셀데이터 전처리 하는 방법 ! 1탄 (Python / Pandas) #Python #파이썬 #Pandas
파이썬 판다스로 회사 엑셀데이터 전처리 하는 방법 ! 1탄 (Python / Pandas) #Python #파이썬 #Pandas
1년 전
[1/7] Python, Pandas,  folium으로 스타벅스, 이디야 매장 위치 분석하기
[1/7] Python, Pandas, folium으로 스타벅스, 이디야 매장 위치 분석하기
3년 전
[Pandas 강의] 파일에서 데이터 불러오기
[Pandas 강의] 파일에서 데이터 불러오기
4년 전
파이썬 판다스 데이터프레임의 중요 함수를 배워보자. Python Pandas의 기본 활용
파이썬 판다스 데이터프레임의 중요 함수를 배워보자. Python Pandas의 기본 활용
1년 전
[매일 10분 데이터 분석] 날짜데이터를 처리 하자! 1편 (python / date time / pandas) #Python #파이썬 #Pandas
[매일 10분 데이터 분석] 날짜데이터를 처리 하자! 1편 (python / date time / pandas) #Python #파이썬 #Pandas
1년 전
[Chapter #2] 2.파이썬 데이터 읽기, 이렇게 쉽게 가능해? 판다스(Pandas)의 등장! 사용하기전에 알면 좋은 방법론! (부동산 데이터 제공!)
[Chapter #2] 2.파이썬 데이터 읽기, 이렇게 쉽게 가능해? 판다스(Pandas)의 등장! 사용하기전에 알면 좋은 방법론! (부동산 데이터 제공!)
2년 전
모듈 설치 문제로 인한 고통을 줄이자 - VS Code 가상환경
모듈 설치 문제로 인한 고통을 줄이자 - VS Code 가상환경
1년 전
[13/29] Pandas 기초 - 파이썬 판다스로 pd.concat([df1,df2]) 시리즈, 데이터프레임 합치기
[13/29] Pandas 기초 - 파이썬 판다스로 pd.concat([df1,df2]) 시리즈, 데이터프레임 합치기
3년 전
파이썬 공공데이터 분석[2/6] - Pandas로 데이터 불러오고 요약하기
파이썬 공공데이터 분석[2/6] - Pandas로 데이터 불러오고 요약하기
3년 전
03 판다스(pandas)로 엑셀(csv)데이터 불러오기
03 판다스(pandas)로 엑셀(csv)데이터 불러오기
3년 전
[7/29] Pandas 기초 - 파이썬 판다스로 기본 통계 하기 value_counts, nunique, sum, count, mean, median 튜토리얼 강의
[7/29] Pandas 기초 - 파이썬 판다스로 기본 통계 하기 value_counts, nunique, sum, count, mean, median 튜토리얼 강의
3년 전
« 이전
다음 »
이 질문은 영어로 1답번으로 되어 있는데, 그것을 읽으려면 로그 인. 당신이 보기에.
Solution / Answer
 richie
richie
8일 8월 2013 в 2:47
2013-08-08T14:47:15+00:00
더보기
원본
편집
#20551641

시도해 볼 수도 있습니다;

data = pd.read_csv('file1.csv', error_bad_lines=False)

이렇게 하면 위반되는 줄은 건너뜁니다.

 Renaud
Renaud
편집된 답변4일 3월 2019 в 4:44
421
0
 grisaitis
grisaitis
28일 10월 2014 в 2:18
2014-10-28T02:18:23+00:00
더보기
원본
편집
#20551643

이 문제가 될 수 있습니다

  • 이 고객의 데이터 구분
  • 첫 번째 행, @TomAugspurger 있다 "고 전했다

이를 해결하기 위해 9월 ',' 지정 및 / 또는 '헤더입니다 시도하시겠습니까 호출할 때' '인수만 read_csv'. 예를 들어,

df = pandas.read_csv(fileName, sep='delimiter', header=None)

위의 코드에서 '와' 헤더입니다 알 수 있는 '판다' 는 9월 너회의 구분 = 없음) 의 소스 데이터 주님으로부터그에게 행일 헤더도 / 열 개의 국내 타이틀을 우승하였다. 이렇게 말하는 이 문서: 헤더 파일이 포함되어 있지, 만약 &quot 행일 관심용 전달하십시오 헤더입니다 = None&quot, 명시적으로 합니다. 예를 들어, 정수 자동으로 만들어집니다.}, {0.1,2 각 분야의 지수 판다.

    • 문제가 될 게 없는 docs 에 따르면 구분 한다. 이 문서 할 말이 없는 경우, 9월 &quot [지정되지 않은] this.&quot 자동으로 판별할 수 있도록 노력하겠다. 하지만 난 적이 없는 등 함께 좋은 운빨이야 대체하십시오 인스턴스들도 명백하네 구분.
 grisaitis
grisaitis
편집된 답변5일 6월 2018 в 2:24
This API page has moved
pandas.pydata.org
77
0
 TomAugspurger
TomAugspurger
4일 8월 2013 в 2:24
2013-08-04T02:24:35+00:00
더보기
원본
편집
#20551640

파서가 파일의 헤더로 인해 혼동되고 있습니다. 첫 번째 행을 읽고 해당 행의 열 수를 추측합니다. 그러나 처음 두 행은 파일의 실제 데이터를 나타냅니다.

'data = pd.read_csv(경로, skiprow=2)'를 사용하여 시도하십시오.

38
0
 computerist
computerist
31일 3월 2017 в 4:29
2017-03-31T16:29:00+00:00
더보기
원본
편집
#20551648

네 CSV 파일 '에서' 유추 할 수가 가변적입니다 read_csv 열과 열 수가 처음 몇 행뿐만. 이를 해결하기 위해 두 가지 방법으로 이 경우:

  1. 할 수 있는 첫 번째 줄을 맥스야 CSV 파일 변경하십시오 더미 (dummy) 열 (지정하고 '헤더입니다 = [0]')

  2. 사용 목록 (범위 (0, N)) '또는' 이름 = 여기서 N 은 최대 열.

 Ajean
Ajean
편집된 답변20일 9월 2017 в 12:53
28
0
Piyush  S. Wanare
Piyush S. Wanare
1일 4월 2015 в 5:42
2015-04-01T05:42:48+00:00
더보기
원본
편집
#20551644

이건 분명히 문제가 구분, csv CSV 는 9월 = & # 39 로 대부분 잡을라는데 사용하여 만든 ',', '그래서 /t& # 39 를 사용하여 시도하시겠습니까 read_csv' 탭 문자 ' (\t)' 분리자의 사용하여 '/ t'. 따라서 열려면 다음과 같은 코드를 사용하여 시도하시겠습니까 할말이다

data=pd.read_csv("File_path", sep='\t')
17
0
Robert Geiger
Robert Geiger
4일 2월 2016 в 10:16
2016-02-04T22:16:44+00:00
더보기
원본
편집
#20551645

내가 가진 것은 아마도 이 문제가 아니라 다른 이유. 나는 내 뒤에 있던 쉼표 CSV 는 약간의 열을 추가 읽으려고 판다. 하지만 다음 작품을 통해 단순히 흐름선 나쁜거라 무시합니다.

data = pd.read_csv('file1.csv', error_bad_lines=False)

추악한 흐름선 유지하려면 한 종류의 해킹 처리하는 것이 뭔가 오류가 다음과 같습니다.

line     = []
expected = []
saw      = []     
cont     = True 

while cont == True:     
    try:
        data = pd.read_csv('file1.csv',skiprows=line)
        cont = False
    except Exception as e:    
        errortype = e.message.split('.')[0].strip()                                
        if errortype == 'Error tokenizing data':                        
           cerror      = e.message.split(':')[1].strip().replace(',','')
           nums        = [n for n in cerror.split(' ') if str.isdigit(n)]
           expected.append(int(nums[0]))
           saw.append(int(nums[2]))
           line.append(int(nums[1])-1)
         else:
           cerror      = 'Unknown'
           print 'Unknown Error - 222'

if line != []:
    # Handle the errors however you want

내가 쓸 수 차례 스크립트입니다 흐름선 재장착하려면 다테프라임 꽂으십시오 이후 line& # 39, & # 39 변수에 의해 나쁜거라 흐름선 나옵니다. 위 코드입니다. Csv 판독기에서 사용하기만 하면 이 피할 수 있습니다. 향후 이 상황에 대처할 수 있는 개발자들이 쉽게 판다 기대해 본다.

16
0
Steven Rouk
Steven Rouk
8일 1월 2019 в 6:57
2019-01-08T18:57:22+00:00
더보기
원본
편집
#20551664

내가 가진 것 없이 읽을 수 있는 것은 이 문제를 어디서 CSV 반군지역 열 이름.

df = pd.read_csv(filename, header=None)

나는 열 이름을 미리 지정된 후 목록에 이름을 바로 해결 및 정보기술 (it) ',' 전달하십시오 묶습니다. # 39 열 이름을 설정할 수 없는 경우, 그냥 don& 만들 수 있는 최대 열이 많은 자리표시자 이름으로 고객의 데이터.

col_names = ["col1", "col2", "col3", ...]
df = pd.read_csv(filename, names=col_names)
11
0
 elPastor
elPastor
7일 7월 2016 в 5:22
2016-07-07T17:22:00+00:00
더보기
원본
편집
#20551646

39 이 문제를 몇 번 i&, 내 자신을 숨기지 않았다. 거의 모든 시간, 그 이유는 해당 파일이 저장된 CSV 는 열려고 시도하는 것은 내가 제대로 꼴입니다. , 내 말은 각 행은 동일한 수의 뒤를 &quot properly&quot 경식도 구분 또는 열.

내가 잘못 때문에 일반적으로 발생했습니까 CSV Excel 에서 연 다음 구했잖아 거잖나. 비록 파일 확장자는 .csv 형식, CSV 는 여전히 순수한 그동안 변경됩니다.

39 마리의 to_csv 저장된 모든 파일을 통해 이 문제를 제대로 포맷하여 shouldn&, 될 수 없다. 하지만 대화 상자를 열면 다른 프로그램을 통해 구조를 변경할 수 있습니다.

도움이 되길 바란다.

10
0
 Legend_Ari
Legend_Ari
30일 6월 2014 в 11:46
2014-06-30T11:46:21+00:00
더보기
원본
편집
#20551642

저도 같은 문제를 접했어요. 동일한 소스 파일에 'pd.read_table()'을 사용하는 것이 작동하는 것처럼 보였습니다. 나는 이것에 대한 이유를 추적할 수 없었지만 그것은 나의 경우에 유용한 해결 방법이었어. 아마도 더 박식한 누군가가 왜 그것이 작동했는지 더 밝혀줄 수 있을 것이다.

편집: 파일에 실제 데이터와 동일한 형식이 아닌 텍스트가 있을 때 이 오류가 발생하는 것을 발견했습니다. 이것은 일반적으로 머리글 또는 바닥글 정보이며(한 줄 이상 크므로 skip_header가 작동하지 않음't) 실제 데이터와 같은 수의 쉼표로 구분되지 않습니다(read_csv 사용 시). read_table을 사용하면 탭을 구분 기호로 사용하여 사용자의 현재 오류를 우회하지만 다른 오류를 도입할 수 있습니다.

나는 보통 파일에 여분의 데이터를 읽고 read_csv() 방법을 사용함으로써 이것을 해결한다.

정확한 해결책은 실제 파일에 따라 다를 수 있지만, 이 방법은 여러 경우에 효과가 있었습니다.

7
0
 lotrus28
lotrus28
24일 4월 2017 в 11:28
2017-04-24T11:28:41+00:00
더보기
원본
편집
#20551649

39 i& 비슷한 문제가 발생, 읽을 수 있는 테이블을 공백 탭으로 구분된 숨기지 않았다, 쉼표 및 인용:

1115794 4218    "k__Bacteria", "p__Firmicutes", "c__Bacilli", "o__Bacillales", "f__Bacillaceae", ""
1144102 3180    "k__Bacteria", "p__Firmicutes", "c__Bacilli", "o__Bacillales", "f__Bacillaceae", "g__Bacillus", ""
368444  2328    "k__Bacteria", "p__Bacteroidetes", "c__Bacteroidia", "o__Bacteroidales", "f__Bacteroidaceae", "g__Bacteroides", ""

import pandas as pd
# Same error for read_table
counts = pd.read_csv(path_counts, sep='\t', index_col=2, header=None, engine = 'c')

pandas.io.common.CParserError: Error tokenizing data. C error: out of memory

이 있다고 캜 구문 분석 엔진 (디스크입니다. 기본값입니다) 한 관련이 있다. 아마 어떤 것도 변화시킬 수 있는 한, 파이썬 변경됩니까 &lt br&gt.

counts = pd.read_table(path_counts, sep='\t', index_col=2, header=None, engine='python')

Segmentation fault (core dumped)

바로 그것이 다른 error.&lt br>; 만약 우리가 박으래도 지루려면 시도하시겠습니까 공백을 테이블에서 파이썬 engine 변경 및 오류 다시 한 번:

1115794 4218    "k__Bacteria","p__Firmicutes","c__Bacilli","o__Bacillales","f__Bacillaceae",""
1144102 3180    "k__Bacteria","p__Firmicutes","c__Bacilli","o__Bacillales","f__Bacillaceae","g__Bacillus",""
368444  2328    "k__Bacteria","p__Bacteroidetes","c__Bacteroidia","o__Bacteroidales","f__Bacteroidaceae","g__Bacteroides",""

_csv.Error: '   ' expected after '"'

문제가 있는 것은 우리의 행뿐만 구문 분석 및 it gets 선택해제합니다 판다. 내가 필요한 모든 공간 및 파이썬 engine 분석할 수 있는 테이블을 지루려면 인용 테이블 신청했다. 한편 캜 engine 포함 추락한 있는 쉼표는 행뿐만 지켰다. &lt br>; &lt br>; 내가 가진 새 파일을 생기지 않도록 교체품을 이런게야 내 테이블 등 작다. &lt br>;

from io import StringIO
with open(path_counts) as f:
    input = StringIO(f.read().replace('", ""', '').replace('"', '').replace(', ', ',').replace('\0',''))
    counts = pd.read_table(input, sep='\t', index_col=2, header=None, engine='python')
  • tl; dr * &lt br>; 구문 분석 엔진, 시도하시겠습니까 변경하십시오 비사양 제한되지 않은 견적 / / 공백을 방지하기 위해 쉼표 고객의 데이터.
5
0
 user3426943
user3426943
26일 6월 2019 в 7:09
2019-06-26T19:09:22+00:00
더보기
원본
편집
#20551682

제가 가지고 있는 데이터세트를 사용되는 많은 쿼트에 자국이야 (") 불필요한 서식을 사용할 수 있다. 그는 이러한 오류는 매개변수입니다 해결할 수 있는 등 이른바 'read_csv ()' ':

"'파이썬

3 = 3 인용 csv 로 상호. 대한 quote_none 판다

4
0
Bhavesh Kumar
Bhavesh Kumar
21일 11월 2018 в 1:03
2018-11-21T13:03:24+00:00
더보기
원본
편집
#20551662

사용할 수 있는 매개변수입니다 구분

pd.read_csv(filename, delimiter=",", encoding='utf-8')

It 읽습니다.

4
0
 RegularlyScheduledProgram
RegularlyScheduledProgram
3일 10월 2016 в 3:45
2016-10-03T15:45:19+00:00
더보기
원본
편집
#20551647

이 질문에 대한 것은 아니지만, 이 사건을 통해 압축된 데이터 오류 나타날 수도 있습니다. 값 설정 '이 문제를 명시적으로 콰리' '압축' 해결되었으므로.

result = pandas.read_csv(data_source, compression='gzip')
3
0
 kepy97
kepy97
23일 5월 2018 в 11:45
2018-05-23T11:45:25+00:00
더보기
원본
편집
#20551656

다음과 같은 순서로 작동됨 명령 (I 손실됩니다 첫 줄의 데이터 (= 없음 - 아니 헤더입니다 χ02 있지만, 적어도 이 로드되는지):

df = pd.read_csv (파일_이름, ' 우스콜스 = 범위 (0, 42)) 드프스콜럼너스 = [& # 39, YR& # 39, & # 39, MO& # 39, & # 39, DAY& # 39, & # 39, HR& # 39, & # 39, MIN& # 39, & # 39, & # 39, HUND& SEC& # 39, # 39;;

39, & # 39, & # 39, & # 39, ERROR& RECTYPE& LANE& # 39, & # 39,,, # 39, & # 39 CLASS& SPEED& # 39, # 39;;

39, & # 39, & # 39, & # 39, LENGTH& GVW& ESAL& # 39, & # 39,,, # 39, & # 39, & # 39, W1& S1& # 39, & # 39,,, # 39 W2& # 39 S2& # 39;

39, & # 39, & # 39, & # 39, W3& S3& W4& # 39, & # 39,,, # 39, & # 39, & # 39, S4& W5& S5& # 39, & # 39,, # 39, & # 39 S6& W6& # 39, # 39, # 39;;

39, & # 39, & # 39, & # 39, W7& S7& W8& # 39, & # 39,,, # 39, & # 39, & # 39, S8& W9& S9& # 39, & # 39,, # 39, & # 39 S10& W10& # 39, # 39, # 39;;

& # 39, W11& # 39, & # 39, S11& # 39, & # 39, W12& # 39, & # 39, S12& # 39, & # 39, W13& # 39, & # 39, & # 39, # 39 W14& S13& # 39;;;] '

다음과 같은 작동하지 않습니다.

df = pd.read_csv (파일_이름, ' 이름 = [& # 39, YR& # 39, & # 39, MO& # 39, & # 39, DAY& # 39, & # 39, HR& # 39, & # 39, MIN& # 39, & # 39, & # 39, HUND& SEC& # 39, # 39;;

39, & # 39, & # 39, & # 39, ERROR& RECTYPE& LANE& # 39, & # 39,,, # 39, & # 39 CLASS& SPEED& # 39, # 39;;

39, & # 39, & # 39, & # 39, LENGTH& GVW& ESAL& # 39, & # 39,,, # 39, & # 39, & # 39, W1& S1& # 39, & # 39,,, # 39 W2& # 39 S2& # 39;

39, & # 39, & # 39, & # 39, W3& S3& W4& # 39, & # 39,,, # 39, & # 39, & # 39, S4& W5& S5& # 39, & # 39,, # 39, & # 39 S6& W6& # 39, # 39, # 39;;

39, & # 39, & # 39, & # 39, W7& S7& W8& # 39, & # 39,,, # 39, & # 39, & # 39, S8& W9& S9& # 39, & # 39,, # 39, & # 39 S10& W10& # 39, # 39, # 39;;

& # 39, W11& # 39, & # 39, S11& # 39, & # 39, W12& # 39, & # 39, S12& # 39, & # 39, W13& # 39, & # 39, & # 39, # 39 W14& S13& # 39;;;] 우스콜스 = 범위 (0, 42)) '

스파서에로: 토큰 화 데이터 오류. 캜 오류: 걱정했던것 53 필드에 1605634 54 선 · 표면탄성파 (saw) 다음과 같은 작동하지 않습니다.

df = pd.read_csv (파일_이름, ' 헤더입니다 = 없음) '

스파서에로: 토큰 화 데이터 오류. 캜 오류: 걱정했던것 53 필드에 1605634 54 선 · 표면탄성파 (saw)

따라서 이 문제를 전달하십시오 우스콜스 = 범위 (0, 2) '' 합니다.

3
0
 Abhishek
Abhishek
2일 1월 2018 в 9:56
2018-01-02T09:56:48+00:00
더보기
원본
편집
#20551654

사용 'pandas.read_csv (& # 39, CSVFILENAME& # 39, & # 39, & # 39, 9월 = 헤더입니다 = 없음;;)'

csv 데이터 링크를 통해 읽을 수 있도록 할 때

http://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data

난 내 데이터 복사됨 사이트에서 agent. 치프필레. 그래서 & # 39, & # 39 이 공백 = 9월 사용되는 했다. 또한 협력했습니다:)

2
0
 bcoz
bcoz
26일 1월 2018 в 8:54
2018-01-26T20:54:38+00:00
더보기
원본
편집
#20551655

나는 유용할 수 있는 대안이 비슷한 문제를 다루는 모듈을 사용하여 구문 분석 오류뿐만 CSV 에 데이터를 재지정할 df 판다. 예를 들면 다음과 같습니다.

import csv
import pandas as pd
path = 'C:/FileLocation/'
file = 'filename.csv'
f = open(path+file,'rt')
reader = csv.reader(f)

#once contents are available, I then put them in a list
csv_list = []
for l in reader:
    csv_list.append(l)
f.close()
#now pandas has no problem getting into a df
df = pd.DataFrame(csv_list)

다운로드합니까 CSV 파일 등) 로 잘못 포맷됩니다 모듈을 좀 더 강력한 쉼표로 구분된 이 라우트를 문제를 해결하기 위해 이 같은 성공을 거둘 수 없었을 것이다.

2
0
Kims Sifers
Kims Sifers
15일 11월 2017 в 10:59
2017-11-15T10:59:33+00:00
더보기
원본
편집
#20551652

가끔 파이썬 갖추고 있지만, 원시 데이터를 사용하는 방법에 문제가 아니다. 내가 맡을게 오류 메시지

Error tokenizing data. C error: Expected 18 fields in line 72, saw 19.

가끔 쉼표 설명스크립트 열 것으로 드러나 있었다. 즉, CSV 파일 클리닝해야 백업하도록 또는 다른 사용되는 분리자의.

 Aks4125
Aks4125
편집된 답변15일 11월 2017 в 12:13
2
0
 Dirk
Dirk
20일 8월 2019 в 9:37
2019-08-20T09:37:20+00:00
더보기
원본
편집
#20551688

다음 협력했습니다 가져다줄래요 (제가 이 질문에 내가 만약 이 문제가 있기 때문에 특별히 게시하기를 구글 콜라보라토리 노트북):

df = pd.read_csv("/path/foo.csv", delimiter=';', skiprows=0, low_memory=False)
2
0
 Zstack
Zstack
14일 10월 2019 в 2:54
2019-10-14T14:54:07+00:00
더보기
원본
편집
#20551701

비슷한 사람들을 위한 파이썬 3 에 리눅스 운용체계 (os) 문제를 겪고 있다.

pandas.errors.ParserError: Error tokenizing data. C error: Calling
read(nbytes) on source failed. Try engine='python'.

종료기:

df.read_csv('file.csv', encoding='utf8', engine='python')
 double-beep
double-beep
편집된 답변14일 10월 2019 в 3:11
2
0
Kareem Jeiroudi
Kareem Jeiroudi
3일 11월 2019 в 9:35
2019-11-03T09:35:50+00:00
더보기
원본
편집
#20551703

내가 봐도 알 수 있고, 멀리는 이수한 뒤 해당 파일, 문제는 # 39, csv 파일 you& re 로드하려고 시도할 복수의 표. 표 제목에 포함된 줄을 선 또는 비어 있습니다. 가지고 시도하시겠습니까 이걸봐 [스택 오버플로 오토메이티드] (https://stackoverflow.com/questions/34184841/python-pandas-read-csv-file-containing-multiple-tables # 34188535 오토메이티드). 이 프로그램을 통해 얻을 수 있는 방법을 보여줍니다.

이를 사용하여 다른 동적임 외곽진입 약간만이라도 [csv 모듈에서는] (https://docs.python.org/3/library/csv.html), read 모든 단일 행일 추론할 수 있는 경우 한 번에 저회가 정신 점검 / 정규 표현식, 행 (제목 / 헤더입니다 / 가치 / 빈). 한 번 더 할 수 있는 장점이 있습니다 이 방법을 통해 데이터를 파이썬 객체에는 분할합니다 / 덮어쓰기/추가 / 수집하십시오 원하는 대로.

모든 기능을 사용할 수 있는 가장 쉬운 약간만이라도 pd.read_clipboard 수동으로로 선택 및 복사 후 '판다 ()' 이 테이블을 클립보드가, csv excel 에서 열 수 있는 경우 또는 무언가.

    • 무관하지 않다.

또한, , 아무도 이 문제에 대한 산정하지만 브라운아저씨의 언급하십시오 무관하지 않다. 전 그 때 이 같은 문제로 로드중 등 일부 데이터세트를 ['seeds_dataset.txt'] (http://archive.ics.uci.edu/ml/datasets/seeds) 에서 자전거. 제 경우에는 오류 발생 공백 때문에 진정한 탭 '구분' 보다 더 많았던 일부 \t. 지켜보리니 다음과 같은 예를 들어 3 호선

"' 14.38 14.21 0.8951 5.386 3.312 2.462 4.956 1 14.69 14.49 0.8799 5.563 3.259 3.586 5.219 1 14.11 14.1 0.8911 5.42 3.302 2.7 5 1 "' 따라서 '' 를 사용하여 \t+ seperator 패턴 대신에 '\t'. "'파이썬 데이터 = pd.read_csv (& # 39, 경로, 9월 = \t+ '헤더입니다 = 없음) "'

Kareem Jeiroudi
Kareem Jeiroudi
편집된 답변3일 11월 2019 в 10:10
csv — CSV File Reading and Writing — Python 3.10.4 documentation
docs.python.org
UCI Machine Learning Repository: seeds Data Set
archive.ics.uci.edu
1
0
관련 커뮤니티 1
Python - 한인 사회
Python - 한인 사회
8명의 사용자
Python Korean Community. @phpko @js_korea @react_ko @vue_ko @laravel_ko @java_ko
telegram 열기
질문 추가
카테고리
모두
기술
문화/레크리에이션
생활/예술
과학
직업
비즈니스
사용자
すべて
새로운
인기
1
mohidil qodirova
등록된 2일 전
2
Jasur Fozilov
등록된 2일 전
3
Zuxriddin Muydinov
등록된 3일 전
4
Денис Анненский
등록된 5일 전
5
365
등록된 1주 전
DE
EL
ES
FR
ID
IT
JA
KO
NL
PT
RU
SK
TR
ZH
© de-vraag 2022
원본
stackoverflow.com
cc by-sa 3.0 번 면허에 따라 귀속하여.