Criando um Pandas DataFrame a partir de uma matriz Numpy: Como posso especificar a coluna de índice e os cabeçalhos das colunas?

Question

Mais

Question

Criando um Pandas DataFrame a partir de uma matriz Numpy: Como posso especificar a coluna de índice e os cabeçalhos das colunas?

Eu tenho uma matriz Numpy que consiste em uma lista de listas, representando uma matriz bidimensional com rótulos de linhas e nomes de colunas, como mostrado abaixo:

data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])

I'gostaria que o DataFrame resultante tivesse Row1 e Row2 como valores de índice, e Col1, Col2 como valores de cabeçalho

Eu posso especificar o índice da seguinte forma:

df = pd.DataFrame(data,index=data[:,0]),

no entanto, não tenho a certeza da melhor forma de atribuir cabeçalhos de coluna.

pandas

numpy

Solution / Answer

Jagannath Banerjee

12º julho 2018 в 2:28

Mais

Esta é uma solução fácil de entender

import numpy as np
import pandas as pd

# Creating a 2 dimensional numpy array
>>> data = np.array([[5.8, 2.8], [6.0, 2.2]])
>>> print(data)
>>> data
array([[5.8, 2.8],
       [6. , 2.2]])

# Creating pandas dataframe from numpy array
>>> dataset = pd.DataFrame({'Column1': data[:, 0], 'Column2': data[:, 1]})
>>> print(dataset)
   Column1  Column2
0      5.8      2.8
1      6.0      2.2

Jaroslav Bezděk

Resposta editada :em

64

0

ryanjdillon

6º fevereiro 2016 в 7:15

Mais

Eu concordo com Joris; parece que você deveria estar fazendo isso de maneira diferente, como com arrays de registros numéricos. Modificando " opção 2" a partir esta grande resposta, você poderia fazer isso assim:

import pandas
import numpy

dtype = [('Col1','int32'), ('Col2','float32'), ('Col3','float32')]
values = numpy.zeros(20, dtype=dtype)
index = ['Row'+str(i) for i in range(1, len(values)+1)]

df = pandas.DataFrame(values, index=index)

Community

Resposta editada :em

24

0

Comunidades relacionadas 3

Pt-BR Data Science & Python

5 045 utilizadores

Abrir telegram

Python Coding Brazil

308 utilizadores

Programação Python. Python Programming. ***************************** ➸ Pentest Brazil Group (pt_BR) http://t.me/pentestbrazilgroup ➸ Pentest Brazil Channel (pt_BR) http://t.me/pentestbrazilchannel

Abrir telegram

Python Brasil

198 utilizadores

Bem vindos a comunidade do python Brasil! oficial do Telegram! 13/05/20

Abrir telegram

Adicionar pergunta

Categorias

Todos

Tecnologia

Cultura / Recreação

Vida / Artes

Ciência

Profissional

Negócios

Utilizadores

Todos

Novo

Popular

1

Ксения Комарова

Registrado há 3 semanas

2

Артур «Апер»

Registrado há 2 meses

3

Viktor Malyutin

Registrado há 2 meses

4

Viktor Malyutin

Registrado há 2 meses

5

Syahputra Zhedenk

Registrado há 2 meses

Tem uma pergunta? Adicione-a no sítio e obtenha uma resposta instantânea

pt.kzen.dev

behzad.nouri · Accepted Answer · 2013-12-24T15:50:14+00:00

Você precisa especificar dados, index e colunas para DataFrame construtor, como em:

>>> pd.DataFrame(data=data[1:,1:],    # values
...              index=data[1:,0],    # 1st column as index
...              columns=data[0,1:])  # 1st row as the column names

edit: como no comentário @joris, você pode precisar mudar acima para np.int_(data[1:,1:]) para ter o tipo de dados correto.