Création d'un DataFrame Pandas à partir d'un tableau Numpy : Comment spécifier la colonne d'index et les en-têtes de colonne ?

Question

Détails

Question

Création d'un DataFrame Pandas à partir d'un tableau Numpy : Comment spécifier la colonne d'index et les en-têtes de colonne ?

J'ai un tableau Numpy composé d'une liste de listes, représentant un tableau bidimensionnel avec des étiquettes de lignes et des noms de colonnes comme indiqué ci-dessous :

data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]])

Je voudrais que le DataFrame résultant ait Row1 et Row2 comme valeurs d'index, et Col1, Col2 comme valeurs d'en-tête.

Je peux spécifier l'index comme suit :

df = pd.DataFrame(data,index=data[:,0]),

mais je ne suis pas sûr de la meilleure façon d'attribuer les en-têtes de colonne.

Georgy

Question modifiée 17 avril 2018 в 12:53

Programmation

python

pandas

numpy

Solution / Réponse

Jagannath Banerjee

12 juillet 2018 в 2:28

Détails

Voici une solution facile à comprendre

import numpy as np
import pandas as pd

# Creating a 2 dimensional numpy array
>>> data = np.array([[5.8, 2.8], [6.0, 2.2]])
>>> print(data)
>>> data
array([[5.8, 2.8],
       [6. , 2.2]])

# Creating pandas dataframe from numpy array
>>> dataset = pd.DataFrame({'Column1': data[:, 0], 'Column2': data[:, 1]})
>>> print(dataset)
   Column1  Column2
0      5.8      2.8
1      6.0      2.2

Jaroslav Bezděk

Réponse modifiée 7 août 2019 в 8:34

64

0

ryanjdillon

6 février 2016 в 7:15

Détails

Je suis d'accord avec Joris ; il semble que vous devriez faire cela différemment, comme avec [numpy record arrays][1]. En modifiant l'" option 2 " de cette excellente réponse, vous pourriez procéder comme suit :

import pandas
import numpy

dtype = [('Col1','int32'), ('Col2','float32'), ('Col3','float32')]
values = numpy.zeros(20, dtype=dtype)
index = ['Row'+str(i) for i in range(1, len(values)+1)]

df = pandas.DataFrame(values, index=index)

[1] : http://docs.scipy.org/doc/numpy-1.10.1/user/basics.rec.html

Community

Réponse modifiée 23 mai 2017 в 12:26

24

0

Communautés apparentées 2

Python en français

1 948 utilisateurs

Grupe à propos du language de programmation Python où on parle Français.

Ouvrir telegram

Python 🇨🇵

100 utilisateurs

Un groupe de Python en français. @Linux_Fr

Ouvrir telegram

Ajouter une question

Catégories

Toutes

Technologie

Culture / Loisirs

Vie / Arts

Science

Professionnel

Entreprises

Utilisateurs

Tous

Nouveau

Populaire

1

Ксения Комарова

Enregistré il y a 2 semaines

2

Артур «Апер»

Enregistré il y a 1 mois

3

Viktor Malyutin

Enregistré il y a 2 mois

4

Viktor Malyutin

Enregistré il y a 2 mois

5

Syahputra Zhedenk

Enregistré il y a 2 mois

Do you have a question? Add it on the site and get an answer instantly

en.kzen.dev

behzad.nouri · Accepted Answer · 2013-12-24T15:50:14+00:00

Vous devez spécifier data, index et columns au constructeur de DataFrame, comme dans :

>>> pd.DataFrame(data=data[1:,1:],    # values
...              index=data[1:,0],    # 1st column as index
...              columns=data[0,1:])  # 1st row as the column names

edit : comme dans le commentaire de @joris, vous devrez peut-être changer ce qui précède en np.int_(data[1 :,1 :]) pour avoir le bon type de données.