Ik heb 30 csv-gegevensbestanden van 30 herhaalde runs van een experiment dat ik heb uitgevoerd. Ik gebruik de functie read_csv()
van panda's om de gegevens in een lijst met DataFrames te lezen. Ik zou graag een enkel DataFrame uit deze lijst willen maken, met daarin het gemiddelde van de 30 DataFrames voor elke kolom. Is er een ingebouwde manier om dit te bereiken?
Ter verduidelijking, ik zal het voorbeeld in de onderstaande antwoorden toelichten. Stel dat ik twee DataFrames heb:
>>> x
A B C
0 -0.264438 -1.026059 -0.619500
1 0.927272 0.302904 -0.032399
2 -0.264273 -0.386314 -0.217601
3 -0.871858 -0.348382 1.100491
>>> y
A B C
0 1.923135 0.135355 -0.285491
1 -0.208940 0.642432 -0.764902
2 1.477419 -1.659804 -0.431375
3 -1.191664 0.152576 0.935773
Wat is de samenvoegfunctie die ik zou moeten gebruiken om een 3D-array van soorten te maken met het DataFrame? b.v.
>>> automagic_merge(x, y)
A B C
0 [-0.264438, 1.923135] [-1.026059, 0.135355] [-0.619500, -0.285491]
1 [ 0.927272, -0.208940] [ 0.302904, 0.642432] [-0.032399, -0.764902]
2 [-0.264273, 1.477419] [-0.386314, -1.659804] [-0.217601, -0.431375]
3 [-0.871858, -1.191664] [-0.348382, 0.152576] [ 1.100491, 0.935773]
dus ik kan het gemiddelde, s.e.m., etc. op die lijsten berekenen in plaats van de hele kolom.