Используйте .corr для получения корреляции между двумя столбцами

Редактировал ответ 30-го августа 2018 в 3:14

ibozkurt79

29-го августа 2018 в 11:15

Дополнительно

Мое решение будет после преобразования данных числового типа:

Top15[['Citable docs per Capita','Energy Supply per Capita']].corr()

fantaghirocco

4

Редактировал ответ 10-го мая 2018 в 1:44

aumpen

5-го мая 2018 в 11:22

Дополнительно

Когда вы называете это:

data = Top15[['Citable docs per Capita','Energy Supply per Capita']]
correlation = data.corr(method='pearson')

Так, Таблицы Данных.СОГГ() функция выполняет парных корреляций, у вас есть четыре пары с двумя переменными. Так что, в принципе, вы получаете значения по диагонали, как автоматической корреляции (корреляция с себя два значения, поскольку у вас есть две переменные), а другие два значения перекрестных корреляций одна против другой и наоборот.

Либо выполнить корреляцию двух серий, чтобы получить одно значение:

from scipy.stats.stats import pearsonr
docs_col = Top15['Citable docs per Capita'].values
energy_col = Top15['Energy Supply per Capita'].values
corr , _ = pearsonr(docs_col, energy_col)

или, если вы хотите, чтобы одно значение из одной и той же функции (таблицы данных'ы СОГГ):

single_value = correlation[0][1]

Надеюсь, что это помогает.

aumpen

3

Редактировал ответ 16-го октября 2018 в 10:26

Orca

16-го октября 2018 в 9:46

Дополнительно

Работает это так:

Top15['Citable docs per Capita']=np.float64(Top15['Citable docs per Capita'])

Top15['Energy Supply per Capita']=np.float64(Top15['Energy Supply per Capita'])

Top15['Energy Supply per Capita'].corr(Top15['Citable docs per Capita'])

Rahul

2

mgoldwasser

1-го сентября 2017 в 6:34

Дополнительно

Если вам нужны корреляции между всеми парами столбцов, вы можете сделать что-то вроде этого:

import pandas as pd
import numpy as np

def get_corrs(df):
    col_correlations = df.corr()
    col_correlations.loc[:, :] = np.tril(col_correlations, k=-1)
    cor_pairs = col_correlations.stack()
    return cor_pairs.to_dict()

my_corrs = get_corrs(df)
# and the following line to retrieve the single correlation
print(my_corrs[('Citable docs per Capita','Energy Supply per Capita')])

1

Похожие сообщества 30

Python beginners

14 568 пользователей

Вопросы про Python для чайников. Cпам и троллинг неприемлем. Частозадаваемые вопросы: https://github.com/ru-python-beginners/faq/blob/master/README.md Правила группы: https://t.me/ru_python_beginners/2752736

Python

13 656 пользователей

Уютный чат для профессионалов, занимающихся поиском питоньих мудростей. Как не получить бан: https://t.me/ru_python/1961404

🐍 Python Stepik Chat

11 621 пользователей

Этот уютный чат создан для помощи в решение задач на прекрасном курсе "Поколение Python: курс для начинающих" и не только. Правила: https://t.me/pythonstepikchat/619142 Чат для оффтопа - t.me/+fqNb78zlQY81NGUy Наш канал - @kimport_this

Вакансии для Python-разработчиков / Python Jobs

6 970 пользователей

Как разместить вакансию? — https://t.me/ru_pythonjobs/21926 Размещение вакансий бесплатно. Только Python. Рекламы нет.

Python — вакансии и аналитика

6 933 пользователей

Публикуем вакансии и запросы на поиск работы по направлению Python, Flask и т.д. Здесь всё: full-time, part-time, remote и разовые подработки. См. также: @golang_jobs, @qa_jobs, @devops_jobs, @javascript_jobs, @nodejs_jobs, @uiux_jobs, @products_jobs

Сообщество Python Программистов

5 722 пользователей

Канал: @pip_install Наши сайты: https://python-scripts.com https://selenium-python.com https://itfy.org Мы в ВК: https://vk.com/open_sourcecode Вакансии: https://t.me/python_scripts_hr

Зарегистрирован 3 недели назад

Добавить вопрос

Категории

Все

Технологий

Культура / Отдых

Жизнь / Искусство

Наука

Профессии

Бизнес

Пользователи

1

2

Артур «Апер»

3

Viktor Malyutin

4

Viktor Malyutin

5

Syahputra Zhedenk