Correct gebruik van het gebruik van de "cor" -functie in R

Ik ben benieuwd wat een goede x (vector matrix of dataframe) invoer eruit ziet. Ik gebruik de functie momenteel in twee verschillende soorten matrices. Ik weet echter niet zeker hoe R mijn gegevens zou interpreteren op de manier die ik van plan ben. Ik zal de soorten matrix als voorbeeld toelichten.

Type 1

           Gene1 Gene2 Gene3
    sample1
    sample2

Type 2

          Sample1 Sample2 Sample3
gene 1
gene 2
gene 3

Zijn deze formaten geldig voor x-parameters? Ik heb beide soorten matrices ingevoerd en een aantal resultaten geboekt, maar zonder te weten of dit een juiste gebruik van de functie is, zijn dit gewoon willekeurige getallen. Bedankt voor je tijd. Het spijt me dat dit niet interessanter is.

0

1 antwoord

Wanneer X een matrix is, zal cor (X) een vierkante correlatiematrix produceren met het aantal rijen en kolommen gelijk aan het aantal kolommen in de oorspronkelijke matrix. Met andere woorden, cor produceert correlaties tussen de kolommen in de matrix. Hier is een eenvoudig voorbeeld:

> x <- rnorm(5)
> y <- rnorm(5)
> cbind(x,y)
            x        y
[1,]  1.67287  1.70663
[2,] -1.23120  0.56948
[3,]  0.67538 -0.20596
[4,] -1.21077  0.11648
[5,]  0.60409  1.15405

> cor(cbind(x,y))
        x       y
x 1.00000 0.56329
y 0.56329 1.00000

beantwoordt dat jouw vraag?

7
toegevoegd
Het maakt niet echt uit hoe u uw gegevens bij elkaar zet - het moet u duidelijk zijn door de documentatie en Jason's voorbeeld dat het een correlatiematrix zal maken van de correlatie tussen de kolommen van de gegevens.
toegevoegd de auteur Dason, de bron
@order Probeer rbind uit; het moet in het geval van het bovenstaande voorbeeld een 5-bij-5 matrix van 1 en -1 teruggeven. Zeker niet wat je zoekt.
toegevoegd de auteur Jason Morgan, de bron
Ik denk dat je weet wat ik wil weten. Is het nodig dat de kolommen variabelen zijn en de rijen voorbeelden hiervoor correcte gegevens opleveren? In wezen zou het logisch zijn als u een rbind() gebruikt in plaats van een cbind() of zou dit ertoe leiden dat de uitvoer rotzooi is?
toegevoegd de auteur order, de bron
@Dason Ik heb de documentatie gelezen en heb niet begrepen dat de vergelijking kolomgewijs is gedaan; Ik kan nu zien dat duidelijk wordt vermeld in de documentatie. Ik ben er zeker van dat je ooit een stuk documentatie niet hebt kunnen absorberen.
toegevoegd de auteur order, de bron