CUDA QuickSort in kernel RECALL

Ik moet het soort probleem oplossen met behulp van (Snel sorteren), dus mijn probleem is wanneer ik probeer de code uit te voeren, veel fouten verschijnen voor mij, maar de belangrijkste fout is wanneer ik de Kernel QuickSort terughaal, omdat de kernel zichzelf tweemaal belt, dus hoe kan ik dit probleem oplossen, onder mijn code, zodat iemand mij kan helpen.

Opmerking: ik ben nieuw bij het programmeren in cuda.

__global__ void QuickSort(int p, int r,char *c)
{
    if (p < r)

    {   int q = Partition(p, r, c);
                QuickSort<<<5,5>>>(p, q-1,c); 
                QuickSort<<<5,5>>>(q+1, r,c);   

    }
}
0
ja ru de
Als u nog niet bekend bent met CUDA-programmering, begin dan met iets eenvoudiger dan parallelle sortering. Wat je hebt geschreven, zal niet werken en slaat absoluut nergens op.
toegevoegd de auteur talonmies, de bron
Welke GPU gebruikt u? Het ding dat je probeert te doen heet Dynamic Parallelism (Een kernel in een kernel aanroepen) alleen beschikbaar op apparaten van Compute Capability 3.5 (momenteel alleen NVIDIA Tesla K20 en K20x).
toegevoegd de auteur sgarizvi, de bron
mijn nvidia-kaart is GEFORCE (GT 650M * 2GB), hoe kan ik de quicksort op dit apparaat in cuda oplossen. bedankt voor je herhaling.
toegevoegd de auteur Suno87, de bron

1 antwoord

Uw GPU-kaart (rekencapaciteit 3.0) ondersteunt geen dynamisch parallellisme, waarvoor rekencapaciteit 3.5 of hoger vereist is. Dynamic Parallelism is om de recursieve methode te ondersteunen met nieuw toegewezen hulpmiddel in de GPU. Een Quicksort-algoritme met cuda-implementatie en informantie van Dynamic Parallelism worden hier getoond http://blogs.nvidia.com/2012/09/how-tesla-k20-speeds-up-quicksort-a-familiar-comp-sci-code/ .

In uw GPU, stel ik echter voor een andere manier te gebruiken om de QuickSort te implementeren, omdat de implementatie in de bovenstaande link alleen maar is om de voordelen van dynamisch parallellisme te demonstreren in plaats van een algoritme met topprestaties weer te geven. U kunt dit document raadplegen "GPU-Quicksort A Practical Quicksort Algorithm for Graphics Processors" voor betere prestaties met uw kaart.

1
toegevoegd