Atšķirstīt (sadalīt) virkni C++ valodā, izmantojot virknes norobežotāju (standarta C++)

Question

Vairāk

Question

Atšķirstīt (sadalīt) virkni C++ valodā, izmantojot virknes norobežotāju (standarta C++)

Es analizēju virkni C++ valodā, izmantojot šādu:

string parsed,input="text to be parsed";
stringstream input_stringstream(input);

if(getline(input_stringstream,parsed,' '))
{
     // do some processing.
}

Parsēšana ar vienu simbolu norobežotāju ir kārtībā. Bet ko darīt, ja es gribu kā norobežotāju izmantot virkni.

Piemērs: Es gribu sadalīt:

scott>=tiger

ar >= kā norobežotāju, lai es varētu iegūt scott un tiger.

Lightness Races with Monica

Rediģēts jautājums 24priekšpusdienari3t maijā 2018 в 9:59

Programmēšana

c++

parsing

split

Popular videos

« Iepriekšējais

Nākamais »

Solution / Answer

ryanbwork

10pēcpusdienari3t janvārī 2013 в 7:18

Vairāk

strtok ļauj ievadīt vairākus simbolus kā norobežotājus. Ja jūs ievadītu ">=", jūsu piemēra virkne tiktu sadalīta pareizi (lai gan > un = tiek uzskatīti par atsevišķiem norobežotājiem).

EDIT, ja nevēlaties izmantot c_str(), lai pārvērstu virkni par har*, varat izmantot substr un find_first_of, lai tokenizētu.

string token, mystring("scott>=tiger");
while(token != mystring){
  token = mystring.substr(0,mystring.find_first_of(">="));
  mystring = mystring.substr(mystring.find_first_of(">=") + 1);
  printf("%s ",token.c_str());
}

ryanbwork

Rediģēta atbilde 10pēcpusdienari3t janvārī 2013 в 7:49

15

0

Benjamin Lindley

10pēcpusdienari3t janvārī 2013 в 7:40

Vairāk

Es izmantoju boost::tokenizer. Šeit'ir dokumentācija, kurā izskaidrots, kā izveidot atbilstošu tokenizera funkciju: http://www.boost.org/doc/libs/1_52_0/libs/tokenizer/tokenizerfunction.htm.

Šeit ir viens, kas darbojas tavā gadījumā.

struct my_tokenizer_func
{
    template<typename It>
    bool operator()(It& next, It end, std::string & tok)
    {
        if (next == end)
            return false;
        char const * del = ">=";
        auto pos = std::search(next, end, del, del + 2);
        tok.assign(next, pos);
        next = pos;
        if (next != end)
            std::advance(next, 2);
        return true;
    }

    void reset() {}
};

int main()
{
    std::string to_be_parsed = "1) one>=2) two>=3) three>=4) four";
    for (auto i : boost::tokenizer<my_tokenizer_func>(to_be_parsed))
        std::cout << i << '\n';
}

3

0

Pievienot jautājumu

Kategorijas

Viss

Tehnoloģija

Kultūra / atpūta

Dzīve / Māksla

Zinātne

Profesionāls

Uzņēmējdarbība

Lietotāji

Visi

Jauns

Populārs

1

Ксения Комарова

Reģistrēts pirms 1 mēneša

2

Артур «Апер»

Reģistrēts pirms 2 mēnešiem

3

Viktor Malyutin

Reģistrēts pirms 2 mēnešiem

4

Viktor Malyutin

Reģistrēts pirms 2 mēnešiem

5

Syahputra Zhedenk

Reģistrēts pirms 2 mēnešiem

Do you have a question? Add it on the site and get an answer instantly

en.kzen.dev

Vincenzo Pii · Accepted Answer · 2013-01-10T19:53:17+00:00

Varat izmantot funkciju std::string::find(), lai atrastu virknes norobežotāja pozīciju, un pēc tam izmantot std::string::substr(), lai iegūtu marķieri.

Piemērs:

std::string s = "scott>=tiger";
std::string delimiter = ">=";
std::string token = s.substr(0, s.find(delimiter)); // token is "scott"

Funkcija find(const string& str, size_t pos = 0) atgriež pirmā str atkārtojuma pozīciju virknē vai npos, ja virkne nav atrasta.
Funkcija substr(size_t pos = 0, size_t n = npos) atgriež objekta apakšrindu, kas sākas pozīcijā pos un kuras garums ir npos.

Ja jums ir vairāki norobežotāji, pēc viena marķiera iegūšanas varat to noņemt (ieskaitot norobežotāju), lai turpinātu turpmāko iegūšanu (ja vēlaties saglabāt sākotnējo virkni, vienkārši izmantojiet s = s.substr(pos + delimiter.length());):

s.erase(0, s.find(delimiter) + delimiter.length());

Šādā veidā jūs varat viegli izveidot cilpu, lai iegūtu katru žetonu.

Pilns piemērs

std::string s = "scott>=tiger>=mushroom";
std::string delimiter = ">=";

size_t pos = 0;
std::string token;
while ((pos = s.find(delimiter)) != std::string::npos) {
    token = s.substr(0, pos);
    std::cout << token << std::endl;
    s.erase(0, pos + delimiter.length());
}
std::cout << s << std::endl;

Izvades rezultāti:

scott
tiger
mushroom