terwijl de HTML wordt ontleed met behulp van NSXMLParser, niet met volledige gegevens op de iPhone

tijdens het parseren van de xml, is het niet de bedoeling dat volledige gegevens achter een woord aan het einde van de regel komen met meer lezen

hieronder drie codes staan ​​in een enkele html-pagina die ik heb gebruikt voor een beter begrip.

i am parsing this in to my iPhone app using NSXMLParser. problem is its parsing till

below then it stops parsing from the text after that and completely ignores the data below the text!!!
<head>

        <title>North Mobile County Middle School: Latest News > "1st Annual NMCK-8 Christmas Music Program"</title>
        <meta HTTP-EQUIV="X-UA-COMPATIBLE" CONTENT="IE=EmulateIE9">
        <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
        <meta http-equiv="imagetoolbar" content="no">
        <script type="text/javascript" src="JavaScripts.js"></script>
        <script type="text/javascript" src="JavaScripts/NiceTitles.js"></script>


    

ik splits de code voor beter begrip

!--

body {
    margin:0; padding:0;
    background: #fff;}  
body, td {
    font: normal 13px "Trebuchet MS", Arial, Helvetica, sans-serif;
    color:#333;}
/***********************************************/
/* Links
/***********************************************/ 

a:link, a:visited {
    color: #CD0000;
    text-decoration: none;}
a:hover, a:active { 
    color: #06f;
    text-decoration: underline;}

img {border: 0;}

ik splits de code voor beter begrip

#MainPageArea {padding: 0 15px 15px 15px}

    <link href="http://images.pcmac.org/SiSFiles/Schools/AL/MobileCounty/NorthMobileMiddle/styles.css" rel="stylesheet" type="text/css">
    <!--[if lt IE 7]>
        <link href="Common/CommonIncludes/Template11/IEStyles.css" rel="stylesheet" type="text/css">
    
0
ja ru de
zijn HTML, ya zijn lezingsgegevens tot de tekst in het midden maar niet daarna
toegevoegd de auteur Pradeep Kumar, de bron
ik heb geen idee over XML-checker
toegevoegd de auteur Pradeep Kumar, de bron
Is uw bestand goed gevormde XML?
toegevoegd de auteur Thilo, de bron
Kun je het door een XML-checker leiden?
toegevoegd de auteur Thilo, de bron

2 antwoord

You should only use the NSXMLParser class to parse stuff that’s actually XML. HTML is not, except if it’s XHTML, which your source is not: The meta tags aren’t closed and your style tag starts with a comment that is never closed (which, I guess, is the reason why the parser never reads past that); also, the title’s text node contents should only contain escaped versions of > and " (the escape sequences being > and ").

Als u de controle over de HTML hebt, kunt u proberen deze te wijzigen zodat deze compatibel is met XML- (en dus XHTML-). Als u de HTML niet kunt wijzigen, probeert u soep-parsing te taggen, bijvoorbeeld met hpple .

1
toegevoegd

Here is the tutorial for Parsing HTML page http://www.raywenderlich.com/14172/how-to-parse-html-on-ios

0
toegevoegd