Frequentemente encontro esta estranha tag CDATA
em arquivos XML
:
<![CDATA[some stuff]]>
Tenho observado que esta tag CDATA
vem sempre no início, e depois seguida por algumas coisas.
Mas às vezes é usado, às vezes não. Presumo que seja para marcar que "algumas coisas" é o "data" que será inserido depois disso. Mas que tipo de dados são algumas coisas
? Nada que eu escreva em tags XML é algum tipo de dado?
CDATA significa Character Data e significa que os dados entre essas cordas incluem dados que poderiam ser interpretados como marcação XML, mas não devem ser.
As principais diferenças entre a CDATA e os comentários são:
]]>
(CDEnd
), enquanto em um comentário --
é inválido.Isto significa que, dado estes três trechos de XML a partir de um documento bem formado:
<!ENTITY MyParamEntity "Has been expanded">
<!--
Within this comment I can use ]]>
and other reserved characters like <
&, ', and ", but %MyParamEntity; will not be expanded
(if I retrieve the text of this node it will contain
%MyParamEntity; and not "Has been expanded")
and I can't place two dashes next to each other.
-->
<![CDATA[
Within this Character Data block I can
use double dashes as much as I want (along with <, &, ', and ")
*and* %MyParamEntity; will be expanded to the text
"Has been expanded" ... however, I can't use
the CEND sequence. If I need to use CEND I must escape one of the
brackets or the greater-than sign using concatenated CDATA sections.
]]>
<description>An example of escaped CENDs</description>
<!-- This text contains a CEND ]]> -->
<!-- In this first case we put the ]] at the end of the first CDATA block
and the > in the second CDATA block -->
<data><![CDATA[This text contains a CEND ]]]]><![CDATA[>]]></data>
<!-- In this second case we put a ] at the end of the first CDATA block
and the ]> in the second CDATA block -->
<alternative><![CDATA[This text contains a CEND ]]]><![CDATA[]>]]></alternative>