GVKun编程网logo

用于将HTML4转换为XHTML的PHP库?(html4改成html5)

22

对于想了解用于将HTML4转换为XHTML的PHP库?的读者,本文将提供新的信息,我们将详细介绍html4改成html5,并且为您提供关于HTML基本语法方便刚开始学习html的朋友_HTML/Xht

对于想了解用于将HTML4转换为XHTML的PHP库?的读者,本文将提供新的信息,我们将详细介绍html4改成html5,并且为您提供关于HTML 基本语法 方便刚开始学习html的朋友_HTML/Xhtml_网页制作、Html,sHtml,XHtml区别分析小结_HTML/Xhtml_网页制作、html,xhtml,xml的区别介绍_HTML/Xhtml_网页制作、HTML4,XHTML,HTML5之间的纠葛的有价值信息。

本文目录一览:

用于将HTML4转换为XHTML的PHP库?(html4改成html5)

用于将HTML4转换为XHTML的PHP库?(html4改成html5)

我需要在 PHP5中将HTML4输入转换为有效的XHTML(严格)以进行进一步处理(例如SAX).有什么建议?

解决方法

PHP Tidy extension应该能够完成这项工作.

这是一篇很好的文章:Tidying up your HTML with PHP 5.

HTML 基本语法 方便刚开始学习html的朋友_HTML/Xhtml_网页制作

HTML 基本语法 方便刚开始学习html的朋友_HTML/Xhtml_网页制作

1.1一般标记
  一般标记是由一个起始标记(opening tag)和一个结束标记(ending tag)所组成,其语法为:受控文字
  其中,x代表标记名称。就如同一组开关:起始标记为开启(on)的某种功能,而结束标记(通常为起始标记加上一个斜线/)为关(off)功能,受控制的文字信息便放在两标记之间。例如:这是斜体字
  标记之中还可以附加一些属性(attribute),用来完成某些特殊效果或功能。例如:受控文字
  其中,a1,a2,...,an为属性名称,而v1,v2,...,vn则是其所对应的属性值,属性值加不加引号,目前所使用的浏览器都可接受,但依据w3c的新标准,属性值是要加引号的,所以最好养成加引号得习惯。
  1.2 空标记
  虽然大部分的标记是成双成对出现的,但也有一些是单独存在的。这些单独存在的标记称为空标记(empty tags)。其与法为:
  同样,空标记也可以附加一些属性(attribute),用来完成某些特殊效果或功能。如:,例如:


,
等。
  w3c定义的新标准(xhtml1.0/html4.0)建议:空标记应以/结尾,即:
  如果附加属性则为:
  目前所使用的浏览器对于空标记后面是否要加/并没有严格要求,即在空标记最后在/和没有加/,不影响其功能。但是如果希望你的文件能满足最新标准,那么最好加上/。

  2. html标记分类
  2.1文件结构标记(document structure tags)
  此类标记的目的是用来标示出文件的结构,主要的有:
  ...:标示html文件的起始和终止。
  ...:标示出文件标题区。
  ...:标示出文件主体区
  2.2区段格式标记(block formatting tags)
  此类标记的主要用途是将html文件中得某个区段文字,以特定格式显示,增加文件的可看度。主要的有:
  ...:文件题目。
  ...:i=1,2,...,6,网页标题。
  
:产生水平线。
  
:强迫换行。
  

...

:文件段落。
  
...
登录后复制
:以原始格式显示。
  
...
:标注联络人姓名、电话、地址等信息。
  
...
:区段引用标记。
  2.3字符格式标记(Character Formatting Tags)
  用来改变HTML文件文字的外观,增加文件的美观程度。主要有:
  ...:粗体字。
  ...:斜体字。
  ...:打字体。
  ...:改变字体设置。
  
...
:居中对齐。
  ...:文字闪烁。
  ...:加大字号。
  ...:缩小字号。
  ...:参照。
  2.4列表标记(List Tags)
  
    ...
:无编号列表。
  
    ...有编号列表。
      
  1. ...
  2. :列表项目。
      
    ...
    :定义式列表。
      
    ...
    :定义项目。
      
    ...
    :定义项目。
      ...:目录式列表。
      ...:菜单式列表。
      2.5链接标记(Anchor Tag)
      链接可以说是html超文本文件的命脉,html通过链接标记来整合分散在世界各地的图、文、影、音等信息。此类标记的主要用途为标示超文本文件链接(Hypertext Link),主要有:
    ...:建立超级链接。
      2.6多媒体标记(Multimedia Tag)
      此类标记用来显示图像数据。主要有:
      HTML 基本语法 方便刚开始学习html的朋友_HTML/Xhtml_网页制作:嵌入图像。
      :嵌入多媒体对象。
      :背景音乐。
      2.7表格标记(Table Tags)
      此类标记用制作表格。主要有:
      ...
    :定义表格区段。
      ...:表格标题。
      ...:表头。
      ...:表格列。
      ...:表格单元格。
      2.8表单标记(Form Tags)
      此类标记用来制作交互式表单,主要的有:
      
    ...
    :表明表单区段的开始与结束。
      :产生单行文本框、单选按钮、复选框等。
      :产生多行输入文本框。
      :标明下拉列表的开始与结束。
      :在下拉列表中产生一个选择项目。
      HTML标记并没有大小写之分,即和是相同的。以下来分别介绍这些标记。

      3. 文件结构标记
      一个html文件的结构基本上可以分为两部分,一部分称为标题区(Head Section);另一部分称为主体区(Body Section)。文件结构标记就是用来标示出何处属于标题,何处属于主体。
      3.1:标示整份文件
      用途:标示整篇html文件
      说明:一个标准的html文件是一篇以开头,而以结束的文件。即:
      
      ... html文件全文
      
      3.2:标示出文件标题区
      说明:html文件中,由和所夹住的区域称为文件的标题区。通常head区段都内含在html区段之中,即:
      
      
      ...... html文件标题区
      
      .....
      
      3.3:网页标题
      .....是html文件标题区中最重要也是最常用的标记。其他标题区的标记还包括等。
      标记的用途是设置网页标题,这个标题会显示在浏览器窗口的标题栏上,不会出现在浏览器的页面(page)文字中。而大部分浏览器的收藏(My Favorites)、书签(BookMark)或历史记录列表(History List)功能,也都是以这个文件的标题作为名称的。<br>  由<title>...所标注的文字并无长度的限制,不过太长的标题,有时可能会被截掉,并且也不容易记忆。
      3.4:标示出文件主体区
      说明:在html文件中,由...所夹住的区域称为文件的主体区,通常是在区段之后。
      3.5标记的属性
    backgroud属性:
    这个属性可以指定一个图形文件(一般为gif或jpeg),作为背景图案。该图形会像拼瓷砖一样铺成整个网页的底图。

Html,sHtml,XHtml区别分析小结_HTML/Xhtml_网页制作

Html,sHtml,XHtml区别分析小结_HTML/Xhtml_网页制作

例如:这个没有结束符浏览器也认识

shtml基于Server Side Include(ssi) ,当有服务器端可执行脚本时候被当做一种动态编程语言看待,可以include,当不包含服务器端脚本时候和html没区别

xhtml基本w3c标准,遵循严格的xml格式,可以认为是一种html向xml的过渡,语法格式要求严格

xhtml

必须有

结束符(所有元素必须关闭)

xhtml

(正确嵌套)

xhtml属性要用双引号括起来

xhtml区分大小写,标签的属性和值都是小写

xhtml用id替代name属性

html,xhtml,xml的区别介绍_HTML/Xhtml_网页制作

html,xhtml,xml的区别介绍_HTML/Xhtml_网页制作

发展趋势:

html(超文本标记语言)——xhtml(可扩展性超文本标记语言)——xml(可扩展性标记语言);

html:

1.对大小写不敏感;

2.标签不必成对出现;

3.
;

xhtml:

1.对大小写敏感,必须是小写的;

2.标签必须成对出现,有开始标签就必须有结束标签;

3.属性值必须在引号之内;

4.不支持属性最小化:

eg:正确:

错误:

5.name属性不赞成使用,以后会被淘汰;

6.空元素也要结束标签:如:
,


(水平分割线)

xml:

html最终会发展到xml,xhtml是html想xml发展的一个过渡,xhtml的特性也适合xml;

HTML4,XHTML,HTML5之间的纠葛

HTML4,XHTML,HTML5之间的纠葛

我来从HTML的历史谈谈他们3者的区别。

在HTML的早期发展中,W3C成立之前,很多标准的制定都是在浏览器的开发者们互相讨论的情况下完成的,比如HTML 2.0, 3.2直到4.0, 4.01,这些标准大部分都是所谓的retro-spec,即先有实现后有标准。在这种情况下,HTML标准不是很规范,浏览器也对HTML页面中的错误相当宽容。这反过来又导致了HTML作者写出了大量的含有错误的HTML页面。据说,时至今日web上99%的页面都含有HTML错误。

W3C随后意识到了这个问题,并认为这是互联网的一个基础性问题,应该加以解决。为了规范HTML,W3C结合XML制定了XHTML 1.0标准,这个标准没有增加任何新的tag,只是按照XML的要求来规范HTML,并定义了一个新的MIME type,application/xhtml+xml。W3C的初衷是对这个MIME type浏览器要实行强错误检查,既如果页面有HTML错误,就要显示错误信息。但是由于已有的web页面中已经有了大量的错误,很多开发者拒绝使用新的MIME type。W3C不得已,在XHTML 1.0的标准之后加了一个附录C,允许开发者使用XHTML语法来写页面,同时使用旧的MIME type,application/html,来分发页面。这个旧的MIME type不会触发浏览器的强错误检查。这就是我们今天看到的情况,很多网站宣称自己遵守XHTML 1.0标准,那只不过是说,他的页面中用了XHTML语法,但并不能保证完全没有错误。要验证XHTML有没有真正起效,需要查看web服务器使用哪种MIME type来分发页面的。

W3C随后在XHTML 1.1中取消了附录C,即使用XHTML 1.1标准的页面必须用新的MIME type来分发。于是这个标准并没有很多人采用。这种情况同样发生在尚未完成的XHTML 2.0身上,它要求强错误检查,于是没有人采用。XHTML的故事也告诉我们,有时候先有标准再来实现,是行不通的。

有了XHTML的教训,WHAT Working Group和W3C在制定下一代HTML标准,也就是HTML5的时候,就将向后兼容作为了一个很重要的原则。HTML5确实引入了许多新的特性,但是它最重要的一个特性是,不会break已有的网页。你可以将任何已有的网页的第一行改成<!DOCTYPE html>,它就成也一个HTML5页面,并且可以照样在浏览器里正常的展示。

本文内容来自知乎睡神的评论:http://www.zhihu.com/question/19818208

我们今天的关于用于将HTML4转换为XHTML的PHP库?html4改成html5的分享就到这里,谢谢您的阅读,如果想了解更多关于HTML 基本语法 方便刚开始学习html的朋友_HTML/Xhtml_网页制作、Html,sHtml,XHtml区别分析小结_HTML/Xhtml_网页制作、html,xhtml,xml的区别介绍_HTML/Xhtml_网页制作、HTML4,XHTML,HTML5之间的纠葛的相关信息,可以在本站进行搜索。

本文标签: