着重来说明一下标准元数据
Keywords (关键字)
说明:告诉搜索引擎你网页的关键字是什么。
用法:Description (网页描述)
说明:Description用来告诉搜索引擎你的网页主要内容。
用法:Robots (机器人向导)
说明:Robots用来告诉搜索机器人哪些页面需要索引,哪些页面不需要索引。Content的参数有all、none、index、noindex、follow、nofollow。默认是all。
用法:
all:文件将被检索,且页面上的链接可以被查询;
none:文件将不被检索,且页面上的链接不可以被查询;(和 “noindex, no follow” 起相同作用)
index:文件将被检索;(让robot/spider登录)
follow:页面上的链接可以被查询;
noindex:文件将不被检索,但页面上的链接可以被查询;(不让robot/spider登录)
nofollow:文件将不被检索,页面上的链接可以被查询。(不让robot/spider顺着此页的连接往下探找)Author (作者)
说明:标注网页的作者或制作组
用法:
注意:Content可以是:你或你的制作组的名字,或EmailCopyright (版权)
说明:标注版权
用法:Generator (编辑器)
说明:编辑器的说明
用法:
注意:Content=”你所用编辑器”revisit-after (重访)
HTML规范中定义的标准名称application-name 网页中所运行的应用名称。(注意不同于
标签)
author: 文档作者的名字
description:对页面内容的描述,一些浏览器将其作为书签的默认描述。
generator: 生成此页面的软件的标识符
keywords: 与页面内容相关的关键词,使用逗号分割。
referrer: 控制由当前文档发出的请求的HTTP Referer请求头
referrer的可选值
no-referrer: 不发送HTTP Referer请求头
origin: 只发送当前文档的origin
no-referrer-when-downgrade:
如果请求目标比当前页面一样安全或更加安全,则发送完整URL
如果目标页面比当前页面更加不安全,则不发送referrer【这是默认行为】
origin-when-cross-origin:对同源请求发送完整URL(不含参数),其他情况只发送origin
same-origin: 对同源请求发送完整URL(不含参数),其他情况,不发送referrer请求头
strict-origin:
如果请求目标与当前页面一样或更加安全,发送 origin
如果请求目标不如当前页面安全,不发送referrer
strict-origin-when-cross-origin:对同源请求发送完整URL(不含参数)
其他情况
如果请求目标与当前页面一样或更加安全,发送origin
如果请求目标不如当前页面安全,则不发送referrer
unsafe-URL:对同源请求和跨源请求发送完整URL(不含参数)CSS颜色调整规范中定义的标准名称
color-scheme : 指定与当前文档兼容的配色方案,它的可选值有:
normal:未指定配色方案,应当仅使用默认配色方案进行渲染
[light | dark]+:文档支持的一种或多种配色方案,优先第一种。
only light:仅支持浅色模式(浅色背景,深色前景)CSS设备适配规范定义的标准名称
viewport
viewport:为视口的初始大小提供指示,目前仅用于移动设备,其可选的值有:
width:定义视口的宽度,可能的值:
一个正整数。(此时单位为像素)
一个字符串。(带单位的CSS宽度值)
device-width 表示与设备宽度一致
height: 定义viewport的高度,未被任浏览器使用,不介绍值了
initial-scale:定义设备宽度(与横竖屏相关)与视口大小之间的比例
是一个0.0-10.0之间的【正数】;
maximum-scale: 定义缩放的最大值,必须大于等于minimum-scale
是一个0.0-10.0之间的【正数】;
minimum-scale:定义缩放的最小值,必须小于等于maximum-scale
是一个0.0-10.0之间的【正数】;
user-scalable:用户是否可以缩放当前页面
yes 或 no ,默认为yes
viewport-fit : 视口是否根据设备自适应,可能的值
auto:不会影响“初始布局”视口,整个网页都是可查看的
caontain:视口被缩放以适合显示中内接的最大矩形
cover: 缩放视口以填充设备显示。
将 user-scalable 设置为 no 会阻止一切意义上的缩放,视力不好的人可能会因此无法阅读和理解页面内容其它元数据名称
creator:当前文档的创建者,例如某个组织或者机构。如果有不止一个创建者,则应当使用多个名称为 creator 的 元素
googolbot:robots 的替代名称,只被 Googlebot(Google 的网页爬虫/索引搜寻器)使用
publisher:当前文档的发布者/出版者
robots:爬虫应当遵守的规则。是一个使用逗号分隔的、由下列值构成的列表:
index:允许爬虫索引此页面(所有爬虫)
noindex:要求爬虫不索引此页面(所有爬虫)
follow :允许爬虫跟踪页面上链接所指向的页面(所有爬虫)
onfollow:要求爬虫不跟踪页面上的链接(所有爬虫)
all:与index,follow 等价(只针对谷歌爬虫)
none:与noindex, nofollow等价(只针对谷歌爬虫)
noarchive:要求搜索引擎不缓存页面内容(针对谷歌、雅虎、必应搜索)
nosnippet:要求搜索引擎不要在搜索结果页显示本页面的描述。(针对谷歌、必应搜索)
noimageindex:要求本页面不会成为搜索结果页中索引图像的引用页。(只针对谷歌搜索)
nocache:noarchive的替代名称。(只针对必应)
3.http-equiv属性,content属性
http-equiv 属性用来覆盖 HTTP 回应的头信息字段,content 属性是该字段的内容。
<meta http-equiv="Content-Security-Policy" content="default-src 'self'">
上面代码可以覆盖 HTTP 回应的 Content-Security-Policy 字段。
<title>
标签
此标签用于指定页面的标题,会显示在浏览器窗口的标题栏
<head>
<title>网页标题</title>
</head>
搜索引擎根据它排序
这个标签的内部不能放置其他标签,只能放置无格式的纯文本
<body>
标签
<body>
标签是一个容器标签,用于放置网页的主体内容。浏览器显示的页面内容,都是放置在它的内部。它是<html>
的第二个子元素,紧跟在<head>
后面
1.4空格和换行
heml里的多个空格和换行最后只会被合并为一个
1.5注释
<!-- 这是一个注释 -->
或者是
<!--
<p>HelloWorld!</p>
-->