我不安生

  • 主页
  • 相册
  • 所有文章
  • 分类
  • 留言板
  • 关于

我不安生

  • 主页
  • 相册
  • 所有文章
  • 分类
  • 留言板
  • 关于

Python爬虫之信息标记

2020-02-21

信息标记的三种形式:XML、JSON,YAML

信息标记的好处

  • 标记后的信息可形成信息组织结构,增加了信息维度
  • 标记后的信息可用于通信、存储或展示
  • 标记的结构与信息一样具有重要价值
  • 标记后的信息更利于程序理解和运用
  • XML(扩展标记语言)
1
2
3
4
5
6
7
8
<person>
<name>安生</name>
<age>18</age>
<address>
<province>广东</province>
<city>广州市</city>
</address>
</person>
  • JSON -(有类型键值对)
1
2
3
4
5
6
7
8
{
"name": "安生",
"age": "18",
"address": {
"province": "广东",
"city": "广州"
}
}
  • YAML -(无类型键值对,用缩进表示所属关系)
1
2
3
4
5
name: 安生
age: 18,
address:
province: 广东
city: 广州
三种信息标记形式的比较
标记形式 特点 主要用途
XML 最早的通用信息标记语言,可扩展性好,但繁琐 Internet上的信息交互与传递
JSON 信息有类型,适合程序处理(js),较XML简洁,无注释 移动应用云端和节点的信息通信
YAML 信息无类型,文本信息比例最高,可读性好,有注释 各类系统的配置文件
  • 学习笔记
  • Python
  • 爬虫
Python爬虫之BeautifulSoup库的使用
Pycharm远程连接Linux服务器进行开发和运维

© 2018-2023 我不安生
桂ICP备19003176号
本站访客数人 总访问量次
Powered By Hexo && Yilia