赞
踩
可插拔存储引擎体系结构使
这种高效的模块化体系结构为那些希望专门针对特定应用程序需求(例如数据仓库,事务处理或高可用性情况)的用户提供了巨大的好处,同时享有利用独立于任何一个的一组接口和服务的优势存储引擎。 MySQL服务器体系结构将应用程序开发者和DBA与存储级别的所有底层实现细节隔离,从而提供了一致且简单的应用程序模型和API。因此,尽管跨不同的存储引擎具有不同的功能,但应用程序不受这些差异的影响。
可插拔存储引擎体系结构提供了在所有基础存储引擎中通用的一组标准管理和支持服务。 存储引擎本身是数据库服务器的组件,它们实际上对在物理服务器级别维护的基础数据执行操作,规定了数据文件的组织形式。
应用程序程序员和DBA通过存储引擎上方的连接器API和服务层与MySQL数据库交互。如果应用程序更改带来了要求基础存储引擎更改的要求,或者添加了一个或多个存储引擎来支持新需求,则无需进行重大的编码或流程更改即可使工作正常进行。 MySQL服务器体系结构通过提供适用于整个存储引擎的一致且易于使用的API,使应用程序免受存储引擎的潜在复杂性的影响。
在读取数据方面速度很快,而且不占用大量的内存和存储资源 但不支持事务、外键、索引。 MySQL≥5.1版本中不再支持。
支持COMMIT和ROLLBACK等事务特性。
MySQL在 ≥ 5.1版本中不再支持。
使用该引擎的MySQL数据库表会在MySQL安装目录data文件夹中的和该表所在数据库名相同的目录中生成一个.CSV文件(所以,它可以将CSV类型的文件当做表进行处理),这种文件是一种普通文本文件,每个数据行占用一个文本行。
但是不支持索引,即使用该种类型的表没有主键列; 也不允许表中的字段为null。csv的编码转换需要格外注意。
支持从数据库中拷入/拷出CSV文件。如果从电子表格软件输出一个CSV文件,将其存放在MySQL服务器的数据目录中,服务器就能够马上读取相关的CSV文件。同样,如果写数据库到一个CSV表,外部程序也可以立刻读取它。在实现某种类型的日志记录时,CSV表作为一种数据交换格式,特别有用。
在内存中创建临时表来存储数据。
初衷是速度,逻辑存储介质是内存。
每个基于该引擎的表实际对应一个磁盘文件,文件名和表名相同,类型为.frm。 磁盘文件只存储表结构,数据存储在内存,所以使用该种引擎的表拥有极高插入、更新和查询效率。
默认使用的是哈希(Hash)索引,速度比B+Tree快,也可使用B+树索引。
由于这种存储引擎所存储的数据保存在内存中,所以无法持久化!其保存的数据具有不稳定性,如果mysqld进程发生异常,这些数据可能消失,所以该存储引擎下的表的生命周期很短,一般只使用一次。
如果需要该数据库中一个用于查询的临时表。
支持事务,而且支持mvcc的行级锁,写入这种引擎表中的任何数据都会消失,主要用于做日志记录或同步归档的中继存储,该存储引擎除非有特别目的,否则不适合使用。
使用BLACKHOLE存储引擎的表不存储任何数据,但如果mysql启用了二进制日志,SQL语句被写入日志(并被复制到从服务器)。这样使用BLACKHOLE存储引擎的mysqld可以作为主从复制中的中继重复器或在其上面添加过滤器机制。例如,假设你的应用需要从服务器侧的过滤规则,但传输所有二进制日志数据到从服务器会导致较大的网络流量。在这种情况下,在主服务器主机上建立一个伪从服务器进程。
场景2:
如果配置一主多从的话,多个从服务器会在主服务器上分别开启自己相对应的线程,执行binlogdump命令而且多个此类进程并不是共享的。为了避免因多个从服务器同时请求同样的事件而导致主机资源耗尽,可以单独建立一个伪的从服务器或者叫分发服务器。
区别于InnoDB和MyISAM,ARCHIVE提供压缩功能,拥有高效地插入。 但不支持索引,所以查询性能较差。 支持insert、replace和select操作,不支持update和delete。
压缩比非常高,存储空间大概是innodb的10-15分之一,所以存储历史数据非常适合,由于不支持索引也不能缓存索引和数据,不适合作为并发访问表。
因为高压缩和快速插入的特点。 但前提是不经常对该表进行查询。
该引擎主要用于收集数据库服务器性能参数。这种引擎提供以下功能:提供进程等待的详细信息,包括锁、互斥变量、文件信息;保存历史的事件汇总信息,为提供MySQL服务器性能做出详细的判断;对于新增和删除监控事件点都非常容易,并可以随意改变mysql服务器的监控周期,例如(CYCLE、MICROSECOND)。 MySQL用户是不能创建存储引擎为PERFORMANCE_SCHEMA的表。
场景: DBA能够较明细得了解性能降低可能是由于哪些瓶颈。
Merge允许将一组使用MyISAM存储引擎的并且表结构相同(即每张表的字段顺序、字段名称、字段类型、索引定义的顺序及其定义的方式必须相同)的数据表合并为一个表,方便了数据的查询。
场景:MySQL中没有物化视图,视图的效率极低,故数据仓库中数据量较大的每天、每周或者每个月都创建一个单一的表的历史数据的集合可以通过Merge存储引擎合并为一张表。
该存储引擎可以不同的Mysql服务器联合起来,逻辑上组成一个完整的数据库。 这种存储引擎非常适合数据库分布式应用。 Federated存储引擎可以使你在本地数据库中访问远程数据库中的数据,针对federated存储引擎表的查询会被发送到远程数据库的表上执行,本地是不存储任何数据的。
场景: dblink。
缺点:
1.对本地虚拟表的结构修改,并不会修改远程表的结构
2.truncate 命令,会清除远程表数据
4.不支持 alter table 命令
select id from db.tablea where id >100 limit 10 ;
而以下查询就很快:
select id from db.tablea where id >100 and id<150
该存储引擎用于多台数据机器联合提供服务以提高整体性能和安全性。适合数据量大、安全和性能要求高的场景。
CAP理论。CAP理论(Brewer’s CAP Theorem) ,是说Consistency(一致性), Availability(可用性), Partition tolerance(分布) 三部分在系统实现只可同时满足二点,没法三者兼顾。如果对"一致性"要求高,且必须要做到"分区",那么就要牺牲可用性;而对大型网站,可用性与分区容忍性优先级要高于数据一致性,一般会尽量朝着 A、P 的方向设计,然后通过其它手段保证对于一致性的商务需求。
MySQL5.5版本之前默认数据库引擎,由早期的ISAM所改良,提供ISAM所没有的索引和字段管理等大量功能。 适用于查询密集型,插入密集型。性能极佳,但却有一个缺点:不支持事务处理(transaction)。 因此,几年发展后,MySQL引入InnoDB,以强化参照完整性与并发违规处理机制,取代了MyISAM。
每个MyISAM表,由存储在硬盘上的3个文件组成,每个文件都以表名称为文件主名,并搭配不同扩展名区分文件类型:
MyISAM使用表锁机制优化并发读写操作,但需要经常运行OPTIMIZE TABLE命令恢复被更新机制所浪费的空间,否则碎片也会随之增加,最终影响数据访问性能。
MyISAM强调快速读取操作,主要用于高并发select,这也是MySQL深受Web开发喜爱原因:Web场景下大量操作都是读数据,所以大多数虚拟主机提供商和Internet平台提供商(Internet Presence Provider,IPP)只允许MyISAM格式。
MyISAM类型的表支持三种不同的存储结构:静态型、动态型、压缩型。
适用于更新密集型。
当操作完全兼容ACID时,虽然InnoDB会自动合并多个连接,但每次有事务产生时,仍至少须写入硬盘一次,因此对于某些硬盘或磁盘阵列,会造成每秒200次的事务处理上限。若希望达到更高的性能且保持事务的完整性,就必使用磁盘缓存与电池备援。当然InnoDB也提供数种对性能冲击较低的模式,但相对的也会降低事务的完整性。 而MyISAM则无此问题,但这并非因为它比较先进,这只是因为它不支持事务。
mysql的列存储引擎,适用于数据分析和数据仓库设计。
优点:
1.查询性能高 --比普通Mysql 数据库引擎(MyISAM、InnoDB) 快5-60倍.
2.存储数据量大 --能存储的数据量特别大.
3.高压缩比 --与普通数据库存放的数据文件相比, 可以达到55:1
4.不需要建立索引 --省去了大量建立索引的时间.(对于我们非常有优势)
缺点:
1.不能高并发.最多10个并发
2.Infobright分两个版本:社区版(ICE,免费)、企业版(IEE,收费),社区版在添加数据时,只支持loaddata , 而不支持.insert,update ,delete . 企业版,则全部支持.
支持数据压缩,支持高速写入的一个引擎,但是不适合update多的场景。
XtraDB为派生自InnoDB的强化版,由Percona开发,从MariaDB的10.0.9版起取代InnoDB成为默认的数据库引擎。
InnoDB和MyISAM是许多人在使用MySQL时最常用的两个表类型,这两个表类型各有优劣,视具体应用而定。
所以从宏观来讲,事务数据库关注细节,而数据仓库关注高层次的聚集,所以,InnoDB更适合作为线上的事务处理,而MyISAM更适合作为ROLAP型数据仓库。
1.InnoDB引擎表是基于B+树的索引组织表(IOT);
2.每个表都需要有一个聚集索引(clustered index);
3.所有的行记录都存储在B+树的叶子节点(leaf pages of the tree);
4.基于聚集索引的增、删、改、查的效率相对是最高的;
5.如果我们定义了主键(PRIMARY KEY),那么InnoDB会选择其作为聚集索引;
6.如果没有显式定义主键,则InnoDB会选择第一个不包含有NULL值的唯一索引作为主键索引;
7.如果也没有这样的唯一索引,则InnoDB会选择内置6字节长的ROWID作为隐含的聚集索引(ROWID随着行记录的写入而主键递增,这个ROWID不像ORACLE的ROWID那样可引用,是隐含的)。
1.读取效率:数据仓库的高并发上承载的大部分是读, MYISAM强调的是性能,每次查询具有原子性,其执行速度比InnoDB类型更快。
2. 存储空间:MyISAM: MyISAM的索引和数据是分开的,并且索引是有压缩的,内存使用率就对应提高了不少。InnoDB:需要更多的内存和存储,它会在主内存中建立其专用的缓冲池用于高速缓冲数据和索引。
3. MyISAM可移植性备份及恢复:MyISAM:数据是以文件的形式存储,所以在跨平台的数据转移中会很方便。在备份和恢复时可单独针对某个表进行操作。InnoDB:免费的方案可以是拷贝数据文件、备份 binlog,或者用 mysqldump,在数据量达到几十G的时候就相对痛苦了。移植过程中MyISAM不受字典数据的影响。
4.从接触的应用逻辑来说,select count(*) 和order by 是最频繁的,大概能占了整个sql总语句的60%以上的操作,而这种操作Innodb其实也是会锁表的,很多人以为Innodb是行级锁,那个只是where对它主键是有效,非主键的都会锁全表的。但MYISAM对于count操作只需要在元数据中读取,不用扫表。
5.如果和MyISAM比insert写操作的话,Innodb还达不到MyISAM的写性能,如果是针对基于索引的update操作,虽然MyISAM可能会逊色Innodb,但是那么高并发的写,从库能否追的上也是一个问题,且不建议数据仓库中频繁update数据。
6.如果是用MyISAM的话,merge引擎可以大大加快数据仓库开发速度,非常适合大项目总量约几亿的rows某一类型(如日志,调查统计)的业务表。
7.全文索引:MyISAM:支持 FULLTEXT类型的全文索引。InnoDB:不支持FULLTEXT类型的全文索引,但是innodb可以使用sphinx插件支持全文索引,并且效果更好。
8.表主键:MyISAM:允许没有任何索引和主键的表存在,索引都是保存行的地址。InnoDB:如果没有设定主键或者非空唯一索引,就会自动生成一个6字节的主键(用户不可见),数据是主索引的一部分,附加索引保存的是主索引的值。
9.对于AUTO_INCREMENT类型的字段,InnoDB中必须包含只有该字段的索引,但是在MyISAM表中,可以和其他字段一起建立联合索引。
10. MyISAM不支持外键,需通过其他方式弥补。
如何对InnoDB引擎的表做最优的优化:
1.使用自增列(INT/BIGINT类型)做主键,这时候写入顺序是自增的,和B+数叶子节点分裂顺序一致,这时候存取效率是最高的
2.该表不指定自增列做主键,同时也没有可以被选为主键的唯一索引(上面的条件),这时候InnoDB会选择内置的ROWID作为主键,写入顺序和ROWID增长顺序一致。
参考
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。