Storage Area Network (SAN) là một mạng được thiết kế cho việc thêm các thiết bị lưu trữ cho máy chủ một cách dễ dàng như: Disk Aray Controllers, hay Tape Libraries
Với những ưu điểm nổi chội SANs đã trở thành một giải pháp rất tốt cho lưu trữ thông tin cho doanh nghiệp hay tổ chức. SAN cho phép kết nối từ xa tới các thiết bị lưu trữ trên mạng như: Disks và Tape drivers. Các thiết bị lưu trữ trên mạng, hay các ứng dụng chạy trên đó được thể hiện trên máy chủ như một thiết bị của máy chủ (as locally attached divices)
Có hai sự khác nhau cơ bản trong các thành phần của SANs
1. Mạng (network) có tác dụng truyền thông tin giữa thiết bị lưu trữ và hệ thống máy tính. Một SAN bao gồm một cấu trúc truyền tin, nó cung cấp kết nối vật lý, và quản lý các lớp, tổ chức các kết nối, các thiết bị lưu trữ, và hệ thống máy tính sao cho dữ liệu truyền trên đó với tốc độ cao và tính bảo mật. Giới hạn của SAN thường được nhận biết với dịch vụ Block I/O đúng hơn là với dịch vụ File Access.
2. Một hệ thống lưu trữ bao gồm các thiết bị lưu trữ, hệ thống máy tính, hay các ứng dụng chạy trên nó, và một phần rất quan trọng là các phần mềm điều khiển, quá trình truyền thông tin qua mạng
Định nghĩa SAN
Lưu trữ mạng có thể được hiểu như một phương pháp truy cập dữ liệu ứng dụng trên nền tảng mạng mà quá trình truyền dữ liệu trên mạng tương tự như quá trình truyền dữ liệu từ các thiết bị quen thuộc trên máy chủ như Disks Drivers như ATA, SCSI.
Trong một mạng lưu trữ, một máy chủ sử dụng một yêu cầu cho một gói dữ liệu cụ thể hay một dữ liệu cụ thể, từ một đĩa lưu trữ và các yêu cầu được đáp ứng. Phương pháp này được biết là block storage. Các thiết bị được làm việc như một thiết bị lưu trữ bên trong máy chủ và được truy cập một cách bình thường thông qua các yêu cầu cụ thể và quá trình đáp ứng bằng cách gửi các yêu cầu và nhận được trên môi trường mạng mà thôi.
Theo truyền thống phương pháp truy cập vào file như SMB/CIFS hay NFS, một máy chủ sử dụng các yêu cầu cho một file như một thành phần của hệ thống file trên máy, và được quản lý bình thường với máy chủ. Quá trình điều khiển đó được quyết định từ tầng vật lý của dữ liệu, truy cập vào nó như một ổ đĩa bên trong máy chủ và được điều khiển và sử dụng trực tiếp trên máy chủ. Chỉ khác một điều dữ liệu bình thường thông qua hệ thống bus còn SAN dựa trên nền mạng.
Các hệ thống lưu trữ mạng sử dụng giao thức SCSI cho quá trình truyền dữ liệu từ máy chủ đến các thiết bị lưu trữ, không thông qua các Bus hệ thống. Cụ thể tầng vật lý của SAN được sử dụng dựa trên các cổng quang để truyền dữ liệu: 1 Gbit Fiber Channel, 2Gbit Fiber Channel, 4Gbit Fiber Channel, và 1Gbit iSCSI. Giao thức SCSI thông tin được vận truyển trên một giao thức thấp dựa trên quá trình mapping layer. Hầu hết các hệ thống SANs hiện hay đều sử dụng SCSI dựa trên hệ thống cáp quang để truyền dữ liệu và quá trình chuyển đội (mapping layer) từ SCSI qua cáp quang và máy chủ vẫn hiểu như SCSI là (SCSI over Fiber Channel) và FCP được coi là một chuẩn trong quá trình chuyển đổi đó. iSCSI là một dạng truyển đổi tương tự với phương pháp thiết kế mang các thông tin SCSI trên nền IP
Lợi ích khi sử dụng SAN
Dễ dàng chia sẻ lưu trữ và quản lý thông tin, mở rộng lưu trữ dễ dàng thông qua quá trình thêm các thiết bị lưu trữ vào mạng không cần phải thay đổi các thiết bị như máy chủ hay các thiết bị lưu trữ hiện có. Ứng dụng cho các hệ thống Data centrer và các Cluster. Và mỗi thiết bị lưu trữ trong mạng SAN được quản lý bởi một máy chủ cụ thể. Trong quá trình quản lý của SAN sử dụng Network Attached Storage (NAS) cho phép nhiều máy tính truy cập vào cùng một file trên một mạng. Và ngày nay có thể tích hợp giữa SAN và NAS tạo nên một hệ thống lưu trữ thông tin hoàn thiện.
SANs được thiết kế dễ dàng cho tận dụng các tính năng lưu trữ, cho phép nhiều máy chủ cùng chia sẻ một thiết bị lưu trữ.
Một ứng dụng khác của SAN là khả năng cho phép máy tính khởi động trực tiếp từ SAN mà chúng quản lý. Điều này cho phép dễ dàng thay các máy chủ bị lỗi khi đang sử dụng và có thể cấu hình lại cho phép thay đổi hay nâng cấp máy chủ một cách dễ dàng và dữ liệu không hề ảnh hưởng khi máy chủ bị lỗi. Và quá trình đó có thể chỉ cần nửa giờ để có một hệ thống Data Centers. Và được thiết kế với tốc độ truyền dữ liệu cực lớn và độ an toàn của hệ thống được coi là vấn đề hàng đầu.
SAN cung cấp giải pháp khôi phục dữ liệu một cách nhanh chóng bằng cách thêm và các thiết bị lưu trữ và có khả năng khôi phục cực nhanh dữ liệu khi một thiết bị lưu trữ bị lỗi hay không truy cập được (secondary aray).
Các hệ thống SAN mới hiện nay cho phép (duplication) sao chép hay một tập tin được ghi tại hai vùng vật lý khác nhau (clone) cho phép khôi phục dữ liêu cực nhanh.
Điều khiển đĩa
Quá trình điều khiển cho SAN trong môi trường doanh nghiệp với sự phát triển nhanh chóng yêu cầu sự đáp ứng về truyền dữ liệu với tốc độ cực cao tới các ổ đĩa (như các dữ liệu truyền từ các hệ thống mail servers, máy chủ dữ liệu, và các máy chủ file server). Trong quá trình phát triển trước kia, với mạng doanh nghiệp dùng hệ thốg lưu trữ với khả năng đáp ứng cao sử dụng lưu trữ SCSI và RAIDs điều khiển các mảng đĩa cứng được tích hợp trực tiếp trên máy chủ. Và bây giờ với công nghệ Mạng trên nền tảng IP, và khi các ứng dụng dữ liệu sử dụng hết toàn bộ các ổ lưu trữ trên các máy chủ và các người dùng cuối yêu cầu phải thay máy chủ đáp ứng các yêu cầu công việc. Nhưng với SAN việc nâng cấp các thiết bị lưu trữ là rất đơn giản với việc thêm vào mạng các thiết bị lưu trữ mới.
Điều khiển đĩa sử dụng trong môi trường SAN được thiết kế cung cấp với tốc độ cao, độ tin cậy lớn “Visual Hard Driver” (hay LUNs). Thêm nữa mô hình SANs cho phép tích hợp lẫn các thiết bị FC SATA và FC SCSI (FC SATA là thiết bị lưu trữ sử dụng các ổ đĩa dạng SATA và sử dụng cáp quang để truyền dữ liệu tới môi trường mạng). SATA làm việc với khả năng thấp, có nhiều lỗi xảy ra nhưng lưu trữ lớn và giá thành rẻ hơn rất nhiều so với các ổ đĩa SCSI. Nó cho phép các mạng SANs sử dụng nó để như một thiết bị sao lưu dự phòng khi có lỗi xảy ra. Và hâu hết các SAN đều dử dụng FC SATA như một thiết bị backup với lưu trữ lớn và tốc độ nhanh hơn rất nhiều so với tape drivers.
Các dạng SANs
SANs được xây dựng với thiết kế dành riêng cho việc lưu trữ và truyền thông tin. Nó cung cấp khả năng truyền dữ liệu với tốc độ lớn với độ an toàn cao hơn các giao thức khác như NAS.
Hầu hết các công nghệ SAN là mạng cáp quang (Fiber Channel Networking) với các thiết bị lưu trữ sử dụng các ổ địa SCSI. Một dạng cụ thể là FiBre Channel SAN được xây dựng bởi Fibre Channel Switch được kết nối tới các thiết bị thông qua hệ thống cab quang. Ngày nay hầu hết các hệ thống SAN đều sử dụng giải pháp định tuyến Fibre Channel, và mang lại khả năng mở rộng lớn cho cấu trúc SAN cho phép kết hợp các hệ thống SAN lại với nhau. Tuy nhiên hầu hết quá trình đó đều với mục đích dữ liệu tập trung và truyền với tốc độ cực cao với khoảng cách xa hơn thông tầng vật lý là cáp quang, switch quang.
Một dạng khác của SAN là sử dụng giao thức iSCSI nó sử dụng giao thức SCSI trên nền tảng TCP/IP. Trong dạng này, các switch tương tự như Ethernet Switchs. Chuẩn iSCSI được giới thiệu năm 2003 và được triển khai rộng lớn trong quá trình lưu trữ mạng (lưu trữ không yêu cầu tốc độ lớn) và từ khi ứng dụng cáp quang trong quá trình truyền dữ liệu mang lại hiệu năng lớn cho iSCSI. Ngày nay hầu hết các hệ thống isSCSI sử dụng cáp quang trong quá trình truyền dữ liệu và sử dụng giao thức NAS như CIFS và NFS.
Một dạng khác của iSCSI là ATA-over-Ethernet hay giao thức AoE được xây dựng sử dụng giao thức ATA trên khung nền tảng Ethernet. Trong khi giao thức Ethernet như AoE không thể định tuyến và cung cấp các hiệu năng khác nhau.
Kết nối với SAN sẽ có một hay nhiều máy chủ và một hay nhiều các thiết bị lưu trữ khác nhau. Trong FC SAN máy chủ cũng sử dụng cáp quang để truyền dữ liệu (host bus adapter and Optical fibre). isSCSI SAN sử dụng giao thức Ethernet bình thường thông qua card mạng hay TOE card.
SAN có hai dạng là: Centralized storage are networks và distributed storage area network.
Tương thích
Một vấn đề sảy ra khi sử dụng FC SANs là các Switch và các phần cứng khác nhà cung cấp sẽ không
Trong khi vấn đề xảy ra với FC SAN trong quá trình xây dựng khác nhà sản xuất phần cứng thì giải pháp iSCSI dựa trên nền tảng IP lại không xảy ra vấn đề này.
SANs trong môi trường làm việc
SAN được sử dụng trong môi trường yêu cầu mở rộng nhanh chóng các thiết bị lưu trữ, và yêu cầu đáp ứng công việc cao (truyền dữ liệu với tốc độ lớn). Nó cho phép các thiết bị FC disk driver kết nối trực tiếp đến SAN. SAN như các mạng bình thường của các thiết bị lưu trữ với dung lượng lớn. SAN là giải pháp đắt tiền với hệ thống Fibre Channel hay các card chuyên dụng cho các máy tính. Côn nghệ iSCSI SAN là giải pháp đáp ứng được với yêu cầu giá cả của SAN, nhưng không như công nghệ sử dụng cho mạng doanh nghiệp lớn Data Center. Các máy con có thể sử dụng giao thức NAS như CIFS hay NFS. Với khả năng truy cập từ xa và khôi phục dữ liệu nhanh chóng khi xảy ra lỗi. Đáp ứng tốt cho giải pháp Data Center. Và khả năng của iSCSI đáp ứng với các môi trường ứng dụng không đòi hỏi khả năng đáp ứng cực lớn. Với FC SAN đáp ứng các yêu cầu khắt khe nhất về ứng dụng.
SAN trong ứng dụng ngày này
Trong quá trình phát triển nhanh chóng các dữ liệu của doanh nghiệp hay tổ chức vừa và nhỏ đều yêu cầu có một thiết bị lưu trữ với dung lượng lớn và độ an toàn thông tin cao và SAN là một giải pháp đáp ứng các yêu cầu khắt khe nhất của doanh nghiệp.
Với tốc độ truyền dữ liệu từ 300Mbit/s đến 4Gbit/s sẽ đáp ứng được các ứng dụng về ghi và cung cấp dữ liệu cho nhu cầu hiện nay và trong tương lai
SAN Virtualization Guidelines
Now that SAN "plumbing" has matured with an ample collection of Fibre Channel products, it's time to turn our attention to fully harnessing the storage assets at the other end of the light beams. That takes us into the realm of SAN virtualization.
While SAN connections widen the pipes and stretch the distance between disks and hosts, the new plumbing alone does little to reconcile the conflicts among servers competing for scarce disk space. You can look at SAN virtualization products as capacity brokers in this chaotic environment. In their simplest form, they collect all or portions of the SAN's physical disks into a pool, and hand out logical slices to needy application servers without having to re-cable or rezone the SAN.
Properly architected, virtualization provides many benefits, such as the ability to allocate storage resources on-demand, integrate storage products from multiple vendors, configure selectively for high availability and reduce the total cost of ownership. Choosing a virtualization product is the challenge. We'll give you some guidelines that our customers use, and consequently, influence our solutions.
Properly architected, virtualization provides many benefits, such as the ability to allocate storage resources on-demand, integrate storage products from multiple vendors, configure selectively for high availability and reduce the total cost of ownership. Choosing a virtualization product is the challenge. We'll give you some guidelines that our customers use, and consequently, influence our solutions.
Virtualization Schemes
At last count, five divergent approaches to sharing virtual disk capacity have emerged in the SAN market, spanning about 10 discrete implementations. Ranging broadly in price, performance, and utility, these virtualization solutions can be categorized by the methods they use to translate the the physical reality to the host's logical view. The effectiveness of each technique is essentially determined by where in the SAN the mapping takes place and what platform is used to deliver the services. Our taxonomy lumps the offerings into:
At last count, five divergent approaches to sharing virtual disk capacity have emerged in the SAN market, spanning about 10 discrete implementations. Ranging broadly in price, performance, and utility, these virtualization solutions can be categorized by the methods they use to translate the the physical reality to the host's logical view. The effectiveness of each technique is essentially determined by where in the SAN the mapping takes place and what platform is used to deliver the services. Our taxonomy lumps the offerings into:
- Multi-host storage arrays
- Host-based LUN masking filters
- File system redirectors via outboard metadata controllers
- Specialized in-band virtualization engines
- Dedicated storage domain servers
Selection Criteria
While virtualization suppliers' claims are often indistinguishable, there are seven criteria that determine the success and viability of each approach:
- The degree of independence that these products provide from a host's operating system and file system.
- The broadness of support for a mixture of storage hardware.
- The ability to protect investments in legacy storage assets.
- The ability of the security policy to share virtual resources while adequately excluding uninvited guests.
- The effectiveness of the technology at minimizing losses due to planned and unplanned downtime.
- The breadth of devices consolidated into a centralized management view.
- The ability to leverage commodity hardware and storage devices for improved performance and functionality at reasonable cost.
Host Independence
This is a critical point. Several suppliers have elected to place virtualization software on the hosts - each and every host, that is. These vendors' engineering teams are spending a lot of time just on porting and qualifying software to every operating system. This process compromises focus and energy. History has shown that this strategy is difficult to maintain given all the version changes across many host environments. And the fact remains that this approach requires IT staff to install intrusive, processor-consuming software on each host or risk problems. Host-based solutions can mean only one thing for the system administrators: more headaches every time a system is added or updated.
This is a critical point. Several suppliers have elected to place virtualization software on the hosts - each and every host, that is. These vendors' engineering teams are spending a lot of time just on porting and qualifying software to every operating system. This process compromises focus and energy. History has shown that this strategy is difficult to maintain given all the version changes across many host environments. And the fact remains that this approach requires IT staff to install intrusive, processor-consuming software on each host or risk problems. Host-based solutions can mean only one thing for the system administrators: more headaches every time a system is added or updated.
Mixed Storage Support
The usual answer from many vendors is "Don't mix. It's hard. They don't interoperate." Translation: vendor lock-in. While choosing products from a single vendor can provide a certain level of near-term comfort, in the long run you are compromising your ability to respond to change. Fortunately, a few suppliers without allegiances to specific storage hardware are far more liberal, willing, and most importantly, able to put nearly anyone in their storage pool as long as it talks Fibre Channel.
The usual answer from many vendors is "Don't mix. It's hard. They don't interoperate." Translation: vendor lock-in. While choosing products from a single vendor can provide a certain level of near-term comfort, in the long run you are compromising your ability to respond to change. Fortunately, a few suppliers without allegiances to specific storage hardware are far more liberal, willing, and most importantly, able to put nearly anyone in their storage pool as long as it talks Fibre Channel.
Legacy Investment Protection
How much of your current disk population is Fibre Channel (FC) -ready? If your mix includes SCSI, EIDE or SSA drives, the SAN virtualization choices get slim. Of course there are Fibre Channel routers and bridges that could be worked in for additional cost and complexity. Better instead to look for storage pooling products that have built-in support for your existing interfaces. Properly done, the hosts won't know the difference between virtual devices coming from an FC drive and a native SCSI spindle (performance of the hardware aside).
How much of your current disk population is Fibre Channel (FC) -ready? If your mix includes SCSI, EIDE or SSA drives, the SAN virtualization choices get slim. Of course there are Fibre Channel routers and bridges that could be worked in for additional cost and complexity. Better instead to look for storage pooling products that have built-in support for your existing interfaces. Properly done, the hosts won't know the difference between virtual devices coming from an FC drive and a native SCSI spindle (performance of the hardware aside).
Security Concerns
Security and host independence are somewhat intertwined. Depending on host-based software or hardware to implement the security layer for shared access control over a SAN is misplacing the authority. A rogue host doesn't play fair - it can read and write to any disk in the pool, unintentionally corrupting a neighbor's data. Steer towards outboard security implementations that centralize access control and you'll sleep nights. There's another benefit: with the growing importance of personal privacy in the e-Commerce world, an outboard security implementation simplifies the auditing of data trails.
Security and host independence are somewhat intertwined. Depending on host-based software or hardware to implement the security layer for shared access control over a SAN is misplacing the authority. A rogue host doesn't play fair - it can read and write to any disk in the pool, unintentionally corrupting a neighbor's data. Steer towards outboard security implementations that centralize access control and you'll sleep nights. There's another benefit: with the growing importance of personal privacy in the e-Commerce world, an outboard security implementation simplifies the auditing of data trails.
Resiliency to Outages
Buying devices in pairs to protect against failure is simply not the best way to spend the IT budget, even though it may be a common practice. The more practical (and effective) way is to amortize redundancy across many resources in an N+1 fashion. In other words, when you need five units, buy six, not 10, and you'll have a great combination of availability and cost-savings. Make sure your virtualization solution supports this capability - not all of them do, and can cause an unanticipated increase in cost of ownership.
Buying devices in pairs to protect against failure is simply not the best way to spend the IT budget, even though it may be a common practice. The more practical (and effective) way is to amortize redundancy across many resources in an N+1 fashion. In other words, when you need five units, buy six, not 10, and you'll have a great combination of availability and cost-savings. Make sure your virtualization solution supports this capability - not all of them do, and can cause an unanticipated increase in cost of ownership.
Centralization
Some define centralized storage pools and storage management as limited to disks within one box, or one vendor's line of products. What is your definition? We believe you should look for centralized administration that includes pooling all the disks across a network, regardless of where, how many, or what make or model of storage is attached.
Some define centralized storage pools and storage management as limited to disks within one box, or one vendor's line of products. What is your definition? We believe you should look for centralized administration that includes pooling all the disks across a network, regardless of where, how many, or what make or model of storage is attached.
Price-performance leverage of the virtualization platform
For reasons already discussed, we feel that the virtualization engine should be outboard, and not a burden of the hosts. In this case, the platform for the virtualization becomes extremely important. Some vendors' products use proprietary or custom hardware and software to provide virtualization and other services. Naturally, this increases the development and testing costs, which the end user must ultimately fund. In addition, the performance and reliability of the system is more of a gamble, for which the end user bears a large portion of the risk. We feel you should look for solutions that leverage existing, proven, high-performance technologies that are cost-efficient, familiar, easily upgradeable, and extensible. This includes processors, storage devices, and operating systems. With that in mind, now you can plan on flexibly scaling your performance, redundancy and capacity based on your budget and business needs, rather than the other way around.
For reasons already discussed, we feel that the virtualization engine should be outboard, and not a burden of the hosts. In this case, the platform for the virtualization becomes extremely important. Some vendors' products use proprietary or custom hardware and software to provide virtualization and other services. Naturally, this increases the development and testing costs, which the end user must ultimately fund. In addition, the performance and reliability of the system is more of a gamble, for which the end user bears a large portion of the risk. We feel you should look for solutions that leverage existing, proven, high-performance technologies that are cost-efficient, familiar, easily upgradeable, and extensible. This includes processors, storage devices, and operating systems. With that in mind, now you can plan on flexibly scaling your performance, redundancy and capacity based on your budget and business needs, rather than the other way around.
Back to the Choices
Let's compare the SAN virtualization alternatives and see how each one ranks against our criteria.
Multi-Host Arrays
A multi-host array (Figure 1) puts the pooling responsibility at the storage subsystem level, usually with RAID controller firmware. This implementation offers favorable performance, as well as high availability configurations. Connectivity to many flavors of hosts is supported, but you can only buy the disks that come with the array. Perhaps the biggest drawback of this approach is that the size and makeup of the pool is limited to the array's monolithic enclosures. Spilling over means running multiple pools and losing allocation freedom and centralization. Although some vendors might offer centralized management for multiple arrays, there are unanswered questions about multi-vendor support.

LUN Masking
One means of enabling storage pooling is to install specialized device drivers on each host to prevent that host from accessing storage resources that it doesn't "own." These LUN Masking drivers (Figure 2) are typically configured using a central management application that can be either host-based or outboard. Although this method might work well for small, controlled configurations, it introduces several complexities and costs in large data center and enterprise SAN operations. First, the LUN masking support must span a potentially wide spectrum of server platforms - as we noted earlier, this presents a significant challenge for the vendor to adequately supply and maintain. Also, because every single host must have the LUN masking driver, there is a performance hit to the host and therefore the network. Plus, change management across numerous hosts is tedious, costly and slow. Perhaps even more disconcerting is the ability for any "rogue" host without the proper LUN masking software to defeat the security controls of the shared resources and corrupt others' disks in the storage pool.

File System Redirectors
A third type of pooling technique involves the use of file system redirector software (Figure 3). Basically, file access control travels over the LAN, but disk data I/O moves over the high-speed SAN. Each host on the SAN requires software to facilitate the mapping of file names to block addresses, all brokered by an external metadata controller or file system manager. To be fair, these products are really targeted at offloading disk I/O traffic from LANs, rather than general purpose virtualized storage pooling. We've included them in our virtualization roundup since there is a level of storage abstraction in the design. Like LUN masking software, file system redirection is tied to specific operating environments and components must be installed on every host. Though the file sharing services offer value, they are not the best solution for general SAN virtualization and storage management. You should overlay file redirection software on a virtualized storage pooling service to get the best of both worlds.

Specialized In-band Virtualization Engines
These products provide virtualized storage pooling by consolidating the storage allocation and security functions on dedicated platforms that sit between the hosts and the physical storage (thus "in-band"). Typically, no additional software is required on the hosts, allowing the engines to support the diverse range of popular open systems servers. The virtualization engine (Figure 4) can incorporate a wide range of components and features. At one end are the entry-level products that strictly address simple storage pooling needs and require the purchase of external switches and storage devices to complete the picture. Others choose to embed switching support in the "appliance" bundle. Still others include disks, and appear very similar to multi-host arrays, but potentially at lower price points with greater configuration flexibility. The particular components of the appliance are not necessarily measures of quality, merely options.
A multi-host array (Figure 1) puts the pooling responsibility at the storage subsystem level, usually with RAID controller firmware. This implementation offers favorable performance, as well as high availability configurations. Connectivity to many flavors of hosts is supported, but you can only buy the disks that come with the array. Perhaps the biggest drawback of this approach is that the size and makeup of the pool is limited to the array's monolithic enclosures. Spilling over means running multiple pools and losing allocation freedom and centralization. Although some vendors might offer centralized management for multiple arrays, there are unanswered questions about multi-vendor support.
LUN Masking
One means of enabling storage pooling is to install specialized device drivers on each host to prevent that host from accessing storage resources that it doesn't "own." These LUN Masking drivers (Figure 2) are typically configured using a central management application that can be either host-based or outboard. Although this method might work well for small, controlled configurations, it introduces several complexities and costs in large data center and enterprise SAN operations. First, the LUN masking support must span a potentially wide spectrum of server platforms - as we noted earlier, this presents a significant challenge for the vendor to adequately supply and maintain. Also, because every single host must have the LUN masking driver, there is a performance hit to the host and therefore the network. Plus, change management across numerous hosts is tedious, costly and slow. Perhaps even more disconcerting is the ability for any "rogue" host without the proper LUN masking software to defeat the security controls of the shared resources and corrupt others' disks in the storage pool.
File System Redirectors
A third type of pooling technique involves the use of file system redirector software (Figure 3). Basically, file access control travels over the LAN, but disk data I/O moves over the high-speed SAN. Each host on the SAN requires software to facilitate the mapping of file names to block addresses, all brokered by an external metadata controller or file system manager. To be fair, these products are really targeted at offloading disk I/O traffic from LANs, rather than general purpose virtualized storage pooling. We've included them in our virtualization roundup since there is a level of storage abstraction in the design. Like LUN masking software, file system redirection is tied to specific operating environments and components must be installed on every host. Though the file sharing services offer value, they are not the best solution for general SAN virtualization and storage management. You should overlay file redirection software on a virtualized storage pooling service to get the best of both worlds.
Specialized In-band Virtualization Engines
These products provide virtualized storage pooling by consolidating the storage allocation and security functions on dedicated platforms that sit between the hosts and the physical storage (thus "in-band"). Typically, no additional software is required on the hosts, allowing the engines to support the diverse range of popular open systems servers. The virtualization engine (Figure 4) can incorporate a wide range of components and features. At one end are the entry-level products that strictly address simple storage pooling needs and require the purchase of external switches and storage devices to complete the picture. Others choose to embed switching support in the "appliance" bundle. Still others include disks, and appear very similar to multi-host arrays, but potentially at lower price points with greater configuration flexibility. The particular components of the appliance are not necessarily measures of quality, merely options.
You should note that there is a war raging between the out-of-band (outside the data path) and the in-band virtualization camps. Some argue that in-band products slow data access down, and that the failure of the virtualization platform could compromise availability. This is only true if the product is carelessly designed. The successful, intelligent storage control suppliers have proven that you can use caching and alternate paths to achieve big performance and availability payoffs. We've seen dramatically enhanced I/O response firsthand from JBODs and disk arrays that were supplemented with in-band virtualizations engines sporting advanced caching. As for survivability, configuring alternate paths is a long-standing, proven method for continuous availability that can be implemented for storage networks.
So, the true measure of success for these appliances lies in their ability to confront and deal with these technical challenges. Lesser implementations will expose themselves as single points of failure; intelligent ones will provide alternate paths and multi-node redundancy through classical networking techniques proven in the LAN and WAN space. Weaker products will experience a significant performance hit as data travels through the appliance; successful solutions will possess sophisticated, robust read and write caching algorithms that actually improve the performance of the physical disks under their control, while also leveraging the cache already built in to the disk arrays.
Storage Domain Servers
A storage domain server (Figure 5) is a commercial server platform dedicated to the virtualization and allocation of disk storage to the hosts. The virtualization function is implemented in software that runs as a network storage control layer on top of the platform's native operating system. This allows it to leverage many of the operating system's networking, volume management, device interoperability and security features. Some storage domain servers are designed to collaborate over the SAN. In this way, they distribute the load and management chores for a large storage pool while maintaining centralized administration. The hardware performance and number of storage domain servers can be optimized to site-specific requirements.

Storage domain servers are capable of adding value to the I/O stream by optionally performing host- and storage device-independent caching, in-band performance and load monitoring, snapshot and remote mirroring services, to name a few. The richer the feature set, the simpler it becomes to institute LAN-free and server-less backups, disaster recovery programs and decision support practices across the entire storage pool without regard to the supplier of the physical SAN components. The end result is a huge reduction in acquisition, administrative and upgrade costs with high return on investment (ROI) for nearly any type of SAN environment.
A storage domain server (Figure 5) is a commercial server platform dedicated to the virtualization and allocation of disk storage to the hosts. The virtualization function is implemented in software that runs as a network storage control layer on top of the platform's native operating system. This allows it to leverage many of the operating system's networking, volume management, device interoperability and security features. Some storage domain servers are designed to collaborate over the SAN. In this way, they distribute the load and management chores for a large storage pool while maintaining centralized administration. The hardware performance and number of storage domain servers can be optimized to site-specific requirements.
Storage domain servers are capable of adding value to the I/O stream by optionally performing host- and storage device-independent caching, in-band performance and load monitoring, snapshot and remote mirroring services, to name a few. The richer the feature set, the simpler it becomes to institute LAN-free and server-less backups, disaster recovery programs and decision support practices across the entire storage pool without regard to the supplier of the physical SAN components. The end result is a huge reduction in acquisition, administrative and upgrade costs with high return on investment (ROI) for nearly any type of SAN environment.
The similarities to specialized virtualization engines are not coincidence; many specialized appliances are simply storage domain servers with hardware and software add-ons. While they lose some of the flexibility of a storage domain server, these appliances bundle the necessary services in a plug-and-play solution at targeted price points. In the end, just as the deployment of network domain servers delivered significant advancement for LANs, storage domain servers promise to deliver the most compelling advantages of disk virtualization for SANs.
Conclusions
The recent flood of storage virtualization products presents an abundance of choices - and a fair share of confusion. To cut through the chaos, we've tried to identify the key factors that will influence each offering's long-term success and viability for both the end user and the vendor. These are summarized in Table 1 below. Ultimately, the best product for you will provide complete freedom of choice and high performance at a reasonable cost. That way, you - not the vendor - have control over your storage environment.
The recent flood of storage virtualization products presents an abundance of choices - and a fair share of confusion. To cut through the chaos, we've tried to identify the key factors that will influence each offering's long-term success and viability for both the end user and the vendor. These are summarized in Table 1 below. Ultimately, the best product for you will provide complete freedom of choice and high performance at a reasonable cost. That way, you - not the vendor - have control over your storage environment.
Lâu lắm rồi mình không còn dùng blog này nữa. Nay về thăm nhà cũ, thấy có tin nhắn, nên sang đáp lễ với bạn. Mình đang sử dụng blog bên yahoo. Lúc nào rảnh ghé chơi: http://vn.myblog.yahoo.com/doahoavothuong1411
Trả lờiXóa