|
|
|
|
|
Business Intelligence trong SQL Server 2008 - Phần 2: Hợp nhất việc truy cập và lưu trữ dữ liệu
|
|
|
Xem thêm: business, intelligence, trong, sql, server, 2008, phan, 2, hop, nhat, viec, truy, cap, va, luu, tru, du, lieu
|
Phần 1: Giới thiệu
Hợp nhất việc truy cập và lưu trữ dữ liệu
Hầu hết các tổ chức đều có nhiều hệ thống doanh nghiệp, đi kèm theo mỗi doanh nghiệp này là một kho dữ liệu chuyên dụng của chính nó. Mặc dù bạn có thể thường tạo các báo cáo từ các ứng dụng riêng, thực hiện phân tích trên dữ liệu mà chúng có, bạn chỉ có thể dành được một sự thấu nhất quán và hoàn tất trong doanh nghiệp bằng việc hợp nhất các dữ liệu khác nhau thông qua doanh nghiệp để tạo một nguồn dữ liệu trung tâm cho việc báo cáo và phân tích.
Hợp nhất dữ liệu công ty cho việc phân tích và báo cáo
SQL Server 2008 hỗ trợ hai phương pháp chung để hợp nhất dữ liệu doanh nghiệp cho việc phân tích và báo cáo:
- Kho dữ liệu: Một kho dữ liệu chuyên dung cho dữ liệu của doanh nghiệp sẽ được đặt và đồng bộ với dữ liệu doanh nghiệp từ các nguồn khác nhau trong toàn doanh nghiệp. Ưu điểm chính của phương pháp này là bạn có thể thiết kế kho dữ liệu cho việc thực thi báo cáo và phân tích tối ưu mà không ảnh hưởng đến hiệu suất của các ứng dụng dòng doanh nghiệp. Một ưu điểm khác của phương pháp này là bạn có thể xóa và hợp nhất dữ liệu đến từ nhiều nguồn khác nhau vào một phiên bản hợp nhất.
- Sự trừu tượng hóa nguồn dữ liệu. SQL Server 2008 Analysis Services cho phép tạo các quan sát (view) nguồn dữ liệu để cung cấp một lớp trừu tượng trên một hay nhiều nguồn dữ liệu khác nhau. Sau đó bạn có thể sử dụng view nguồn dữ liệu này như một nguồn khác cho việc phân tích, báo cáo và các dịch vụ tích hợp. Với một view nguồn dữ liệu, dữ liệu được triệu gọi từ các hệ thống nguồn bên dưới khi phân tích xuất hiện hoặc báo cáo được tạo ra. Ưu điểm chính của phương pháp này là nó cho phép phân tích dữ liệu theo thời gian thực trong các ứng dụng doanh nghiệp của bạn. Thêm vào đó, các quan sát nguồn dữ liệu thông qua lớp trừu tượng được đưa vào này có thể được sử dụng để tạo các tên thân thiện để thay thế cho các tên bảng dài hay khó hiểu.
Các phương pháp này được thể hiện trong hình 1. Với SQL Server 2008, bạn có thể sử dụng các phương pháp này hoặc có thể kết hợp cả hai chúng trong một dự án chung.
 Hình 1
Làm việc với dữ liệu của bạn và ý định bạn muốn thực hiện
Không quan tâm đến phương pháp nào bạn sẽ sử dụng để hợp nhất dữ liệu doanh nghiệp, SQL Server 2008 xây dựng trên sự kế thừa các phiên bản có trước của nó cho cả dữ liệu quan hệ và không quan hệ bằng cách cung cấp các kiểu dữ liệu khác nhau cho phép các chuyên gia phát triển phần mềm và các quản trị viên có thể lưu và quản lý một cách hiệu quả dữ liệu không cấu trúc như các tài liệu, image, vì vậy bạn có thể lưu và quản lý, phân tích dữ liệu theo định dạng hợp với doanh nghiệp của bạn nhất.
SQL Server 2008 gồm có sự hỗ trợ nâng cao cho việc lưu trữ dữ liệu XML cũng như kiểu dữ liệu FILESTREAM, kiểu dữ liệu cho phép dữ liệu nhị phân cỡ lớn được lưu trong hệ thống file vẫn còn một phần tích hợp cơ sở dữ liệu với độ vững chắc cao. Thêm vào đó, những hạn chế về kích thước của các kiểu dữ liệu được người dùng định nghĩa cũng bị loại bỏ, điều đó làm cho nó có khả năng vượt được giới hạn 8KB bắt buộc như trong các phiên bản phát hành trước đây của SQL Server. Sự hỗ trợ cho các kiểu dữ liệu vị trí và không gian làm cho nó có khả năng lưu và phân tích dữ liệu liên quan đến địa lý thích hợp với các chuẩn công nghiệp.
Tích hợp tất cả các nguồn dữ liệu doanh nghiệp
Các view quan sát nguồn dữ liệu của SQL Server 2008 cho phép tích hợp dữ liệu và truy cập vào dữ liệu tổ chức từ các kho lưu trữ dữ liệu không đồng nhất trong toàn bộ doanh nghiệp, như SQL Server, Oracle, DB2 và Teradata. Các view này cũng cung cấp khả năng mở rộng cho việc lưu trữ OLAP và khả năng hỗ trợ rộng rãi cho các nguồn dữ liệu khác nhau trong SQL Server Integration Services, điều đó có nghĩa rằng bạn có thể trích dữ liệu từ các kiểu ứng dụng doanh nghiệp nào đang tồn tại. Vì vậy việc hợp nhất dữ liệu trong tất cả các nguồn dữ liệu doanh nghiệp trở nên dễ dàng mà không cần quan tâm đến bạn muốn xây dựng lớp trừu tượng qua một view nguồn dữ liệu hay không hoặc sử dụng quá trình ETL để đồng bộ hóa kho dữ liệu chuyên dụng cho việc phân tích và báo cáo.
Thêm vào đó, qua sự hỗ trợ cho các dịch vụ Web và Microsoft .NET Framework, SQL Server 2008 hỗ trợ khả năng cộng tác với nhiều nền tảng, ứng dụng và các ngôn ngữ lập trình khác nhau, chính vì vậy bạn có thể tối đa hóa đầu tư của bạn trong các hệ thống mới và hệ thống đang tồn tại bằng việc tích hợp và kết nối các nguồn dữ liệu khác nhau. Sự hỗ trợ cho các chuẩn mở mới có và các chuẩn đang tồn tại như HTTP, XML, SOAP, Xquery, XSD, và hơn thế nữa đã làm cho việc truyền thông trong các hệ thống doanh nghiệp mở rộng của bạn được cải thiện.
Thực thi kho dữ liệu
SQL Server 2008 cung cấp một nền tảng lưu trữ dữ liệu có khả năng mở rộng và toàn diện, cho phép tổ chức của bạn có thể tích hợp dữ liệu vào các kho lưu trữ nhanh hơn phù hợp với sự tăng về các ấn bản và yêu cầu cao trong việc quản lý dữ liệu và người dùng.
Tối ưu các quá trình ETL
Các kho chứa dữ liệu thường được cư trú và được nâng cấp từ các hệ thống nguồn qua quá trình ETL. Sau khi load dữ liệu ban đầu vào kho dữ liệu, refresh định kỳ cho dữ liệu mới và đã thay đổi từ các hệ thống nguồn được thực hiện để bảo đảm rằng kho dữ liệu được cập nhật một cách kịp thời.
Các dịch vụ tích hợp của SQL Server mang đến một nền tảng toàn diện, cho phép bạn có thể sử dụng để trích dữ liệu từ các hệ thống nguồn khác nhau, tạo các phép biến đổi cần thiết đối với dữ liệu hoặc cấu trúc và định dạng của nó, sau đó load dữ liệu đã biến đổi này vào kho dữ liệu. Việc thực hiện các tra cứu để tương xứng bản ghi từ các hệ thống nguồn đối với bản ghi đang tồn tại trong kho dữ liệu là một hoạt động chung trong các quá trình ETL, và trong SQL Server 2008 việc thực thi các tra cứu được cải thiện đáng kể để nâng cao hoạt động đáp ứng cho các bảng dữ liệu lớn cực độ.
Để giúp kiểm tra những thay đổi đối với dữ liệu và bảo đảm sự vững chắc an toàn của kho dữ liệu, SQL Server 2008 giới thiệu chức năng Change Data Capture (CDC) để ghi các nâng cấp trong các bảng thay đổi, điều này làm cho nó dễ dàng trong việc xác định hàng nào đã được thay đổi để xác định các chi tiết về sự thay đổi và nguyên nhân của nó.
Quản lý tài nguyên phần cứng một cách hiệu quả
Thông qua việc hỗ trợ nén dữ liệu, SQL Server 2008 cho phép bạn có thể lưu dữ liệu một cách hiệu quả hơn và giảm được nhiều chi phí. Thêm vào đó, vấn đề nén cũng được cải thiện đáng kể về mặt hiệu suất cho các luồng công việc vào/ra lớn. SQL Server 2008 cũng cung cấp sự hỗ trợ sẵn có khi cài đặt sản phẩm cho việc nén backup. Thêm vào đó, kiểu dữ liệu VARDECIMAL và các cột rải mỏng trong SQL Server 2008 sẽ giúp bạn có được sự hiệu quả tốt nhất đối với các tài nguyên lưu trữ trên đĩa của bạn bằng cách giảm số khoảng trống cần thiết cho các bảng lớn gồm phần lớn các giá trị số và NULL có trong kho dữ liệu.
Thêm vào các hiệu quả trong việc lưu trữ dữ liệu, SQL Server 2008 hỗ trợ định phần động của Address Windowing Extensions (AWE) đã được bản đồ hóa bộ nhớ hỗ trợ lên đến 64GB nhớ với Windows Server 2003, Datacenter Edition, và 2TB với phiên bản 64-bit, để hỗ trợ cho các môi trường lưu trữ lớn hơn.
SQL Server 2008 cũng giới thiệu Resource Governor, để cho phép quản trị viên định nghĩa các giới hạn tài nguyên và các quyền ưu tiên cho nhiều luồng công việc khác nhau, để các luồng công việc xảy ra vào cùng thời điểm đều có được khả năng thực thi phù hợp và có khả năng quản lý các vấn đề về tài nguyên.
Tối ưu thực thi cơ sở dữ liệu
SQL Server 2008 gồm có cỗ máy cơ sở dữ liệu quan hệ hiệu suất cao cho phép bạn có thể xây dựng các giải pháp lưu trữ dữ liệu hiệu quả. Các cách tân như tối ưu hóa truy vấn cho lược đồ sao và các công cụ sẽ giúp bạn hiệu chỉnh được các chỉ mục và cấu trúc dữ liệu, tạo cho SQL Server một sự chọn lọc tự nhiên cho kho lưu trữ dữ liệu được truy vấn. Với việc giới thiệu của câu lệnh MERGE Transact-SQL trong SQL Server 2008, các chuyên gia phát triển phần mềm có thể quản lý các kịch bản lưu trữ dữ liệu một cách hiệu quả hơn, như kiểm tra xem có hàng nào tồn tại hay không, sau đó thực hiện chèn hay nâng cấp. Thêm vào đó, một mở rộng cho mệnh đề GROUP BY cho phép người dùng có thể định nghĩa đa nhóm trong cùng một truy vấn. Grouping Sets cho ra một tập các kết quả tương đương như UNION ALL của các hàng khác nhau được nhóm, điều này làm cho việc thu nạp truy vấn và báo cáo dễ dàng và nhanh hơn.
SQL Server 2008 hỗ trợ các bảng được phân vùng để giúp bạn tối ưu hiệu suất và quản lý được các bảng lớn, với sự hỗ trợ mới về các bảng phân vùng song song, bạn có thể tối ưu một cách đáng kể kho dữ liệu của mình bằng cách sử dụng các bảng phân vùng.
Phần 3: Xây dựng và quản lý các giải pháp BI phức tạp Phần 4: Mở rộng phạm vi của giải pháp BI
|
|
Theo Microsoft |
Xem thêm: business, intelligence, trong, sql, server, 2008, phan, 2, hop, nhat, viec, truy, cap, va, luu, tru, du, lieu
|
|
|
|
|
|
|
Bài viết mới về thiết bị số:
|
AVG Anti-Virus Free Edition 8.5.339
Phát hành:
Grisoft
Download:620528
Dung lượng:
62.09 MB
Tìm thêm:diệt virus, avg, grisoft, firewall, anti-spyware, quét virus, avg free, avg anti-virus free, avg anti-virus free edition
|
|
|
Kaspersky Anti-Virus 2009 (8.0.0.506)
Phát hành:
Kaspersky Lab
Download:341720
Dung lượng:
36.9 MB
Tìm thêm:kaspersky, anti-virus 2009, diệt virus
|
|
|
Avira AntiVir Personal - Free Antivirus 9.0.0.386
Phát hành:
Avira
Download:341073
Dung lượng:
28.61 MB
Tìm thêm:avira, antivir, antivirus, diệt virus, miễn phí, avira, scan, virus, virus protection
|
|
|
Kaspersky Internet Security 2009
Phát hành:
Kaspersky Lab
Download:162616
Dung lượng:
36.72 M
Tìm thêm:kaspersky internet security, diệt virus, bảo mật, an toàn lướt web, ngăn chặn
|
|
|
Avira Antivir Virus Definition File Update June 5, 2009
Phát hành:
Avira
Download:151872
Dung lượng:
24.4 MB
Tìm thêm:avira antivir virus definition, avira antivir virus, definition file, definition, bản cập nhật
|
|