Cơ sở dữ liệu phân tán là gì

Trong những hệ thống đọc tin thống trị to, phân cấp với phân tán các chỗ thì vấn đề trở ngại lớn nhất chạm chán yêu cầu lúc khai thác dữ liệu làdo dữ liệu được tàng trữ nghỉ ngơi nhiều khu vực (phân tán về địa lý), nghỉ ngơi nhiều format không giống nhau: MS Excel, Foxpro, MS Access, SQL SERVER, ORACLE…. Từ hoàn cảnh đó, bài bác báo đề cập đến việc khám phá quy mô kho dữ liệu phân tán nhằm tích lũy, tích thích hợp, biến đổi, đồng bộ dữ liệu từ khá nhiều địa điểm, những nguồn không giống nhau góp cho những nhà cai quản có thể xuất bản một hệ thống ban bố quản lý thống độc nhất vào toàn cửa hàng, đơn vị chức năng của bản thân mình. Bài viết giới thiệu công đoạn xây cất tương tự như một số trong những trọng trách quản ngại trị kho tài liệu thống trị huấn luyện và giảng dạy của trường Đại học tập.

Bạn đang xem: Cơ sở dữ liệu phân tán là gì

1. Đặt vấn đề

Trong thời đại của thôn hội lên tiếng với nền kinh tế trí thức, đầy đủ buổi giao lưu của những tổ chức triển khai ước ao đạt hiệu quả cao, giành được thắng lợi trong gắng đối đầu gay gắt thì tuyệt nhất thiết nên có những phương thức để có được phần nhiều thông tin, trí thức cần thiết một phương pháp nkhô hanh và đúng đắn.

Đối với những khối hệ thống thông tin béo những hiểu biết trường đoản cú nơi chỉ giải quyết và xử lý xử lý phần đông các bước mỗi ngày nay đã tiến cho tới đáp ứng được rất nhiều từng trải tin báo ở mức độ cao hơn. Các công ty thống trị điều hành ko phần lớn ý muốn hiểu rằng quá trình đã ra mắt như thế nào bên cạnh đó biết vật gì vẫn xảy ra tiếp đến, tức là đọc tin mang ý nghĩa so với và hệ thống đọc tin có công dụng hỗ trợ ra quyết định. Tuy nhiên, Việc chế tạo một hệ thống như thế vấp váp cần một số hạn chế về phương diện chuyên môn, đặc biệt là khi size cũng giống như độ phức hợp của môi trường ban bố tăng thêm. Những hệ thống thông báo sản xuất theo phương thức truyền thống ko làm ưng ý người tiêu dùng với những nhà quản lý khối hệ thống đọc tin.

Yêu cầu đạt được thông báo mau lẹ, đúng đắn ship hàng mang đến các bước rất khó gì có được bởi vì dữ liệu ngày 1 những, tàng trữ phân tán sống những địa điểm (phù hợp cùng với tổ chức triển khai phân cung cấp của những solo vị), nghỉ ngơi nhiều dạng ko tương thích cùng nhau, thậm chí còn còn nghỉ ngơi phần đa dạng phi cấu trúc. hầu hết hệ thống lên tiếng đã được xây dựng không tương hợp cùng nhau cùng ko tương xứng cùng với phần lớn hệ thông báo mới được kiến thiết.

Một số trở ngại thường xuyên gặp gỡ khi khai thác tài liệu vào hệ thống đọc tin là

Khó tìm kiếm thấy dữ liệu đề nghị thiết: Dữ liệu rải rác rến làm việc không hề ít khối hệ thống với các bối cảnh cùng phép tắc không giống nhau, khiến tốn những thời gian gửi từ hệ thống này quý phái hệthống khác.

Khó kéo ra được tài liệu đề nghị thiết: Thường xulặng yêu cầu có chuyên gia hỗ trợ, dẫn đến quá trình dồn gò.

Khó hiểu tài liệu search thấy: Mô tả tài liệu nghèo khổ cùng thường xuyên cách biệt với các thuật ngữ nhiệm vụ không còn xa lạ .

Khó sử dụng được dữ liệu kiếm tìm thấy: Kết quả hay ko đáp ứng nhu cầu về thực chất tài liệu cùng thời gian tìm tìm.

Vấn đề đặt ra là làm nuốm làm sao nhằm tổ chức triển khai, khai quật được số đông khối lượng dữ liệu mập mạp, tàng trữ nhiều khu vực, sống các dạng dữ liệu khác nhau đó một biện pháp hiệu quả trong số hệ thống đọc tin lớn?

2. Một số quan niệm cơ bản

2.1. Kho tài liệu (Data Warehouse - DW)

Kho dữ liệu là tuyển chọn tập những các đại lý dữ liệutích phù hợp, phía chủ thể, được thiết kế theo phong cách nhằm cung cấp mang lại tác dụng hỗ trợ quyết định <4>.

Theo John Ladley <5>, Công nghệ kho dữ liệu (Data Warehouse Technology) là tập những phương pháp, nghệ thuật cùng những cách thức có thể kết hợp, cung ứng nhau nhằm đưa thông tin cho những người sử dụng trên đại lý tích hòa hợp từ nhiều nguồn dữ liệu, các môi trường khác biệt.

Kho dữ liệu hay rất lớn tới hàng nghìn GB xuất xắc thậm chí là mặt hàng Terabyte.

2.2. Kho dữ liệu cục bộ (Data Mart - DM)

Kho dữ liệu toàn cục là DataBase có những Đặc điểm như là với kho tài liệu nhưng với bài bản nhỏ tuổi rộng cùng lưu trữ tài liệu về một nghành nghề dịch vụ, một siêng ngành 6.

Data mart phụ thuộc (Dependent Data Mart): Chứa phần đông tài liệu được mang trường đoản cú DW và đầy đủ tài liệu này sẽ được trích lọc cùng tinc chế, tích thích hợp lại ở tầm mức cao hơn nhằm phục vụ một chủ đề nhất định của Datamart <7>.

Data mart chủ quyền (Independent Data Mart)

Không hệt như Datamart nhờ vào, Data mart hòa bình được tạo ra trước DW và tài liệu được thẳng đem từ bỏ những mối cung cấp không giống nhau <7>.

2.3. Trung tâm tài liệu phân tán (Distributed Database)

Một các đại lý tài liệu Phân tán là sự tập hòa hợp tài liệu phân tán về phương diện luận lý bọn chúng và một khối hệ thống tuy vậy được trải rộng nghỉ ngơi những chỗ (site) của một mạng máy vi tính <1>.

Định nghĩa này nhấn mạnh vấn đề nhì chi tiết đặc biệt đồng nhất của một CSDL Phân tán là:

Sự Phân tán (Distribution): Nghĩa là tài liệu ko hay trú làm việc và một chỗ (gọi theo nghĩa Chip xử lý - processor), điều cơ mà bạn cũng có thể minh bạch một DataBase Phân tán với 1 CSDL triệu tập, hiếm hoi.

Sự tương quan luận lý (Logical correlation): Nghĩa là tài liệu bao hàm đặc thù tương tác mật thiết với nhau, điều mà chúng ta có thể riêng biệt một DataBase Phân tán với cùng một tập hợp những CSDL toàn bộ (local database) hoặc các tập tin thường trú làm việc phần lớn chỗ khác nhau của một mạng máy tính.

Xem thêm: Sinh Năm 1990 Tuổi Ngọ 1990 Mệnh Gì ? Là Tuổi Gì ? Hợp Màu Nào

Tại sao phải áp dụng CSDL phân tán?

Có những lý do tại vì sao cải cách và phát triển DataBase Phân tán:

-Các nguyên do về tổ chức triển khai (organizational) với tài chính (economic)

-Kết nối lấn nhau (interconnection) của các CSDL hiện tại

-Sự lớn mạnh ngày càng tăng (incremental growth)

-Giảm ngân sách truyền thông media (communication overhead)

-Các nghiên cứu về năng suất (performance cónideration)

-Độ tin cậy (reliability) và tính chuẩn bị (availability)

Các nấc trong veo phân tán

Tính trong suốt Phân tán (distribution transparency) là tính độc lập của công tác vận dụng so với Việc Phân tán dữ liệu. Vấn đề trong veo phân tán được triển khai trải qua phân mhình họa dữ liệu. Phân tung những quan hệ tình dục toàn bộ thành các mhình ảnh có thể được tiến hành bằng phương pháp vận dụng hai một số loại phân mhình họa không giống nhau:

*

3. Mô hình kho dữ liệu phân tán

Kho tài liệu phân tán bao hàm sự phối hợp của hai có mang cơ bản là sự tích đúng theo (Intergration) những yếu tố tài liệu cùng sự phân tán (Distribution) trải qua các nguyên tố của mạng nlỗi hình 1:

*

Hình 3.1. Tích phù hợp và phân tán dữ liệu

Kho dữ liệu phân tán (Distributed Data Warehouse - DDW) có thể được quan niệm nlỗi là việc tích thích hợp ngắn gọn xúc tích của một tập những share dữ liệu của các tài liệu được phân tán về mặt trang bị lý qua các node của một mạng laptop <7>.

Kho dữ liệu phân tán có hai kiến trúc chính là kho dữ liệu phân tán thuần duy nhất với kho tài liệu phân tán không thuần nhất.

3.1. Kho tài liệu phân tán thuần độc nhất (Homogenous distributed data warehouses )

Kho tài liệu phân tán thuần tuyệt nhất là kho tài liệu màtrong những số đó tất cả các kho tài liệu tổng thể (DM) ngơi nghỉ các nơi (Site) đềuđề nghị cần sử dụng thông thường một hệ quản lí trị DataBase <7>.

lấy một ví dụ, vào một Hệ thống cơ sở dữ liệu phân tán thuần nhất của Oracle thì tất cả những Database đông đảo buộc phải là Oracle Database. Hình 2 minch họa khối hệ thống DataBase phân tán thuần độc nhất vô nhị với 3 DataBase là DAOTAO, KHOA với THUVIEN. Một áp dụng hoàn toàn có thể truy vấn hoặc hiệu chỉnh tài liệu từ rất nhiều cơ sở dữ liệu khác biệt bên trên mạng.

*

Hình 3.2. Kho dữ liệu phân tán thuần nhất

Kiến trúc phân tán thuần tuyệt nhất tất cả một số trong những ưu điểm sau:

Do toàn bộ các DM hầu hết dùng bình thường DBMS đề xuất công tác làm việc quản ngại trị dễ dàng rộng. Người quản lí trị ko cần phải biết kỹ năng quản lí trị vào toàn bộ những DBMS khác biệt nlỗi DB2, SQL SERVER,…Công tác đổi khác dữ liệu không đòi hỏi cao do tất toàn bộ những DM cần sử dụng tầm thường cấu tạo tài liệu với những ràng buộcNhiệm vụ tích thích hợp tài liệu tự những nguồn dễ dàng và dễ quản lí lýThời gian đáp ứng những truy vấn nhanh khô (rapid response times)

Tuy nhiên, kho tài liệu phân tán thuần tuyệt nhất phù hợp duy nhất so với hầu như khối hệ thống xây dựng mới cùng tất cả kế hoạch từ trước, đối với các hệ thống kế thừa dữ liệu từ các mối cung cấp đang gồm quá trình chuyển đối và tích hòa hợp tài liệu mất tương đối nhiều thời hạn và phức hợp.

3.2. Kho dữ liệu phân tán không thuần nhất (Heterogenous Distributed Data Warehouses )

Kho tài liệu phân tán ko thuần tuyệt nhất là kho dữ liệu mà trong những số ấy những kho dữ liệu cục bộ (DM) làm việc các khu vực (Site) trong mạng có thể không thuộc bình thường hệ cai quản trị DataBase <7>.

lấy ví dụ, vào một Hệ thống cơ sở dữ liệu phân tán ko đồng hóa của Oracle thì phải tất cả không nhiều nhấtDatabase là Non- Oracle Database

Đối cùng với khối hệ thống DataBase phân tán không thuần tốt nhất tác dụng đó là kế thừa được các DataBase đang mãi mãi trước đó dẫu vậy khó khăn lớn số 1 là quản trị với đổi khác tài liệu Khi phải truy vấn tự xa bởi vì mỗi DBMS gồm phong cách thiết kế, cách thức truy cập tài liệu và bảo mật riêng. Vì vậy trong khối hệ thống này nên có những dịch vụ kết nối biến đổi (Transparent Gateway) bao gồm sứ mệnh nlỗi bộ thông ngôn thân những DBMS trong khối hệ thống phân tán

*

Hình 3.3. Kho tài liệu phân tánkhông thuần nhất

Kiến trúc phân tán ko thuần độc nhất vô nhị tất cả một trong những ưu điểm sau:

- Kế quá được những mối cung cấp dữ liệu từ bỏ những DM vẫn tồn tại

-Thích vừa lòng cho những khối hệ thống tạo ra bên trên cơ sở mở rộng hệ thống vẫn bao gồm bởi vì bên trên thực tiễn các đơn vị chức năng hay bước đầu cùng với các DM nhỏ tuổi cho các cơ quan, sau đó cải tiến và phát triển thành kho tài liệu to hơn đến toàn công ty

-Tính trường đoản cú trị CSDL cao

Tuy nhiên, khối hệ thống phân tán không thuần tốt nhất chạm mặt khó khăn trong Việc tích phù hợp, đổi khác tài liệu cũng tương tự công tác làm việc quản trị tài liệu bởi mỗi DBMS gồm kết cấu tài liệu, buộc ràng, phương thức truy vấn, bảo mật thông tin dữ liệu không giống nhau.

4. Quản trị kho dữ liệu phân tán

Nhiệm vụ chính để tạo lập và quản trị kho dữ liệu phân tán gồm các công việc chính sau:

Chuyển thay đổi dữ liệu: Nhiệm vụ hết sức đặc biệt khi khởi sản xuất một kho tài liệu là chất nhận được bạn quản ngại trị hoàn toàn có thể biến đổi tài liệu tự những format khác nhau (MS Excel, MS Access, XML, Squốc lộ SERVER) tự các nguồn không giống nhauvẫn trường thọ trước kia về định hình thống nhất.

Tích hợp dữ liệu: Chức năng tích thích hợp dữ liệu có thể chấp nhận được người quản lí trị tài liệu có thể trao đổi dữ liệu tự những Data Mart không giống nhau vào cửa hàng. Nguyên ổn tắc của tích hòa hợp dữ liệu thân những Data Mart là các Data Mart thảo luận dữ liệu nên có những bảng tất cả cấu trúc tương tự nhau cùng dựa vào khóa bao gồm.

Đồng bộ dữ liệu: Chức năng này chất nhận được fan quản lí trị kho dữ liệuso sánh, làm không bẩn tài liệu làm cho tài liệu thân các Data mart khiến cho tài liệu vào khối hệ thống có tính nhất quán cao.

Tạo mới: Chức năng này chất nhận được tạo ra các bảng bắt đầu vào Data Mart đích trong các trường phù hợp Data Mart đích chưa tồn tại bảng tài liệu tương xứng cùng với Data mart nguồn. Công Việc này cực kỳ cần thiết lúc bắt đầu khởi chế tạo ra các Data Mart.

Lọc dữ liệu: Đây là chức năng có thể chấp nhận được trích chọn dữ liệu theo một trong những tiêu chuẩn của dữ liệu vào Data Mart làm sao kia để khám nghiệm, cập nhật giỏi đưa vào các Data Mart đích.

Xem thêm: Xem Vận Mệnh, Tử Vi Người Tuổi Chuột Mệnh Gì Theo Mệnh Nạp Âm

Phân tán dữ liệu: Chức năng này cho phép fan quản ngại trị kho tài liệu hoàn toàn có thể phân tán tài liệu thân những Data Mart trong hệ thống. Phân tán ngang mang lại tạo ra các bảng dữ liệu được phân tán theo cách không thay đổi cấu trúc bảng vào Data Mart mối cung cấp nhưng mà hoàn toàn có thể hiện nay dữ liệu không giống.

Hợp nhất: Chức năng đúng theo tuyệt nhất dữ liệu được tiến hành ví như các bảng được phân tán theo chiều dọc củ đã làm được triển khai trước kia qua chức năng phân tán dữ liệu. Yêu cầu của phân tán theo chiều dọc là vớ cảc những bảng tham gia hợp duy nhất nên bao gồm thuộc khóa thiết yếu. Chức năng này chất nhận được tổng hợp dữ liệu từ bỏ những bảng khác biệt trải qua khóa chủ yếu.

5. Xây dựng công cụ quản trị kho dữ liệu quản lý đào tạo trường Đại học Kinch tế – Đại học Đà Nẵng

5.1. Cài đặt những kho tài liệu toàn thể (Data Mart) trên ORACLE

Bảng 2. Danh mục những đại lý dữ liệu toàn cục của kho tài liệu đào tạo


Chuyên mục: Blockchain