thumbnail

Bài test chuyên môn IT: Dữ liệu lớn Big Data có đáp án

Bài test chuyên môn IT về Big Data bao gồm các câu hỏi trắc nghiệm (MCQ) được biên soạn kỹ lưỡng nhằm kiểm tra kiến thức của bạn về cơ sở hạ tầng dữ liệu lớn, công nghệ phân tích, và các công cụ phổ biến như Hadoop, Spark, và NoSQL. Đây là tài liệu hữu ích cho những ai đang học hoặc làm việc trong lĩnh vực Big Data, giúp đánh giá năng lực chuyên môn và hiểu biết sâu về lĩnh vực này. Kèm đáp án chi tiết và hỗ trợ làm bài online, bài test giúp người học tự tin nâng cao kiến thức Big Data.

Từ khoá: IT Big Data kiểm tra chuyên môn trắc nghiệm MCQ Hadoop Spark NoSQL bài kiểm tra online đáp án chi tiết kiến thức dữ liệu lớn chuyên gia IT

Số câu hỏi: 50 câuSố mã đề: 1 đềThời gian: 1 giờ

366,606 lượt xem 28,188 lượt làm bài


Bạn chưa làm đề thi này!!!

 

Xem trước nội dung:

Câu 1: 0.2 điểm
Các thành phần chính của Big Data là gì?
A.  
HDFS
B.  
MapReduce
C.  
YARN
D.  
Tất cả các thành phần trên
Câu 2: 0.2 điểm
Trong các lựa chọn sau, node slave (nô lệ) là gì?
A.  
Job node
B.  
Data node
C.  
Task node
D.  
Name node
Câu 3: 0.2 điểm
Thuật ngữ nào được dùng để định nghĩa mô hình đa chiều của kho dữ liệu (data warehouse)?
A.  
Table
B.  
Data cube
C.  
Tree
D.  
Data structure
Câu 4: 0.2 điểm
Đúng hay sai: Qubole là một công cụ Big Data.
A.  
Đúng
B.  
Sai
Câu 5: 0.2 điểm
Hadoop được viết bằng ngôn ngữ nào?
A.  
C++
B.  
Java
C.  
Rust
D.  
Python
Câu 6: 0.2 điểm
Lớp Mapper là gì?
A.  
Static type
B.  
Generic type
C.  
Abstract type
D.  
Final
Câu 7: 0.2 điểm
Hadoop chạy trên nền tảng nào trong các nền tảng sau?
A.  
Debian
B.  
Cross-platform
C.  
Bare metal
D.  
Unix-like
Câu 8: 0.2 điểm
Các đơn vị logic nhỏ, nơi kho dữ liệu (data warehouse) lưu giữ lượng dữ liệu lớn được gọi là gì?
A.  
Access layers
B.  
Data marts
C.  
Data storage
D.  
Data miners
Câu 9: 0.2 điểm
Kết quả của các nhiệm vụ map được ghi vào đâu?
A.  
Đĩa cục bộ
B.  
File system
C.  
HDFS
D.  
Bộ lưu trữ thứ cấp
Câu 10: 0.2 điểm
Có bao nhiêu dạng dữ liệu lớn (big data)?
A.  
1
B.  
2
C.  
3
D.  
4
Câu 11: 0.2 điểm
Tổng số V của Big Data là bao nhiêu?
A.  
3
B.  
4
C.  
5
D.  
6
Câu 12: 0.2 điểm
Giao dịch dữ liệu của ngân hàng thuộc loại dữ liệu nào?
A.  
Dữ liệu không cấu trúc
B.  
Dữ liệu có cấu trúc
C.  
Cả hai
D.  
Không thuộc loại nào
Câu 13: 0.2 điểm
Hoạt động nào có thể được thực hiện trên kho dữ liệu (data warehouse)?
A.  
Alter
B.  
Modify
C.  
Scan
D.  
Đọc/ghi
Câu 14: 0.2 điểm
Kích thước tối thiểu của dữ liệu mà một đĩa có thể đọc hoặc ghi trong HDFS là gì?
A.  
Kích thước byte
B.  
Kích thước block
C.  
Heap
D.  
Không có đáp án nào đúng
Câu 15: 0.2 điểm
Nguồn của tất cả dữ liệu kho dữ liệu (data warehouse) được gọi là gì?
A.  
Môi trường chính thức
B.  
Môi trường kho dữ liệu (data warehouse)
C.  
Môi trường vận hành
D.  
Môi trường công nghệ
Câu 16: 0.2 điểm
Thời gian lưu trữ dữ liệu trong kho dữ liệu (data warehouse) là bao lâu?
A.  
3-4 năm
B.  
5-6 năm
C.  
5-10 năm
D.  
1-2 năm
Câu 17: 0.2 điểm
Mục đích của việc làm sạch dữ liệu là gì?
A.  
Loại bỏ dữ liệu nhiễu
B.  
Thực hiện chuyển đổi để sửa dữ liệu sai
C.  
Sửa chữa các bất nhất trong dữ liệu
D.  
Tất cả các mục trên
Câu 18: 0.2 điểm
Dữ liệu có thể được cập nhật ở đâu?
A.  
Môi trường thông tin
B.  
Môi trường kho dữ liệu (data warehouse)
C.  
Môi trường vận hành
D.  
Môi trường khai thác dữ liệu
Câu 19: 0.2 điểm
Lợi ích của xử lý Big Data là gì?
A.  
Doanh nghiệp có thể sử dụng thông tin bên ngoài khi đưa ra quyết định
B.  
Hiệu quả hoạt động tốt hơn
C.  
Cải thiện dịch vụ khách hàng
D.  
Tất cả các mục trên
Câu 20: 0.2 điểm
Công cụ nào thường được sử dụng để làm sạch và chuẩn bị dữ liệu lớn?
A.  
Pandas
B.  
Hồ dữ liệu (Data Lake)
C.  
U-SQL
D.  
kho dữ liệu (data warehouse) (Data Warehouse)
Câu 21: 0.2 điểm
Điều nào sau đây không phải là một phần của quy trình khoa học dữ liệu?
A.  
Xây dựng giao tiếp
B.  
Khám phá (Discovery)
C.  
Vận hành hóa (Operationalize)
D.  
Lập kế hoạch mô hình (Model Planning)
Câu 22: 0.2 điểm
Điều nào đúng về Big Data?
A.  
Big Data có thể được xử lý bằng các kỹ thuật truyền thống
B.  
Big Data đề cập đến các tập dữ liệu ít nhất ở kích thước petabyte
C.  
Phân tích Big Data không liên quan đến báo cáo và khai thác dữ liệu
D.  
Big Data có vận tốc thấp nghĩa là nó được tạo ra chậm
Câu 23: 0.2 điểm
__________ là dữ liệu về dữ liệu.
A.  
HDFS
B.  
MapReduce
C.  
YARN
D.  
Tất cả các mục trên
Câu 24: 0.2 điểm
__________ là một tập hợp dữ liệu được sử dụng với khối lượng lớn, nhưng đang phát triển theo cấp số nhân theo thời gian.
A.  
Cơ sở dữ liệu lớn (Big Database)
B.  
Big DBMS
C.  
Tệp dữ liệu lớn (Big Datafile)
D.  
Dữ liệu lớn (Big Data)
Câu 25: 0.2 điểm
Các bảng thực tế (Fact Tables) là gì?
A.  
HDFS
B.  
MapReduce
C.  
YARN
D.  
Tất cả các mục trên
Câu 26: 0.2 điểm
Thuộc tính nào được cấu hình trên tệp mapred-site.xml?
A.  
Các biến môi trường Java
B.  
Hệ số sao chép (Replication Factor)
C.  
Tên thư mục để lưu trữ tệp HDFS
D.  
Máy chủ và cổng nơi chạy nhiệm vụ MapReduce
Câu 27: 0.2 điểm
Chọn lý do đúng tại sao việc phân tích Big Data khó tối ưu hóa.
A.  
Công nghệ khai thác dữ liệu
B.  
Dữ liệu và các cách hiệu quả về chi phí để khai thác dữ liệu phục vụ mục đích kinh doanh
C.  
Phân tích Big Data không khó tối ưu hóa
D.  
Không có đáp án nào đúng
Câu 28: 0.2 điểm
Thành phần nào xử lý việc thu nạp dữ liệu luồng vào Hadoop?
A.  
Oozie
B.  
Hive
C.  
Kafka
D.  
Flume
Câu 29: 0.2 điểm
Thành phần nào thực hiện điều khiển nhiệm vụ (Job Control) trong Hadoop?
A.  
Lớp Task
B.  
Lớp Mapper
C.  
Lớp Job
D.  
Lớp Reducer
Câu 30: 0.2 điểm
Phân tích Big Data thực hiện các tác vụ sau đây, ngoại trừ?
A.  
Phân phối dữ liệu
B.  
Phân tích dữ liệu
C.  
Tổ chức dữ liệu
D.  
Thu thập dữ liệu
Câu 31: 0.2 điểm
Chọn thuộc tính không chính xác của kho dữ liệu (data warehouse) (Data Warehouse).
A.  
Thu thập từ các nguồn không đồng nhất
B.  
Hướng đối tượng (Subject Oriented)
C.  
Biến đổi theo thời gian (Time Variant)
D.  
Dễ bay hơi (Volatile)
Câu 32: 0.2 điểm
Chọn ngôn ngữ được sử dụng trong khoa học dữ liệu.
A.  
C++
B.  
C
C.  
R
D.  
Ruby
Câu 33: 0.2 điểm
Chọn đặc điểm chính của Big Data trong các tùy chọn dưới đây.
A.  
Giá trị (Value)
B.  
Đa dạng (Variety)
C.  
Khối lượng (Volume)
D.  
Tất cả các đáp án trên
Câu 34: 0.2 điểm
Dữ liệu có kích thước ________ byte được gọi là Big Data.
A.  
Meta
B.  
Giga
C.  
Tera
D.  
Peta
Câu 35: 0.2 điểm
DSS trong kho dữ liệu (data warehouse) là viết tắt của ________.
A.  
Hệ thống quyết định đơn lẻ (Decision Single System)
B.  
Hệ thống hỗ trợ quyết định (Decision Support System)
C.  
Hệ thống hỗ trợ dữ liệu (Data Support System)
D.  
Hệ thống lưu trữ dữ liệu (Data Storable System)
Câu 36: 0.2 điểm
Các vấn đề liên quan đến "Hiệu suất và khả năng mở rộng của thuật toán khai thác dữ liệu" thuộc vào?
A.  
Phương pháp khai thác và các vấn đề tương tác người dùng
B.  
Các vấn đề về hiệu suất
C.  
Các vấn đề về loại dữ liệu đa dạng
D.  
Không có đáp án nào đúng
Câu 37: 0.2 điểm
Tất cả các mục sau đây mô tả chính xác về Hadoop, ngoại trừ:
A.  
Mã nguồn mở (Open Source)
B.  
Dựa trên Java
C.  
Thời gian thực (Real-time)
D.  
Phương pháp tính toán phân tán
Câu 38: 0.2 điểm
Các phần kích thước cố định của công việc MapReduce được gọi là ________.
A.  
Splits
B.  
Tasks
C.  
Maps
D.  
Records
Câu 39: 0.2 điểm
Gói Hadoop Common chứa gì?
A.  
Tệp msi
B.  
Tệp war
C.  
Tệp exe
D.  
Tệp jar
Câu 40: 0.2 điểm
Có bao nhiêu phương pháp tiếp cận để tích hợp cơ sở dữ liệu không đồng nhất trong kho dữ liệu (data warehouse)?
A.  
2
B.  
3
C.  
4
D.  
5
Câu 41: 0.2 điểm
Xác định hệ thống mà kho dữ liệu (data warehouse) chủ yếu được sử dụng.
A.  
Khai thác dữ liệu và lưu trữ dữ liệu
B.  
Tích hợp dữ liệu và lưu trữ dữ liệu
C.  
Báo cáo và phân tích dữ liệu
D.  
Làm sạch dữ liệu và lưu trữ dữ liệu
Câu 42: 0.2 điểm
Xác định mô hình tính toán và hệ thống runtime mục đích chung cho Phân tích Dữ liệu Phân tán.
A.  
HDFS
B.  
MapReduce
C.  
Oozie
D.  
Tất cả các đáp án trên
Câu 43: 0.2 điểm
Định nghĩa chính xác của dữ liệu hòa giải (Reconciled Data) là gì?
A.  
Dữ liệu được lưu trữ trong một hệ thống vận hành trong tổ chức.
B.  
Dữ liệu được chọn và định dạng để hỗ trợ các ứng dụng người dùng cuối.
C.  
Dữ liệu hiện tại được dự định là nguồn duy nhất cho tất cả các hệ thống hỗ trợ quyết định.
D.  
Không có đáp án nào đúng.
Câu 44: 0.2 điểm
Xác định các yếu tố cần cân nhắc trước khi đầu tư vào khai thác dữ liệu.
A.  
Xem xét nhà cung cấp (Vendor consideration)
B.  
Chức năng (Functionality)
C.  
Tính tương thích (Compatibility)
D.  
Tất cả các đáp án trên
Câu 45: 0.2 điểm
Xác định các đặc điểm khác nhau của Phân tích Dữ liệu Lớn (Big Data Analytics).
A.  
Mã nguồn mở (Open-source)
B.  
Khôi phục dữ liệu (Data recovery)
C.  
Khả năng mở rộng (Scalability)
D.  
Tất cả các đáp án trên
Câu 46: 0.2 điểm
Xác định công nghệ Big Data không chính xác.
A.  
Apache PyTorch
B.  
Apache Kafka
C.  
Apache Hadoop
D.  
Apache Spark
Câu 47: 0.2 điểm
Xác định tác nhân thay đổi dữ liệu phổ biến nhất trong việc làm mới kho dữ liệu (data warehouse).
A.  
Logged change data
B.  
Cooperative change data
C.  
Queryable change data
D.  
Snapshot change data
Câu 48: 0.2 điểm
Xác định node nào hoạt động như một node kiểm tra trong HDFS.
A.  
Secondary Name Node
B.  
Secondary Data Node
C.  
Name Node
D.  
Data Node
Câu 49: 0.2 điểm

Big Data thường được đặc trưng bởi các thuộc tính nào?

A.  
Volume, Variety, Velocity
B.  
Volume, Veracity, Value
C.  
Cả A và B
D.  
Không có đáp án nào đúng
Câu 50: 0.2 điểm

Công cụ nào sau đây không được sử dụng để xử lý Big Data?

A.  
Hadoop
B.  
Spark
C.  
SQL Server
D.  
Microsoft Word

Đề thi tương tự

Bài Test Chuyên Môn IT: Điện Toán Đám Mây (Cloud Computing)

1 mã đề 50 câu hỏi 1 giờ

366,49928,187

Bài Test Chuyên Môn IT: Công Nghệ Web (Web Technology)

1 mã đề 50 câu hỏi 1 giờ

366,46628,184

Bài test chuyên môn IT: HTML có đáp án

1 mã đề 50 câu hỏi 1 giờ

366,34928,176

Bài Test Chuyên Môn IT: Lập Trình Java có đáp án

1 mã đề 50 câu hỏi 1 giờ

366,18728,163