thumbnail

Trắc Nghiệm Tổng Hợp Ôn Thi Môn Big Data HUBT có đáp án

Bộ câu hỏi trắc nghiệm tổng hợp ôn thi môn Big Data (Xử lý dữ liệu lớn) dành cho sinh viên HUBT, cung cấp kiến thức nền tảng và ứng dụng thực tiễn về dữ liệu lớn, các công nghệ xử lý dữ liệu như Hadoop, Spark, NoSQL, và kỹ thuật phân tích dữ liệu. Tài liệu được cung cấp miễn phí dưới hình thức online, kèm đáp án chi tiết, hỗ trợ sinh viên ôn luyện hiệu quả cho kỳ thi học phần.

Từ khoá: trắc nghiệm Big Data HUBT Đại học Kinh doanh và Công nghệ Hà Nội ôn thi dữ liệu lớn Hadoop Spark NoSQL xử lý dữ liệu đề thi Big Data miễn phí có đáp án luyện thi công nghệ thông tin

Số câu hỏi: 117 câuSố mã đề: 3 đềThời gian: 1 giờ

68,243 lượt xem 5,245 lượt làm bài


Chọn mã đề:


Bạn chưa làm Mã đề 1!!!

 

Xem trước nội dung:

Câu 1: 0.25 điểm
Loại phân tích dữ liệu nào kết quả thu được cho ta biết điều gì đã xảy ra ?
A.  
Phân tích đề xuất
B.  
Phân tích chuẩn đoán
C.  
Phân tích dự đoán
D.  
Phân tích mô tả
Câu 2: 0.25 điểm
Hệ quản trị CSLD Google Big Table là kiểu nào ?
A.  
Key value
B.  
Wide Column based
C.  
Document based
D.  
Graph based
Câu 3: 0.25 điểm
CSDL nào không phải kiểu Document:
A.  
MongoDB
B.  
CouchDB
C.  
Elasticsearch
D.  
Riak
Câu 4: 0.25 điểm
NoSQL là ?
A.  
Database
B.  
Field
C.  
Document
D.  
Collection
Câu 5: 0.25 điểm
Mục tiêu của NoSQL là gì?
A.  
NoSQL cung cấp một giải pháp thay thế cho cơ sở dữ liệu SQL để lưu trữ dữ liệu dạng văn bản.
B.  
Cơ sở dữ liệu NoSQL cho phép lưu trữ dữ liệu không có cấu trúc.
C.  
NoSQL không thích hợp để lưu trữ dữ liệu có cấu trúc.
D.  
NoSQL là một định dạng dữ liệu mới để lưu trữ các tập dữ liệu lớn.
Câu 6: 0.25 điểm
Đâu là đặc trưng quyết việc triển khai Dữ liệu lớn?
A.  
Khối lượng
B.  
Giá trị
C.  
Tốc Độ
D.  
Tính đa dạng
Câu 7: 0.25 điểm
Phân tích chuẩn đoán sử dụng kỹ thuật nào?
A.  
Lấy mẫu dữ liệu
B.  
Tương quan phân bổ
C.  
Khai phá dữ liệu
D.  
Thu thập dữ liệu
Câu 8: 0.25 điểm
Loại nào sau đây lưu trữ dữ liệu?
A.  
Name node
B.  
Data node
C.  
Master node
D.  
Không có
Câu 9: 0.25 điểm
Mô hình Điện toán đám mây SaaS ?
A.  
Cơ sở hạ tầng dưới dạng dịch vụ
B.  
Nền tảng dưới dạng dịch vụ
C.  
Phần mềm dưới dạng dịch vụ
D.  
Internet dưới dạng dịch vụ
Câu 10: 0.25 điểm
Thuật ngữ Thuật ngữ Dữ liệu lớn ra đời năm nào?
A.  
1997
B.  
2000
C.  
1998
D.  
1941
Câu 11: 0.25 điểm
Ưu điểm của công nghệ Cluster
A.  
Tất cả
B.  
Hiệu quả chi phí
C.  
TÍnh sẵn sàng cao
D.  
Khả năng mở rộng linh hoạt
Câu 12: 0.25 điểm
Kiểu phân tích dữ liệu nào cho ta biết điều gì đã xảy ra ?
A.  
Descriptive Analysis
B.  
Diagnostic Analysis
C.  
Predictive Analysis
D.  
Presciptive Analysis
Câu 13: 0.25 điểm
CSDL nào không phải kiểu Wide-Column:
A.  
Hbase
B.  
Cassandra
C.  
BigTable
D.  
Dex
Câu 14: 0.25 điểm
Hệ quản trị CSLD Neo4J là kiểu nào ?
A.  
Key value
B.  
Wide Column based
C.  
Document based
D.  
Graph based
Câu 15: 0.25 điểm
Hệ quản trị CSLD DynamoDB là kiểu nào ?
A.  
Key value
B.  
Wide Column based
C.  
Document based
D.  
Graph based
Câu 16: 0.25 điểm
Dịch vụ lưu trữ dữ của Amazon – AWS là?
A.  
Amazon S3
B.  
Amazon RDS
C.  
Amazon Lambda
D.  
EC2
Câu 17: 0.25 điểm
So với RDBMS,Hadoop
A.  
Có tính toàn vẹn dữ liêu cao hơn.
B.  
Có giao dich ACID không
C.  
Thích hợp để đọc và truy vấn nhanh
D.  
Hoạt động tốt hơn trên dữ liệu phi cấu trúc và bán cấu trúc
Câu 18: 0.25 điểm
Trong MapReduce loại nào sau đây theo dõi quá tình tiêu thụ tài nguyên trên Cluster Node ?
A.  
Master node
B.  
Name node
C.  
Single Master
D.  
Slave node
Câu 19: 0.25 điểm
Ứng dụng phân tích dữ liệu lớn hỗ trợ ngành Y tế:
A.  
Tăng việc khai thác tối ưu hóa máy móc
B.  
Tăng doanh thu từ phần mềm y tế
C.  
Tăng tính chính xác của chuẩn đoán
D.  
Tất cả
Câu 20: 0.25 điểm
Dịch vụ lưu trữ của Microsoft Azure là ?
A.  
Virtual Machines
B.  
Azure Function
C.  
Azure Disk Storage
D.  
Azure Cosmos DB
Câu 21: 0.25 điểm
Hệ CSDL NoSQL trên nền tảng Cloudera là ?
A.  
Apache Accumulo
B.  
DynamoDB
C.  
AppEngine Datastore
D.  
Table Storage
Câu 22: 0.25 điểm
Thành phần chính của hệ thống Hadoop là?
A.  
Tất cả
B.  
HDFS
C.  
YARN
D.  
MapReduce
Câu 23: 0.25 điểm
Công cụ tích hợp dữ liệu Boomi là của?
A.  
Dell
B.  
IBM
C.  
Microsoft
D.  
SAP
Câu 24: 0.25 điểm
Mục tiêu đúng nhất của phân tích dữ liệu lớn là gì ?
A.  
Tạo ra các dữ liệu phù hợp nhất với hệ thống
B.  
Sắp xếp dữ liệu có ích để sử dụng
C.  
Biến dữ liệu thành thông tin chi tiết hữu ích
D.  
Xây dựng hệ thống để quản lý dữ liệu lớn
Câu 25: 0.25 điểm
Spark được Apache Software Foundation phát triển từ năm nào ?
A.  
1993
B.  
2013
C.  
2009
D.  
2007
Câu 26: 0.25 điểm
CSDL nào không phải kiểu Graph:
A.  
InfoGrid
B.  
Hbase
C.  
InfiniteGraph
D.  
IBM Graph
Câu 27: 0.25 điểm
Ưu điểm của hệ thống HDFS là gì ?
A.  
Lưu trữ phân tán, xử lý song song, khả năng chịu lỗi cao
B.  
Lưu trữ song song, xử lý phân tán, tính sẵn sàng cao
C.  
Xử lý phân tán song song, khả năng chịu lỗi chấp nhận sai sót
D.  
Tất cả
Câu 28: 0.25 điểm
Tích hợp dữ liệu là quá trình ?
A.  
Kết hợp các dữ liệu không đồng nhất từ nhiều nguồn khác nhau
B.  
Sao chép dữ liệu vào CSDL hệ thống để tiến hành phân tích
C.  
Làm sạch các dữ liệu thu thập được từ các hệ thống thành phần
D.  
Tăng giá trị từ các tài nguyên dữ liệu đang lưu trữ phân tán
Câu 29: 0.25 điểm
Loại nào là dữ liệu Bán cấu trúc ?
A.  
Tất cả
B.  
JSON
C.  
CSV
D.  
XML
Câu 30: 0.25 điểm
Loại phân tích dữ liệu nào kết quả thu được cho ta biết tại sao điều đó xảy ra ?
A.  
Phân tích chuẩn đoán
B.  
Phân tích mô tả
C.  
Phân tích dự đoán
D.  
Phân tích đề xuất
Câu 31: 0.25 điểm
Công cụ SQL Server Integrator do ai phát triển ?
A.  
Oracle
B.  
IBM
C.  
Microsoft
D.  
SAP
Câu 32: 0.25 điểm
MapReduce do công ty nào phát triển ?
A.  
Apache
B.  
Google
C.  
IBM
D.  
Amazon
Câu 33: 0.25 điểm
Lợi ích của Cloud Computing với Big Data là ?
A.  
Triển khai hạ tầng nhanh chóng
B.  
Phân tích theo thời gian thực
C.  
Tối ưu chi phí duy trì hoạt động
D.  
Tất cả
Câu 34: 0.25 điểm
Trong MapReduce loại nào sau đây thực thi các tác vụ và cung cấp thông tin trạng thái tác vụ ?
A.  
Name node
B.  
Master node
C.  
Single Master
D.  
Slave node
Câu 35: 0.25 điểm
YARN là viết tắt của
A.  
Yahoo’s another resource name
B.  
Yet another resource negotiator
C.  
Yahoo’s archived Resource names
D.  
Yet another resource need.
Câu 36: 0.25 điểm
Dịch vụ tích hợp dữ liệu trên đám mây trên Google Cloud Platform
A.  
Google Cloud Dataprep
B.  
Google Cloud Data Fusion
C.  
Google Data Catalog
D.  
Google BigQuery
Câu 37: 0.25 điểm
Loại dữ liệu mà Hadoop có thể xử lý là
A.  
Structred (Có cấu trúc)
B.  
Semi-structured (Bán cấu trúc)
C.  
Unstructured (Không có cấu trúc)
D.  
All of the above (Tất cả những điều trên)
Câu 38: 0.25 điểm
Cloudera Enterprise có thể được triển khai trên đám mây nào
A.  
Google Cloud
B.  
Amazon AWS
C.  
Tất cả
D.  
Microsoft Azure
Câu 39: 0.25 điểm
Điều nào sau đây không phải là mục tiêu của HDFS?
A.  
Phát hiện lỗi và khôi phục
B.  
Xử lý tập dữ liệu khổng lồ
C.  
Ngăn chặn việc xóa dữ liệu
D.  
Cung cấp băng thông mạng cao để di chuyển dữ liệu
Câu 40: 0.25 điểm
Hoạt động của Map Reduce bao gồm:
A.  
Trộn & sắp xếp-Map-Reduce
B.  
Reduce- Map- Trộn & sắp xếp
C.  
Map- Trộn & sắp xếp Reduce
D.  
Sắp xếp- Trộn & Map Reduce

Đề thi tương tự

Trắc Nghiệm Tổng Hợp Ôn Thi Môn Big Data HUBT Có Đáp ÁnĐại học - Cao đẳng

3 mã đề 117 câu hỏi 1 giờ

74,3995,720

Trắc Nghiệm Tổng Hợp Ôn Thi Môn Dẫn Luận Ngôn Ngữ - Miễn Phí, Có Đáp ÁnĐại học - Cao đẳng

1 mã đề 31 câu hỏi 1 giờ

40,4313,105

Trắc Nghiệm Tổng Hợp Ôn Thi Môn Sinh Lý 2 BMTU có đáp ánĐại học - Cao đẳng

3 mã đề 75 câu hỏi 1 giờ

81,5856,269