thumbnail

Bài test chuyên môn IT: Dữ liệu lớn Big Data có đáp án

Bài test chuyên môn IT về Big Data bao gồm các câu hỏi trắc nghiệm (MCQ) được biên soạn kỹ lưỡng nhằm kiểm tra kiến thức của bạn về cơ sở hạ tầng dữ liệu lớn, công nghệ phân tích, và các công cụ phổ biến như Hadoop, Spark, và NoSQL. Đây là tài liệu hữu ích cho những ai đang học hoặc làm việc trong lĩnh vực Big Data, giúp đánh giá năng lực chuyên môn và hiểu biết sâu về lĩnh vực này. Kèm đáp án chi tiết và hỗ trợ làm bài online, bài test giúp người học tự tin nâng cao kiến thức Big Data.

Từ khoá: IT Big Data kiểm tra chuyên môn trắc nghiệm MCQ Hadoop Spark NoSQL bài kiểm tra online đáp án chi tiết kiến thức dữ liệu lớn chuyên gia IT

Thời gian làm bài: 1 giờ


Bạn chưa làm đề thi này!!!

Hãy bắt đầu chinh phục nào!



 

Xem trước nội dung:

Câu 1: 0.2 điểm
Các thành phần chính của Big Data là gì?
A.  
HDFS
B.  
MapReduce
C.  
YARN
D.  
Tất cả các thành phần trên
Câu 2: 0.2 điểm
Trong các lựa chọn sau, node slave (nô lệ) là gì?
A.  
Job node
B.  
Data node
C.  
Task node
D.  
Name node
Câu 3: 0.2 điểm
Thuật ngữ nào được dùng để định nghĩa mô hình đa chiều của kho dữ liệu (data warehouse)?
A.  
Table
B.  
Data cube
C.  
Tree
D.  
Data structure
Câu 4: 0.2 điểm
Đúng hay sai: Qubole là một công cụ Big Data.
A.  
Đúng
B.  
Sai
Câu 5: 0.2 điểm
Hadoop được viết bằng ngôn ngữ nào?
A.  
C++
B.  
Java
C.  
Rust
D.  
Python
Câu 6: 0.2 điểm
Lớp Mapper là gì?
A.  
Static type
B.  
Generic type
C.  
Abstract type
D.  
Final
Câu 7: 0.2 điểm
Hadoop chạy trên nền tảng nào trong các nền tảng sau?
A.  
Debian
B.  
Cross-platform
C.  
Bare metal
D.  
Unix-like
Câu 8: 0.2 điểm
Các đơn vị logic nhỏ, nơi kho dữ liệu (data warehouse) lưu giữ lượng dữ liệu lớn được gọi là gì?
A.  
Access layers
B.  
Data marts
C.  
Data storage
D.  
Data miners
Câu 9: 0.2 điểm
Kết quả của các nhiệm vụ map được ghi vào đâu?
A.  
Đĩa cục bộ
B.  
File system
C.  
HDFS
D.  
Bộ lưu trữ thứ cấp
Câu 10: 0.2 điểm
Có bao nhiêu dạng dữ liệu lớn (big data)?
A.  
1
B.  
2
C.  
3
D.  
4
Câu 11: 0.2 điểm
Tổng số V của Big Data là bao nhiêu?
A.  
3
B.  
4
C.  
5
D.  
6
Câu 12: 0.2 điểm
Giao dịch dữ liệu của ngân hàng thuộc loại dữ liệu nào?
A.  
Dữ liệu không cấu trúc
B.  
Dữ liệu có cấu trúc
C.  
Cả hai
D.  
Không thuộc loại nào
Câu 13: 0.2 điểm
Hoạt động nào có thể được thực hiện trên kho dữ liệu (data warehouse)?
A.  
Alter
B.  
Modify
C.  
Scan
D.  
Đọc/ghi
Câu 14: 0.2 điểm
Kích thước tối thiểu của dữ liệu mà một đĩa có thể đọc hoặc ghi trong HDFS là gì?
A.  
Kích thước byte
B.  
Kích thước block
C.  
Heap
D.  
Không có đáp án nào đúng
Câu 15: 0.2 điểm
Nguồn của tất cả dữ liệu kho dữ liệu (data warehouse) được gọi là gì?
A.  
Môi trường chính thức
B.  
Môi trường kho dữ liệu (data warehouse)
C.  
Môi trường vận hành
D.  
Môi trường công nghệ
Câu 16: 0.2 điểm
Thời gian lưu trữ dữ liệu trong kho dữ liệu (data warehouse) là bao lâu?
A.  
3-4 năm
B.  
5-6 năm
C.  
5-10 năm
D.  
1-2 năm
Câu 17: 0.2 điểm
Mục đích của việc làm sạch dữ liệu là gì?
A.  
Loại bỏ dữ liệu nhiễu
B.  
Thực hiện chuyển đổi để sửa dữ liệu sai
C.  
Sửa chữa các bất nhất trong dữ liệu
D.  
Tất cả các mục trên
Câu 18: 0.2 điểm
Dữ liệu có thể được cập nhật ở đâu?
A.  
Môi trường thông tin
B.  
Môi trường kho dữ liệu (data warehouse)
C.  
Môi trường vận hành
D.  
Môi trường khai thác dữ liệu
Câu 19: 0.2 điểm
Lợi ích của xử lý Big Data là gì?
A.  
Doanh nghiệp có thể sử dụng thông tin bên ngoài khi đưa ra quyết định
B.  
Hiệu quả hoạt động tốt hơn
C.  
Cải thiện dịch vụ khách hàng
D.  
Tất cả các mục trên
Câu 20: 0.2 điểm
Công cụ nào thường được sử dụng để làm sạch và chuẩn bị dữ liệu lớn?
A.  
Pandas
B.  
Hồ dữ liệu (Data Lake)
C.  
U-SQL
D.  
kho dữ liệu (data warehouse) (Data Warehouse)
Câu 21: 0.2 điểm
Điều nào sau đây không phải là một phần của quy trình khoa học dữ liệu?
A.  
Xây dựng giao tiếp
B.  
Khám phá (Discovery)
C.  
Vận hành hóa (Operationalize)
D.  
Lập kế hoạch mô hình (Model Planning)
Câu 22: 0.2 điểm
Điều nào đúng về Big Data?
A.  
Big Data có thể được xử lý bằng các kỹ thuật truyền thống
B.  
Big Data đề cập đến các tập dữ liệu ít nhất ở kích thước petabyte
C.  
Phân tích Big Data không liên quan đến báo cáo và khai thác dữ liệu
D.  
Big Data có vận tốc thấp nghĩa là nó được tạo ra chậm
Câu 23: 0.2 điểm
__________ là dữ liệu về dữ liệu.
A.  
HDFS
B.  
MapReduce
C.  
YARN
D.  
Tất cả các mục trên
Câu 24: 0.2 điểm
__________ là một tập hợp dữ liệu được sử dụng với khối lượng lớn, nhưng đang phát triển theo cấp số nhân theo thời gian.
A.  
Cơ sở dữ liệu lớn (Big Database)
B.  
Big DBMS
C.  
Tệp dữ liệu lớn (Big Datafile)
D.  
Dữ liệu lớn (Big Data)
Câu 25: 0.2 điểm
Các bảng thực tế (Fact Tables) là gì?
A.  
HDFS
B.  
MapReduce
C.  
YARN
D.  
Tất cả các mục trên
Câu 26: 0.2 điểm
Thuộc tính nào được cấu hình trên tệp mapred-site.xml?
A.  
Các biến môi trường Java
B.  
Hệ số sao chép (Replication Factor)
C.  
Tên thư mục để lưu trữ tệp HDFS
D.  
Máy chủ và cổng nơi chạy nhiệm vụ MapReduce
Câu 27: 0.2 điểm
Chọn lý do đúng tại sao việc phân tích Big Data khó tối ưu hóa.
A.  
Công nghệ khai thác dữ liệu
B.  
Dữ liệu và các cách hiệu quả về chi phí để khai thác dữ liệu phục vụ mục đích kinh doanh
C.  
Phân tích Big Data không khó tối ưu hóa
D.  
Không có đáp án nào đúng
Câu 28: 0.2 điểm
Thành phần nào xử lý việc thu nạp dữ liệu luồng vào Hadoop?
A.  
Oozie
B.  
Hive
C.  
Kafka
D.  
Flume
Câu 29: 0.2 điểm
Thành phần nào thực hiện điều khiển nhiệm vụ (Job Control) trong Hadoop?
A.  
Lớp Task
B.  
Lớp Mapper
C.  
Lớp Job
D.  
Lớp Reducer
Câu 30: 0.2 điểm
Phân tích Big Data thực hiện các tác vụ sau đây, ngoại trừ?
A.  
Phân phối dữ liệu
B.  
Phân tích dữ liệu
C.  
Tổ chức dữ liệu
D.  
Thu thập dữ liệu
Câu 31: 0.2 điểm
Chọn thuộc tính không chính xác của kho dữ liệu (data warehouse) (Data Warehouse).
A.  
Thu thập từ các nguồn không đồng nhất
B.  
Hướng đối tượng (Subject Oriented)
C.  
Biến đổi theo thời gian (Time Variant)
D.  
Dễ bay hơi (Volatile)
Câu 32: 0.2 điểm
Chọn ngôn ngữ được sử dụng trong khoa học dữ liệu.
A.  
C++
B.  
C
C.  
R
D.  
Ruby
Câu 33: 0.2 điểm
Chọn đặc điểm chính của Big Data trong các tùy chọn dưới đây.
A.  
Giá trị (Value)
B.  
Đa dạng (Variety)
C.  
Khối lượng (Volume)
D.  
Tất cả các đáp án trên
Câu 34: 0.2 điểm
Dữ liệu có kích thước ________ byte được gọi là Big Data.
A.  
Meta
B.  
Giga
C.  
Tera
D.  
Peta
Câu 35: 0.2 điểm
DSS trong kho dữ liệu (data warehouse) là viết tắt của ________.
A.  
Hệ thống quyết định đơn lẻ (Decision Single System)
B.  
Hệ thống hỗ trợ quyết định (Decision Support System)
C.  
Hệ thống hỗ trợ dữ liệu (Data Support System)
D.  
Hệ thống lưu trữ dữ liệu (Data Storable System)
Câu 36: 0.2 điểm
Các vấn đề liên quan đến "Hiệu suất và khả năng mở rộng của thuật toán khai thác dữ liệu" thuộc vào?
A.  
Phương pháp khai thác và các vấn đề tương tác người dùng
B.  
Các vấn đề về hiệu suất
C.  
Các vấn đề về loại dữ liệu đa dạng
D.  
Không có đáp án nào đúng
Câu 37: 0.2 điểm
Tất cả các mục sau đây mô tả chính xác về Hadoop, ngoại trừ:
A.  
Mã nguồn mở (Open Source)
B.  
Dựa trên Java
C.  
Thời gian thực (Real-time)
D.  
Phương pháp tính toán phân tán
Câu 38: 0.2 điểm
Các phần kích thước cố định của công việc MapReduce được gọi là ________.
A.  
Splits
B.  
Tasks
C.  
Maps
D.  
Records
Câu 39: 0.2 điểm
Gói Hadoop Common chứa gì?
A.  
Tệp msi
B.  
Tệp war
C.  
Tệp exe
D.  
Tệp jar
Câu 40: 0.2 điểm
Có bao nhiêu phương pháp tiếp cận để tích hợp cơ sở dữ liệu không đồng nhất trong kho dữ liệu (data warehouse)?
A.  
2
B.  
3
C.  
4
D.  
5
Câu 41: 0.2 điểm
Xác định hệ thống mà kho dữ liệu (data warehouse) chủ yếu được sử dụng.
A.  
Khai thác dữ liệu và lưu trữ dữ liệu
B.  
Tích hợp dữ liệu và lưu trữ dữ liệu
C.  
Báo cáo và phân tích dữ liệu
D.  
Làm sạch dữ liệu và lưu trữ dữ liệu
Câu 42: 0.2 điểm
Xác định mô hình tính toán và hệ thống runtime mục đích chung cho Phân tích Dữ liệu Phân tán.
A.  
HDFS
B.  
MapReduce
C.  
Oozie
D.  
Tất cả các đáp án trên
Câu 43: 0.2 điểm
Định nghĩa chính xác của dữ liệu hòa giải (Reconciled Data) là gì?
A.  
Dữ liệu được lưu trữ trong một hệ thống vận hành trong tổ chức.
B.  
Dữ liệu được chọn và định dạng để hỗ trợ các ứng dụng người dùng cuối.
C.  
Dữ liệu hiện tại được dự định là nguồn duy nhất cho tất cả các hệ thống hỗ trợ quyết định.
D.  
Không có đáp án nào đúng.
Câu 44: 0.2 điểm
Xác định các yếu tố cần cân nhắc trước khi đầu tư vào khai thác dữ liệu.
A.  
Xem xét nhà cung cấp (Vendor consideration)
B.  
Chức năng (Functionality)
C.  
Tính tương thích (Compatibility)
D.  
Tất cả các đáp án trên
Câu 45: 0.2 điểm
Xác định các đặc điểm khác nhau của Phân tích Dữ liệu Lớn (Big Data Analytics).
A.  
Mã nguồn mở (Open-source)
B.  
Khôi phục dữ liệu (Data recovery)
C.  
Khả năng mở rộng (Scalability)
D.  
Tất cả các đáp án trên
Câu 46: 0.2 điểm
Xác định công nghệ Big Data không chính xác.
A.  
Apache PyTorch
B.  
Apache Kafka
C.  
Apache Hadoop
D.  
Apache Spark
Câu 47: 0.2 điểm
Xác định tác nhân thay đổi dữ liệu phổ biến nhất trong việc làm mới kho dữ liệu (data warehouse).
A.  
Logged change data
B.  
Cooperative change data
C.  
Queryable change data
D.  
Snapshot change data
Câu 48: 0.2 điểm
Xác định node nào hoạt động như một node kiểm tra trong HDFS.
A.  
Secondary Name Node
B.  
Secondary Data Node
C.  
Name Node
D.  
Data Node
Câu 49: 0.2 điểm

Big Data thường được đặc trưng bởi các thuộc tính nào?

A.  
Volume, Variety, Velocity
B.  
Volume, Veracity, Value
C.  
Cả A và B
D.  
Không có đáp án nào đúng
Câu 50: 0.2 điểm

Công cụ nào sau đây không được sử dụng để xử lý Big Data?

A.  
Hadoop
B.  
Spark
C.  
SQL Server
D.  
Microsoft Word

Xem thêm đề thi tương tự

thumbnail
Bài Test Chuyên Môn IT: Điện Toán Đám Mây (Cloud Computing)

Kiểm tra và củng cố kiến thức chuyên môn IT với bài test về Điện Toán Đám Mây (Cloud Computing). Bài test bao gồm các câu hỏi xoay quanh các mô hình dịch vụ (IaaS, PaaS, SaaS), kiến trúc hệ thống đám mây, các nhà cung cấp dịch vụ, bảo mật và ứng dụng thực tế của công nghệ điện toán đám mây. Đây là công cụ hữu ích để đánh giá và nâng cao hiểu biết trong lĩnh vực công nghệ hiện đại này.

50 câu hỏi 1 mã đề 1 giờ

366,440 lượt xem 197,309 lượt làm bài

Chưa chinh phục!!!
thumbnail
Bài Test Chuyên Môn IT: Lập Trình Hướng Đối Tượng (OOP) Với C++

Kiểm tra và củng cố kiến thức về lập trình hướng đối tượng (OOP) với C++ qua bài test chuyên môn dành cho các lập trình viên và sinh viên IT. Bài test bao gồm các câu hỏi về các khái niệm cơ bản của OOP như lớp, đối tượng, kế thừa, đa hình, đóng gói, và xử lý dữ liệu với C++. Đây là bài kiểm tra lý tưởng để đánh giá kỹ năng và kiến thức lập trình OOP trong C++, giúp bạn nâng cao trình độ và chuẩn bị tốt cho các dự án thực tế.

50 câu hỏi 1 mã đề 1 giờ

366,311 lượt xem 197,239 lượt làm bài

Chưa chinh phục!!!
thumbnail
Bài Test Chuyên Môn IT: Công Nghệ Web (Web Technology)

Kiểm tra và đánh giá kiến thức về Công Nghệ Web (Web Technology) qua bài test chuyên môn dành cho lập trình viên và sinh viên IT. Bài test bao gồm các câu hỏi về HTML, CSS, JavaScript, giao thức HTTP/HTTPS, framework web phổ biến, và bảo mật web. Đây là bài kiểm tra lý tưởng để xác định kỹ năng lập trình web của bạn và chuẩn bị cho các dự án thực tế trong lĩnh vực phát triển web.

50 câu hỏi 1 mã đề 1 giờ

366,394 lượt xem 197,288 lượt làm bài

Chưa chinh phục!!!
thumbnail
Bài test chuyên môn IT: HTML có đáp án
Bài test chuyên môn IT về HTML được thiết kế nhằm đánh giá kiến thức cơ bản và nâng cao về ngôn ngữ HTML. Bài kiểm tra bao gồm các câu hỏi trắc nghiệm tập trung vào cấu trúc HTML, thẻ HTML, thuộc tính, và cách sử dụng trong phát triển web. Đây là tài liệu hữu ích cho lập trình viên, sinh viên IT, và những người muốn kiểm tra kỹ năng HTML của mình. Kèm đáp án chi tiết và hỗ trợ làm bài online, bài test này giúp bạn dễ dàng ôn tập và nâng cao chuyên môn.

50 câu hỏi 1 mã đề 1 giờ

366,290 lượt xem 197,232 lượt làm bài

Chưa chinh phục!!!
thumbnail
Bài Test Mức Độ Trầm Cảm BECK Miễn Phí - Phương Pháp Hiệu Quả Để Xác Định Trầm Cảm

Bài test mức độ trầm cảm online BECK (BECK Depression Inventory - BDI) miễn phí là công cụ đánh giá hiệu quả giúp bạn xác định chính xác mức độ trầm cảm của mình. Được sử dụng rộng rãi trong tâm lý học, bài kiểm tra này dựa trên các câu hỏi đánh giá các triệu chứng tâm lý như cảm giác buồn bã, mất hứng thú, khó tập trung và thay đổi thể chất. Với kết quả nhanh, bạn sẽ nhận được đánh giá và gợi ý về các biện pháp can thiệp và điều trị kịp thời nếu cần. Làm bài test BECK online miễn phí ngay để tự đánh giá sức khỏe tinh thần của bạn và bắt đầu hành trình chăm sóc sức khỏe tâm lý một cách chủ động.

21 câu hỏi 1 mã đề 30 phút

146,593 lượt xem 78,754 lượt làm bài

Chưa chinh phục!!!
thumbnail
Bài Test Đánh Giá Lo Âu Zung - Làm Online Nhanh Chóng, Miễn Phí

Bài test đánh giá lo âu Zung (Zung Self-Rating Anxiety Scale - SAS) là công cụ hữu ích để tự đánh giá mức độ lo âu của bạn một cách chính xác và nhanh chóng. Bạn có thể làm bài test này online miễn phí để nhận diện các triệu chứng lo âu như căng thẳng, hồi hộp, mất ngủ và khó thở. Kết quả sẽ giúp bạn hiểu rõ hơn về tình trạng sức khỏe tinh thần của mình và có thể xem xét biện pháp can thiệp hoặc tham khảo ý kiến chuyên gia khi cần. Thực hiện bài test lo âu Zung ngay hôm nay để kiểm soát và chăm sóc sức khỏe tâm lý hiệu quả.

20 câu hỏi 1 mã đề 20 phút

146,496 lượt xem 78,780 lượt làm bài

Chưa chinh phục!!!
thumbnail
Bài Test Đánh Giá Nguy Cơ Tự Tử Beck (BSS) Online Miễn Phí - Kiểm Tra Tình Trạng Tâm Lý Chính Xác

Thực hiện bài test Đánh Giá Nguy Cơ Tự Tử Beck (BSS) online miễn phí giúp bạn nhận biết mức độ nguy cơ tự tử và tình trạng tâm lý hiện tại của bản thân. Bài đánh giá BSS được phát triển bởi các chuyên gia tâm lý học, cung cấp công cụ hữu ích để xác định và theo dõi sức khỏe tinh thần. Với quy trình đơn giản và nhanh chóng, bạn có thể hoàn thành bài test ngay tại nhà và nhận kết quả chi tiết, từ đó đưa ra các bước hỗ trợ kịp thời nếu cần. Đây là công cụ quan trọng giúp bạn hiểu rõ hơn về cảm xúc của mình và có biện pháp chăm sóc tâm lý hiệu quả.

20 câu hỏi 1 mã đề 20 phút

146,598 lượt xem 78,799 lượt làm bài

Chưa chinh phục!!!
thumbnail
Bài Test Rối Loạn Ám Ảnh Cưỡng Chế (OCD) Miễn Phí - Đánh Giá Tình Trạng Tâm Lý Chính Xác

Rối loạn ám ảnh cưỡng chế (OCD) là một tình trạng tâm lý phổ biến gây ra các hành vi cưỡng chế và suy nghĩ ám ảnh. Bài test đánh giá OCD miễn phí giúp bạn hiểu rõ hơn về tình trạng sức khỏe tâm thần của mình, xác định các triệu chứng ám ảnh và cưỡng chế. Thực hiện bài test OCD online giúp bạn nhận được kết quả nhanh chóng, chính xác và đưa ra những quyết định hỗ trợ hoặc điều trị cần thiết. Bài kiểm tra này phù hợp cho những ai đang muốn theo dõi và kiểm soát các dấu hiệu của rối loạn ám ảnh cưỡng chế một cách hiệu quả ngay tại nhà.

10 câu hỏi 1 mã đề 20 phút

146,675 lượt xem 78,883 lượt làm bài

Chưa chinh phục!!!
thumbnail
Bài Test EQ Miễn Phí – Đánh Giá Trí Tuệ Cảm Xúc Của Bạn Ngay Bây Giờ!

Khám phá chỉ số EQ của bạn với bài test EQ miễn phí và nhanh chóng. Đánh giá khả năng quản lý cảm xúc, đồng cảm, và kỹ năng xã hội của bạn. Bài kiểm tra trí tuệ cảm xúc (Emotional Intelligence Test) giúp bạn hiểu rõ cách điều khiển cảm xúc cá nhân và tương tác hiệu quả với người khác. Hoàn toàn miễn phí và đáng tin cậy, bài test EQ này cung cấp phản hồi chi tiết về khả năng nhận thức cảm xúc của bạn và cách bạn có thể cải thiện. Hãy thử ngay bài test EQ miễn phí và nhận kết quả chính xác trong vài phút!

30 câu hỏi 1 mã đề 20 phút

146,767 lượt xem 78,927 lượt làm bài

Chưa chinh phục!!!