#include <WiFi.h>
#include <HTTPClient.h>
#include <DHT.h>
#define DHTPIN 15 // Chân kết nối DHT
#define DHTTYPE DHT22
DHT dht(DHTPIN, DHTTYPE);
HTTPClient http;
void setup() {
Serial.begin(9600);
Serial.print("Connecting to WiFi");
WiFi.begin("Wokwi-GUEST", "", 6);
while (WiFi.status() != WL_CONNECTED) {
delay(100);
Serial.print(".");
}
Serial.println(" Connected!");
dht.begin();
}
void loop() {
if (WiFi.status() == WL_CONNECTED) {
// Đọc dữ liệu từ cảm biến DHT
float temperature = dht.readTemperature();
float humidity = dht.readHumidity();
// Kiểm tra lỗi đọc dữ liệu
if (isnan(temperature) || isnan(humidity)) {
Serial.println("Failed to read from DHT sensor!");
return;
}
// Tạo URL với dữ liệu cảm biến
String serverName = "https://k33vluff8f.sharedwithexpose.com/add2.php";
String url = serverName + "?temperature=" + String(temperature) + "&humidity=" + String(humidity);
Serial.println(url);
// Gửi request HTTP
http.begin(url);
int httpCode = http.GET();
if (httpCode > 0) {
String payload = http.getString();
Serial.println(httpCode);
Serial.println(payload);
} else {
Serial.println("Error on HTTP request");
}
http.end();
}
delay(5000); // Gửi mỗi 5 giây
}
# XLV - Toàn bộ chương
Course: XLV
# **XLV - Chương 1. Hệ thống và tín hiệu đa chiều**
## **1.1 Tín hiệu đa chiều**
Tín hiệu đa chiều (Multi-Dimensional Signals) là một khái niệm quan trọng trong nhiều lĩnh vực kỹ thuật và khoa học, đặc biệt là trong xử lý tín hiệu và phân tích dữ liệu. Đây là những tín hiệu không chỉ có một chiều (như tín hiệu âm thanh trong thời gian) mà có nhiều chiều, mỗi chiều có thể đại diện cho một loại thông tin khác nhau hoặc một đặc điểm của tín hiệu.
**Tín hiệu một chiều (1D):**
**Đặc điểm:** Thay đổi của tín hiệu chỉ theo một biến duy nhất, thường là thời gian.
**Ví dụ:** Tín hiệu âm thanh, tín hiệu điện áp theo thời gian.
**Tín hiệu hai chiều (2D):**
**Đặc điểm:** Mỗi điểm trong tín hiệu (ảnh) có giá trị tại hai tọa độ không gian (x, y).
**Ví dụ:** Hình ảnh. Trong trường hợp này, tín hiệu có hai chiều không gian, thường là chiều dài và chiều rộng.
**Tín hiệu ba chiều (3D)**
**Đặc điểm:** Thông tin được phân bố trong ba chiều không gian hoặc hai chiều không gian cộng với một chiều thời gian.
**Ví dụ:** Video, mô hình 3D. Tín hiệu này bao gồm ba chiều không gian hoặc một chiều không gian cộng với thời gian.
**Tín hiệu đa chiều (N-D)**
**Đặc điểm:** Có nhiều chiều (hơn ba), có thể bao gồm các thông tin phức tạp như thời gian, tần số, và nhiều loại thuộc tính khác.
**Ví dụ:** Dữ liệu y tế như MRI, dữ liệu phân tích đa chiều trong các nghiên cứu khoa học.
**Kỹ thuật xử lý**
- **Biến đổi Fourier:** Được sử dụng để phân tích tín hiệu trong miền tần số, bao gồm cả trong các không gian đa chiều.
- **Biến đổi Wavelet (Wavelet Transform):** Thích hợp cho việc phân tích tín hiệu trong không gian và thời gian.
- **Phân tích thành phần chính (PCA):** Một kỹ thuật giảm chiều để đơn giản hóa dữ liệu đa chiều mà vẫn giữ được các đặc điểm quan trọng.
- **Mạng nơ-ron sâu (Deep Learning):** Các mạng nơ-ron như CNN (Convolutional Neural Networks) và RNN (Recurrent Neural Networks) rất hiệu quả trong việc xử lý và phân tích tín hiệu đa chiều, đặc biệt trong nhận diện hình ảnh và video.
**Ứng dụng**
- **Xử lý hình ảnh và video:** Trong các lĩnh vực như nhận diện đối tượng, phân tích video và nén hình ảnh.
- **Y học:** Ví dụ hình ảnh MRI và CT scan đều là các tín hiệu đa chiều, giúp bác sĩ phân tích các cấu trúc nội tạng và bệnh lý.
- **Khoa học dữ liệu:** Phân tích dữ liệu đa chiều trong các nghiên cứu thống kê và máy học.
- **Hệ thống điều khiển:** Đặc biệt trong các hệ thống cảm biến và điều khiển tự động.
## **1.2. Biến đổi đa chiều**
Biến đổi đa chiều (Multi-Dimensional Transforms) là các phép biến đổi toán học mở rộng từ phép biến đổi của tín hiệu một chiều sang các tín hiệu có nhiều hơn một biến số độc lập (như không gian và thời gian). Những phép biến đổi này được sử dụng để phân tích và xử lý các tín hiệu phức tạp tồn tại trong nhiều chiều, chẳng hạn như ảnh số (2D), video (3D) hoặc các tín hiệu khác phụ thuộc vào nhiều biến số.
**Đặc điểm của biến đổi đa chiều**
- **Phạm vi không gian và thời gian:** Các phép biến đổi này hoạt động trên các tín hiệu không chỉ phụ thuộc vào một biến số (chẳng hạn như thời gian trong tín hiệu một chiều), mà còn trên nhiều biến số khác nhau, như không gian (tọa độ x, y) hoặc không gian và thời gian (x, y, z, t).
- **Mở rộng phép biến đổi cổ điển:**
- Các biến đổi một chiều như Biến đổi Fourier hoặc Biến đổi Wavelet có thể được mở rộng thành phiên bản nhiều chiều để phân tích các tín hiệu phức tạp hơn.
- Biến đổi Fourier 2D, 3D hoặc Biến đổi Wavelet đa chiều là các ví dụ phổ biến.
**Các loại biến đổi đa chiều phổ biến:**
- **Biến đổi Fourier đa chiều (Multi-Dimensional Fourier Transform):** Phân tích tín hiệu thành các thành phần tần số trong không gian nhiều chiều.
**Ứng dụng:** Xử lý ảnh, xử lý video, nghiên cứu tín hiệu radar, sóng âm và trong các bài toán vật lý.
**Ví dụ:** Trong xử lý ảnh, Biến đổi Fourier 2D được sử dụng để phân tích và lọc các tần số trong hình ảnh, giúp hiểu rõ hơn về cấu trúc và các đặc điểm của ảnh.
- **Biến đổi Wavelet đa chiều (Multi-Dimensional Wavelet Transform):** Biến đổi Wavelet phân tách tín hiệu thành các thành phần có độ phân giải và tần số khác nhau. Khi mở rộng sang không gian nhiều chiều, biến đổi Wavelet cho phép phân tích và phát hiện các đặc trưng cục bộ trong tín hiệu.
**Ứng dụng:** Nén ảnh và video, phát hiện cạnh, tái tạo ảnh, thị giác máy tính.
- **Biến đổi Cosine rời rạc 2D (2D Discrete Cosine Transform - DCT):** Biến đổi DCT là một biến thể của Fourier, thường được sử dụng để nén các tín hiệu thực như hình ảnh. Ví dụ điển hình là JPEG, một chuẩn nén hình ảnh sử dụng biến đổi DCT để loại bỏ các thông tin thừa trong ảnh.
**Ứng dụng:** Nén hình ảnh, nén video, xử lý tín hiệu.
**Ứng dụng của biến đổi đa chiều:**
- **Xử lý hình ảnh và video:** Các phép biến đổi đa chiều được sử dụng để nén ảnh, phân tích nội dung hình ảnh, phát hiện đối tượng, lọc nhiễu và cải thiện chất lượng ảnh/video.
- **Thị giác máy tính:** Biến đổi đa chiều hỗ trợ trong việc nhận dạng và theo dõi đối tượng trong không gian 3D hoặc không gian thời gian (video).
- **Y học hình ảnh (Medical Imaging):** Trong MRI và CT scan, các tín hiệu được biểu diễn trong không gian đa chiều (không gian và thời gian) và các biến đổi này giúp cải thiện chất lượng hình ảnh, phân tích cấu trúc cơ thể chi tiết hơn.
- **Xử lý radar và sonar:** Các phép biến đổi đa chiều giúp phân tích tín hiệu radar và sonar, cho phép phát hiện đối tượng và tính toán khoảng cách, tốc độ dựa trên các tín hiệu thu thập từ nhiều góc độ khác nhau.
## **1.3. Hệ thống đa chiều (HTĐC)**
Hệ thống đa chiều là các hệ thống mà các tín hiệu đầu vào và đầu ra phụ thuộc vào nhiều biến số độc lập, thay vì chỉ một biến như trong các hệ thống một chiều. Các biến số này có thể là thời gian, không gian, hoặc các đại lượng khác như tần số, vị trí, nhiệt độ... Điều này làm cho các hệ thống đa chiều phức tạp hơn về mặt toán học và cần các phương pháp phân tích, xử lý riêng biệt.
**Đặc điểm của HTĐC**
- **Nhiều biến độc lập:** Trong một hệ thống đa chiều, đầu vào hoặc đầu ra có thể phụ thuộc vào nhiều biến như không gian (x, y, z) hoặc không gian và thời gian (x, y, t).
**Ví dụ:** Một hệ thống xử lý hình ảnh là một hệ thống 2D, nơi tín hiệu đầu vào là một ảnh với hai biến không gian (tọa độ x, y).
- **Phương trình mô tả:** Các hệ thống đa chiều thường được mô tả bằng các phương trình vi phân riêng (PDEs) hoặc phương trình sai phân đa chiều, mở rộng từ phương trình vi phân thông thường để xử lý tín hiệu nhiều biến. Ví dụ, một hệ thống xử lý ảnh có thể sử dụng các phương trình sai phân rời rạc hai chiều để lọc hoặc phát hiện cạnh trong hình ảnh.
- **Phân tích hệ thống:** Hệ thống đa chiều yêu cầu các phương pháp phân tích đặc biệt như biến đổi Fourier đa chiều, biến đổi Wavelet đa chiều, hoặc phương pháp miền không gian (space domain methods). Những phương pháp này giúp xử lý các tín hiệu nhiều chiều và phân tích hành vi của hệ thống.
**Các loại HTĐC**
- **Hệ thống 2D:** Đây là hệ thống trong đó tín hiệu đầu vào và đầu ra phụ thuộc vào hai biến số, thường là không gian (tọa độ x, y).
**Ví dụ:** Hệ thống xử lý hình ảnh kỹ thuật số, trong đó tín hiệu đầu vào là một bức ảnh 2D và đầu ra có thể là ảnh đã qua xử lý, nén, hoặc biến đổi.
- **Xử lý hình ảnh và video:** Trong xử lý ảnh, hệ thống đa chiều được sử dụng để xử lý các tín hiệu hai chiều, chẳng hạn như làm mờ, làm sắc nét,
phát hiện cạnh, và nén ảnh. Trong xử lý video, hệ thống có thể xử lý tín hiệu không gian thời gian để cải thiện chất lượng video, phát hiện chuyển động, hoặc nhận dạng đối tượng.
- **Thị giác máy tính (Computer Vision):** Hệ thống đa chiều hỗ trợ nhận dạng hình dạng, đối tượng trong không gian ba chiều, phát hiện và theo dõi chuyển động, sử dụng các phương pháp như biến đổi Fourier hoặc biến đổi Wavelet đa chiều.
- **Y học hình ảnh (Medical Imaging):** Các hệ thống MRI và CT scan là các hệ thống đa chiều, nơi tín hiệu y tế được ghi lại theo các lát cắt không gian (2D, 3D) và đôi khi theo thời gian (4D). Các hệ thống này giúp tái tạo hình ảnh 3D của cơ thể con người.
- **Hệ thống radar và sonar:** Các hệ thống radar và sonar sử dụng các tín hiệu không gian thời gian để phát hiện và theo dõi các đối tượng trong không gian, tính toán tốc độ, vị trí và khoảng cách dựa trên tín hiệu phản hồi từ các nguồn đa chiều.
- **Hệ thống truyền thông:** Trong truyền thông không dây, hệ thống đa chiều được sử dụng để xử lý tín hiệu phụ thuộc vào nhiều yếu tố như tần số, thời gian, và không gian (antenna array systems).
**Phân tích và thiết kế HTĐC**
- **Biến đổi Fourier đa chiều:** Được sử dụng để phân tích và mô hình hóa hệ thống trong miền tần số, giúp xác định các thành phần tần số và ứng dụng trong lọc tín hiệu.
- **Biến đổi Wavelet đa chiều:** Dùng để phân tích đa độ phân giải của tín hiệu, cho phép phát hiện các đặc trưng cục bộ trong tín hiệu như cạnh, chi tiết trong ảnh hoặc video.
- **Phân tích miền không gian:** Xử lý tín hiệu trực tiếp trong miền không gian, ví dụ như lọc không gian, phát hiện cạnh, và làm mịn tín hiệu.
## **1.4. Lý thuyết lấy mẫu đa chiều**
Lý thuyết lấy mẫu đa chiều (Multi-Dimensional Sampling Theory) là một phần của lý thuyết xử lý tín hiệu, mở rộng từ lý thuyết lấy mẫu một chiều sang các tín hiệu có nhiều hơn một biến số độc lập. Nó nghiên cứu cách thức chuyển đổi một tín hiệu liên tục trong không gian nhiều chiều thành tín hiệu rời rạc mà vẫn giữ được đầy đủ thông tin, cũng như cách tái tạo lại tín hiệu ban đầu từ các mẫu đã lấy.
**Đặc điểm chính của lý thuyết lấy mẫu đa chiều**
- **Tín hiệu đa chiều:** Tín hiệu đa chiều có thể phụ thuộc vào nhiều biến độc lập như không gian (tọa độ x, y) và thời gian. Ví dụ, hình ảnh kỹ thuật số là tín hiệu hai chiều (x, y), trong khi video là tín hiệu ba chiều (x, y, t), và hình ảnh y học 3D từ MRI hoặc CT scan là tín hiệu không gian ba chiều (x, y, z).
- **Quá trình lấy mẫu:** Lấy mẫu là quá trình chọn một tập hợp các điểm (mẫu) từ tín hiệu liên tục tại các vị trí cố định. Với tín hiệu đa chiều, quá trình này xảy ra trên lưới lấy mẫu nhiều chiều. Tín hiệu liên tục trong không gian đa chiều được lấy mẫu thành tín hiệu rời rạc bằng cách chọn giá trị tại các điểm cụ thể trên lưới không gian đa chiều.
- **Lưới lấy mẫu (Sampling Grids):** Các mẫu trong không gian đa chiều có thể được chọn theo nhiều kiểu lưới khác nhau:
- **Lưới vuông (rectangular grid):** Mẫu được lấy đều theo trục tọa độ.
- **Lưới hình lục giác (hexagonal grid):** Tối ưu hơn về mật độ lấy mẫu và giảm thiểu hiện tượng lập phổ.
- **Tần số Nyquist đa chiều:** Định lý Nyquist trong không gian một chiều quy định rằng tần số lấy mẫu phải ít nhất gấp đôi tần số cao nhất của tín hiệu để tránh mất mát thông tin (aliasing). Định lý này được mở rộng sang không gian đa chiều, nghĩa là tần số lấy mẫu trong mọi chiều đều phải đủ lớn để đảm bảo tái tạo tín hiệu chính xác.
- **Lập phổ (Aliasing):** Hiện tượng lập phổ xảy ra khi tần số lấy mẫu không đủ lớn, khiến các thành phần tần số của tín hiệu bị chồng chéo lên nhau và gây mất thông tin. Trong không gian đa chiều, lập phổ phức tạp hơn, ảnh hưởng đến tất cả các chiều của tín hiệu.
**Ứng dụng của lý thuyết lấy mẫu đa chiều:**
- **Xử lý ảnh và video:** Khi số hóa hình ảnh hoặc video, quá trình lấy mẫu đa chiều giúp chuyển đổi các tín hiệu liên tục thành các điểm ảnh (pixel) hoặc điểm ảnh động (video frames) rời rạc. Đảm bảo tần số lấy mẫu đủ cao giúp tránh hiện tượng nhiễu và biến dạng hình ảnh khi tái tạo lại từ mẫu.
- **Y học hình ảnh (Medical Imaging):** Trong các hệ thống quét MRI hoặc CT, tín hiệu đa chiều (thường là 3D hoặc 4D) được lấy mẫu từ không gian liên tục. Việc lấy mẫu chính xác đảm bảo các chi tiết y tế được giữ lại khi tái tạo hình ảnh từ các mẫu đã thu thập.
- **Thị giác máy tính (Computer Vision):** Lý thuyết lấy mẫu đa chiều được sử dụng để xử lý dữ liệu hình ảnh 2D hoặc video 3D từ các cảm biến máy ảnh, giúp phát hiện đối tượng và theo dõi chuyển động.
- **Hệ thống radar và sonar:** Tín hiệu radar và sonar thường là tín hiệu không gian-thời gian. Lý thuyết lấy mẫu đa chiều được áp dụng để thu thập và phân tích tín hiệu nhằm phát hiện và xác định vị trí các đối tượng di chuyển.
## **1.5. Chuyển đổi cấu trúc lấy mẫu**
Chuyển đổi cấu trúc lấy mẫu là một quá trình quan trọng trong lý thuyết và ứng dụng xử lý tín hiệu, đặc biệt là khi làm việc với tín hiệu số và liên tục. Quá trình này liên quan đến việc thay đổi cấu trúc của lưới lấy mẫu để phù hợp với các yêu cầu của ứng dụng hoặc để cải thiện chất lượng tín hiệu sau khi lấy mẫu.
**Định nghĩa và mục tiêu:**
**Định nghĩa:** Chuyển đổi cấu trúc lấy mẫu là việc thay đổi hoặc tối ưu hóa cách thức lấy mẫu tín hiệu, bao gồm thay đổi tần số lấy mẫu, lưới lấy mẫu, hoặc phương pháp lấy mẫu để đạt được những mục tiêu nhất định như giảm thiểu nhiễu, cải thiện chất lượng tín hiệu, hoặc tăng hiệu suất xử lý.
**Mục tiêu:**
- **Tăng cường chất lượng tín hiệu:** Cải thiện độ chính xác và độ rõ nét của tín hiệu sau khi lấy mẫu.
- **Giảm thiểu hiện tượng lập phổ (aliasing):** Ngăn chặn các vấn đề gây ra bởi việc lấy mẫu không đủ tần số.
- **Tối ưu hóa xử lý:** Cải thiện hiệu suất xử lý và lưu trữ dữ liệu tín hiệu.
# **XLV - Chương 2. Hình ảnh và Video kỹ thuật số**
## **2.1. Hệ thống thị giác của con người và màu sắc**
Cách mà hệ thống thị giác của con người hoạt động để nhận thức màu sắc và hình ảnh trong môi trường. Nó bao gồm các quá trình sinh lý và thần kinh liên quan đến cách mắt và não bộ tương tác để xử lý ánh sáng và màu sắc.
Hệ thống thị giác của con người bắt đầu từ mắt, nơi ánh sáng được tiếp nhận và biến thành các tín hiệu thần kinh thông qua các tế bào nhạy cảm với ánh sáng (tế bào nón và tế bào que).
Tế bào nón (cone cells) chịu trách nhiệm cho việc nhận biết màu sắc và hoạt động chủ yếu trong điều kiện ánh sáng ban ngày, trong khi tế bào que (rod cells) giúp nhìn thấy trong điều kiện ánh sáng yếu và không liên quan đến nhận biết màu sắc.
Có ba loại tế bào nón trong mắt người, mỗi loại nhạy cảm với các bước sóng ánh sáng khác nhau, tương ứng với ba màu cơ bản:
- Màu đỏ (red)
- Màu xanh lục (green)
- Màu xanh lam (blue)
Từ những tín hiệu này, não bộ tổ hợp lại để tạo ra sự nhận biết hàng triệu màu sắc khác nhau.
## **Thị giác màu sắc và các mô hình**
**Thị giác màu sắc (Color Vision)** là khả năng của con người nhận biết màu sắc dựa trên độ nhạy của các tế bào nón (cone cells) trong võng mạc đối với các bước sóng ánh sáng khác nhau. Mắt người thường có thị giác ba màu (trichromatic vision), nghĩa là có ba loại tế bào nón, mỗi loại nhạy cảm với một dải bước sóng ánh sáng khác nhau: ngắn (S), trung bình (M), và dài (L), tương ứng với ánh sáng xanh dương, xanh lá cây và đỏ.
**Mô hình màu sắc (Color Models)** là các hệ thống toán học dùng để mô tả và tổ chức thông tin về màu sắc. Các mô hình phổ biến bao gồm RGB, CMYK, HSV, và LAB được ứng dụng trong nhiều lĩnh vực như thiết kế đồ họa, in ấn, và hiển thị kỹ thuật số.
## **2.2 Video tương tự**
- **Video analog:** Là công nghệ ghi và truyền tải tín hiệu hình ảnh và âm thanh dưới dạng tín hiệu liên tục (analog).
- **Nguyên tắc hoạt động:** Video analog lưu giữ thông tin dưới dạng sóng điện áp tương tự với cường độ ánh sáng và âm thanh.
**Hạn chế:**
- **Nhiễu tín hiệu:** Dễ bị nhiễu, suy giảm chất lượng qua thời gian và khoảng cách.
- **Chất lượng hình ảnh thấp hơn:** So với video kỹ thuật số.
Ứng dụng trước đây: Truyền hình analog, băng video (VHS, Betamax), máy quay phim cũ.
**Quét xen kẽ (Interlaced Scanning):**
- **Khái niệm:** Mỗi khung hình được chia thành hai trường (fields), một trường chứa dòng lẻ, một trường chứa dòng chẵn.
- **Hoạt động:** Tín hiệu truyền tải từng trường một (tức là truyền một nửa khung hình trong mỗi chu kỳ), ghép hai trường lại thành một khung hình hoàn chỉnh.
- **Lợi ích:** Tiết kiệm băng thông, được dùng rộng rãi trong truyền hình analog (VD: chuẩn NTSC, PAL).
- **Hạn chế:** Hình ảnh có thể bị rung, không phù hợp cho chuyển động nhanh.
**Quét tuần tự (Progressive Scanning):**
- **Khái niệm:** Toàn bộ khung hình được quét tuần tự từ trên xuống dưới trong một chu kỳ, không chia thành các trường.
- **Ưu điểm:** Hình ảnh sắc nét hơn, giảm rung động trong cảnh chuyển động.
- **Sử dụng:** Được áp dụng trong công nghệ video hiện đại (HD, Full HD, 4K).
**Chuyển đổi tín hiệu từ Analog sang Digital:**
Quá trình chuyển đổi Analog sang Digital (A/D Conversion):
- **Bước 1: Lấy mẫu (Sampling):**
- **Khái niệm:** Chuyển đổi tín hiệu liên tục thành tín hiệu rời rạc bằng cách lấy mẫu ở các khoảng thời gian đều đặn.
- **Tần số lấy mẫu (Sampling Rate):** Tần số càng cao, chất lượng tín hiệu số càng tốt. VD: 44.1 kHz cho âm thanh, 24 fps cho video.
- **Bước 2: Lượng tử hóa (Quantization):**
- **Khái niệm:** Mỗi mẫu được gán cho một giá trị số dựa trên độ sâu bit (bit-depth).
- **Bit-depth:** Độ sâu bit càng cao, độ chính xác trong việc biểu diễn tín hiệu càng lớn. VD: 8-bit, 10-bit.
- **Bước 3: Mã hóa (Encoding):**
- **Khái niệm:** Chuyển các giá trị số từ quá trình lượng tử hóa thành tín hiệu nhị phân (chuỗi các số 0 và 1).
**Ưu điểm của chuyển đổi sang tín hiệu số:**
- **Chất lượng cao hơn:** Tín hiệu số ít bị nhiễu và suy giảm theo thời gian.
- **Dễ dàng xử lý và lưu trữ:** Video số hóa có thể dễ dàng nén, chỉnh sửa và phân phối qua nhiều phương tiện.
- **Khả năng nén và truyền tải:** Tín hiệu số dễ dàng được nén bằng các thuật toán (VD: H.264, MPEG).
## **2.3 Video kỹ thuật số**
Video kỹ thuật số là công nghệ ghi và xử lý hình ảnh chuyển động dưới dạng các tín hiệu số, trái ngược với video analog sử dụng tín hiệu liên tục. Video kỹ thuật số sử dụng dữ liệu nhị phân (số 1 và 0) để đại diện cho thông tin về hình ảnh và âm thanh. Công nghệ này mang lại nhiều lợi thế như chất lượng hình ảnh cao hơn, khả năng lưu trữ dễ dàng và truyền tải linh hoạt hơn so với công nghệ analog. Trong video kỹ thuật số, các yếu tố quan trọng như độ phân giải không gian, tốc độ khung hình, màu sắc, dải động và độ sâu bit đều ảnh hưởng đến chất lượng và trải nghiệm xem. Ngoài ra, việc xử lý hình ảnh màu cũng như các tiêu chuẩn video kỹ thuật số đóng vai trò quan trọng trong việc đảm bảo tính nhất quán và tương thích giữa các thiết bị và hệ thống khác nhau.
**Ưu điểm:**
- **Chất lượng cao:** Hình ảnh sắc nét, âm thanh rõ ràng.
- **Dễ dàng xử lý:** Tạo, chỉnh sửa và phân phối nội dung số dễ dàng hơn.
- **Khả năng lưu trữ:** Dữ liệu video được nén, giúp lưu trữ nhiều hơn so với băng video analog.
**Ứng dụng:** Truyền hình, điện ảnh, phát trực tiếp (streaming), và mạng xã hội.
**Độ phân giải không gian (Spatial Resolution):**
- **Khái niệm:** Số lượng pixel thể hiện trên mỗi khung hình, quyết định độ chi tiết của hình ảnh.
- **Đơn vị đo:** Pixel, khung hình chiều ngang x chiều dọc (VD: 1920x1080 pixels).
**Phổ biến:**
- HD: 1280x720 pixels.
- Full HD: 1920x1080 pixels.
- 4K UHD: 3840x2160 pixels.
- 8K UHD: 7680x4320 pixels.
## **Tốc độ khung hình (Frame Rate):**
**Khái niệm:** Số khung hình hiển thị trên giây (fps - frames per second).
**Ví dụ:**
- 24fps: Chuẩn cho phim điện ảnh.
- 30fps: Chuẩn cho truyền hình.
- 60fps: Tốc độ cao, dùng cho video thể thao, trò chơi.
**Ảnh hưởng:** Tốc độ khung hình cao giúp hình ảnh mượt mà, đặc biệt trong các cảnh chuyển động nhanh.
**Màu sắc (Color):**
- **Mô hình màu RGB:** Kết hợp ba màu đỏ (Red), xanh lá (Green), xanh dương (Blue) để tái tạo màu sắc.
- **Mô hình YUV:** Tách biệt độ sáng (Y) và hai thành phần màu (U, V), giúp nén và truyền tải hiệu quả hơn.
**Dải động (Dynamic Range):**
- **Khái niệm:** Sự khác biệt giữa các vùng sáng nhất và tối nhất trong hình ảnh.
- **SDR (Standard Dynamic Range):** Hạn chế dải động.
- **HDR (High Dynamic Range):** Tăng khả năng hiển thị chi tiết hơn trong vùng sáng và tối.
**Độ sâu bit (Bit-depth):**
- **Khái niệm:** Số lượng bit sử dụng để biểu diễn màu của mỗi pixel.
- **Độ sâu 8-bit:** 256 mức độ sáng cho mỗi kênh màu (
RGB), tổng cộng 16,7 triệu màu.
- **Độ sâu 10-bit:** 1024 mức độ sáng, tổng cộng hơn 1 tỷ màu, giúp hình ảnh mượt mà hơn.
**Xử lý hình ảnh màu:**
Các bước xử lý hình ảnh màu bao gồm:
- **Chuyển đổi không gian màu:** Từ RGB sang YUV để nén video hoặc tăng hiệu quả truyền tải. Ví dụ: Truyền hình và phát trực tuyến thường dùng YUV.
- **Chỉnh sửa màu sắc:**
- Điều chỉnh độ tương phản: Giúp cân bằng vùng sáng và tối.
- Chỉnh độ bão hòa màu: Tăng hoặc giảm độ rực rỡ của màu sắc.
- **Cân bằng trắng (White Balance):** Điều chỉnh để màu sắc trung tính chính xác (trắng phải hiển thị như trắng).
- **Phân loại màu (Color Grading):**
- **Khái niệm:** Điều chỉnh màu sắc, tạo phong cách cho video.
- **Ứng dụng:** Thể hiện tâm trạng, tạo cảm xúc (VD: Tông màu xanh lạnh cho phim kinh dị, tông màu ấm cho phim lãng mạn).
**Tiêu chuẩn video kỹ thuật số:**
- **Chuẩn nén video:**
- **H.264:** Chuẩn nén phổ biến, hiệu quả cao, sử dụng rộng rãi trên nhiều nền tảng.
- **H.265 (HEVC):** Tiết kiệm dung lượng hơn H.264, hỗ trợ 4K, 8K.
- **AV1:** Chuẩn mới, tối ưu cho truyền phát trực tuyến (YouTube, Netflix).
- **Độ phân giải tiêu chuẩn:**
- SD (Standard Definition): 720x480 pixel, tiêu chuẩn cũ.
- HD (High Definition): 1280x720 pixels.
- Full HD: 1920x1080 pixels.
- 4K (Ultra HD): 3840x2160 pixels.
- 8K: 7680x4320 pixels, chất lượng cực cao.
**So sánh giữa Video Analog và Video Kỹ thuật số:**
**Video Analog**
- **Định nghĩa:** Tín hiệu liên tục, phụ thuộc vào sóng điện từ để truyền tải dữ liệu hình ảnh và âm thanh.
- **Hạn chế/Ưu điểm:** Chất lượng giảm khi sao chép nhiều lần, dễ bị nhiễu tín hiệu.
- **Các định dạng phổ biến:** Composite, S-Video, Component.
**Video Kỹ thuật số**
- **Định nghĩa:** Dữ liệu hình ảnh và âm thanh được lưu dưới dạng các số nhị phân (bit 0 và 1).
- **Hạn chế/Ưu điểm:** Chất lượng hình ảnh tốt hơn, dễ dàng sao chép, chỉnh sửa và truyền tải.
- **Các định dạng phổ biến:** H.264, H.265, AV1.
## **2.4 Video 3D**
- **Video 3D:** Là công nghệ hình ảnh tạo cảm giác chiều sâu, mang lại trải nghiệm sống động hơn so với video 2D.
- **Nguyên tắc hoạt động:** Tạo ra ảo giác về không gian 3 chiều bằng cách cung cấp cho mỗi mắt một góc nhìn khác nhau, tương tự như cách mắt người nhìn.
- **Ứng dụng:** Điện ảnh 3D, TV 3D, thực tế ảo (VR), thực tế tăng cường (AR).
- **Mục tiêu:** Mang lại trải nghiệm thị giác sống động, tương tác chân thực hơn.
**Công nghệ hiển thị 3D:** Là tập hợp các phương pháp và công nghệ giúp tái tạo hình ảnh 3 chiều trên màn hình phẳng, mang đến cho người xem cảm giác chiều sâu và không gian. Điều này được thực hiện bằng cách cung cấp cho mỗi mắt một góc nhìn khác nhau của cùng một hình ảnh, tương tự như cách mắt người nhận biết không gian trong thực tế.
## **Công nghệ hiển thị 3D**
- **Kính phân cực (Polarized Glasses):**
- **Nguyên lý:** Sử dụng kính phân cực để lọc các hình ảnh được chiếu với hai phân cực khác nhau cho mỗi mắt.
- **Ứng dụng:** Rạp chiếu phim 3D, TV 3D.
- **Kính màn trập chủ động (Active Shutter Glasses):**
- **Nguyên lý:** Kính có màn trập điện từ hoạt động đồng bộ với màn hình, hiển thị hình ảnh riêng cho từng mắt.
- **Ưu điểm:** Hình ảnh sắc nét hơn vì mỗi mắt nhận được khung hình đầy đủ.
- **Ứng dụng:** TV 3D cao cấp, một số hệ thống thực tế ảo.
- **Công nghệ không kính (Autostereoscopic Display):**
- **Nguyên lý:** Hiển thị nhiều hình ảnh từ các góc nhìn khác nhau mà không cần kính, cho phép người xem thấy hình ảnh 3D từ các vị trí cụ thể.
- **Ưu điểm:** Người xem không cần đeo kính.
- **Ứng dụng:** Màn hình 3D không kính, điện thoại di động và thiết bị cầm tay có hỗ trợ 3D.
# **Video lập thể (Stereoscopic Video):**
Video lập thể (Stereoscopic Video) là một công nghệ hình ảnh 3D tạo ra ảo giác về chiều sâu bằng cách cung cấp hai hình ảnh riêng biệt cho mắt trái và mắt phải. Nguyên tắc này tương tự như cách mắt người hoạt động trong thực tế, mỗi mắt sẽ nhìn thấy một góc nhìn hơi khác nhau của cùng một cảnh, từ đó não sẽ kết hợp hai hình ảnh này lại để tạo cảm giác về không gian ba chiều.
### **Các phương pháp tạo video lập thể:**
- **Công nghệ quang học (Optical Methods):** Sử dụng hai camera để quay từ hai góc nhìn.
- **Xử lý số (Digital Processing):** Dùng thuật toán để xử lý và tạo ra hình ảnh 3D từ video 2D.
**Ứng dụng:**
- **Điện ảnh 3D:** Các bộ phim nổi tiếng như *Avatar* sử dụng công nghệ lập thể để tạo chiều sâu ấn tượng.
- **Trò chơi video:** Mang đến trải nghiệm chơi chân thực và sống động hơn.
**Hạn chế:** Có thể gây mỏi mắt hoặc chóng mặt khi xem lâu.
## *** Video đa góc nhìn (Multi-View Video):**
**Khái niệm:** Video đa góc nhìn hiển thị cùng lúc nhiều góc nhìn của một đối tượng hoặc cảnh vật, cho phép người xem lựa chọn góc nhìn yêu thích.
**Khác biệt so với video lập thể:** Thay vì chỉ cung cấp hai góc nhìn cố định, video đa góc nhìn cho phép tương tác linh hoạt giữa nhiều góc độ.
**Nguyên tắc hoạt động:**
- Sử dụng nhiều camera quay từ các vị trí khác nhau, kết hợp lại để tạo thành một video cho phép người xem thay đổi góc nhìn theo ý muốn.
- Có thể kết hợp với thực tế ảo (VR) để tạo ra môi trường ảo 360 độ.
## 2.5. Ứng dụng video kỹ thuật số
1. Truyền hình kỹ thuật số (Digital TV)
2. Điện ảnh Kỹ thuật số (Digital Cinema)
3. Truyền tải Video qua Internet (Video Streaming over the Internet)
4. Thị giác máy tính (Computer Vision)
### 2.5.1. Truyền hình Kỹ thuật số:
- Truyền hình Kỹ thuật số là việc phát tín hiệu âm thanh và hình ảnh dưới dạng tín hiệu số, thay thế cho tín hiệu tương tự (analog).
- Ưu điểm:
- Chất lượng cao: Hình ảnh sắc nét, âm thanh sống động.
- Tương tác: Cho phép người xem truy cập vào các dịch vụ tương tác như mua sắm, tham khảo lịch phát sóng.
- Nhiều kênh hơn: Khả năng truyền tải nhiều kênh trong cùng một băng tần.
- Di động: Có thể xem trên nhiều thiết bị như TV, smartphone, tablet.
- Ứng dụng: Truyền hình vệ tinh, truyền hình cáp, IPTV.
### 2.5.2. **Điện ảnh Kỹ thuật số (Digital Cinema):**
- Điện ảnh kỹ thuật số là việc sử dụng công nghệ số để quay, biên tập và phát hành phim thay vì sử dụng phim nhựa.
- Ưu điểm:
- Chất lượng hình ảnh cao: Hình ảnh sắc nét hơn, đặc biệt ở độ phân giải cao như 4K, 8K.
- Tiết kiệm chi phí: Giảm chi phí in phim, vận chuyển và lưu trữ so với phim nhựa truyền thống.
### 2.5.3. Truyền tải Video qua Internet (Video Streaming over the Internet):
- Truyền tải video qua Internet là phương thức phân phối nội dung video thông qua mạng internet mà không cần phải tải về toàn bộ tệp.
- **Ưu điểm:**
- Xem ngay lập tức: Người dùng có thể xem video ngay mà không cần tải toàn bộ dữ liệu.
- Tiết kiệm dung lượng: Dữ liệu chỉ được tải khi cần thiết, giúp tiết kiệm băng thông và thời gian.
- Phát trực tiếp: Khả năng phát các chương trình trực tiếp như sự kiện thể thao, hỏa nhạc.
- Tiếp cận dễ dàng: Người dùng trên toàn thế giới có thể dễ dàng truy cập nội dung qua các nền tảng như YouTube, Netflix, hoặc các dịch vụ phát trực tiếp khác.
- Ứng dụng: Livestream, phát phim, chương trình truyền hình trực tuyến, sự kiện trực tiếp qua internet.
### 2.5.4. Thị giác Máy tính:
- Thị giác máy tính là một lĩnh vực của trí tuệ nhân tạo (AI), cho phép máy tính phân tích và hiểu các hình ảnh và video.
- **Ưu điểm:**
- Nhận diện khuôn mặt: Phân tích và nhận diện khuôn mặt trong hình ảnh hoặc video.
- Nhận diện đối tượng: Xác định các đối tượng khác nhau trong một cảnh quay (như xe cộ, con người, động vật).
- Phân tích hoạt động: Theo dõi và phân tích hành vi, chuyển động của con người hoặc đối tượng (ví dụ: phân tích giao thông, hành vi mua sắm).
- An ninh và giám sát: Sử dụng trong hệ thống camera an ninh để theo dõi và phát hiện hành vi bất thường.
## 2.6. Chất lượng hình ảnh và video
1. Hiện tượng thị giác
2. Đánh giá chất lượng chủ quan
3. Đánh giá chất lượng khách quan
### Hiện tượng thị giác là gì?
- Các hiện tượng không mong muốn xuất hiện trong hình ảnh hoặc video
- Nguyên nhân: Quá trình nén, xử lý dữ liệu không hoàn hảo.
### Các loại hiện tượng thị giác phổ biến
- Nhiễu hạt (Noise): Làm hình ảnh trở nên mờ học không rõ nét
- Mất chi tiết (Loss of Detail): Các chi tiết nhỏ bị biến mất
- Đường viền giả (Banding): Xuất hiện các đường ranh giới không tự nhiên giữa các màu sắc.
- Lỗi màu sắc (Color Artifacts): Hiện tượng màu sắc bị biến đổi bất thường.
### Đánh giá chất lượng chủ quan:
- Đánh giá dựa trên cảm nhận của con người về chất lượng hình ảnh hoặc video.
- **Phương pháp thực hiện:**
- Người tham gia sẽ xem và đưa ra đánh giá về mức độ tốt hoặc xấu.
- Đánh giá này thường mang tính chủ quan, có thể thay đổi tùy theo người dùng.
- **Ưu điểm:** Đo lường trực tiếp cách con người cảm nhận chất lượng.
- **Nhược điểm:** Phụ thuộc vào quan điểm cá nhân, thiếu tính nhất quán.
### Đánh giá chất lượng khách quan:
- Đánh giá sử dụng thuật toán và công cụ để đo lường chất lượng. Không cần sự can thiệp của con người.
- Phương pháp thực hiện:
- Dựa trên các chỉ số toán học hoặc thống kê để so sánh với chuẩn gốc.
- Đảm bảo kết quả đánh giá có tính khách quan và nhất quán.
- **Ưu điểm:** Đáng tin cậy, nhất quán, không bị ảnh hưởng bởi cảm nhận chủ quan.
- **Nhược điểm:** Không thể phản ánh chính xác trải nghiệm thực tế của người xem.
# CHƯƠNG 03: ƯỚC TÍNH CHUYỂN ĐỘNG
## 3.1. Sự hình thành hình ảnh
- **Hình thành ảnh là** quá trình ánh sáng từ cảnh thực tế đi qua ống kính của camera và được chiếu lên mặt phẳng ảnh, từ đó tạo ra hình ảnh kỹ thuật số.
- **Các yếu tố ảnh hưởng đến quá trình hình thành ảnh:**
- **Góc chụp**: Vị trí của camera so với đối tượng.
- **Cường độ sáng**: Ánh sáng chiếu vào cảnh có ảnh hưởng lớn đến chất lượng hình ảnh.
- **Các hiện tượng quang học**: Như tán xạ ánh sáng, bóng mờ có thể ảnh hưởng đến sự hình thành của các điểm ảnh.
### Mô hình camera (Camera Models)
- Mô hình camera giúp mô tả cách ảnh sáng từ cảnh được chiều lên mặt phẳng ảnh.
### Mô hình Camera lỗ kim (Pinhole Camera Model)
- Là mô hình đơn giản nhất của camera. Giả định một điểm nhỏ (lỗ kim) cho ánh sáng đi qua và tạo hình ảnh đảo ngược trên mặt phẳng ảnh.
- **Công thức của mô hình lỗ kim**
$$
\frac{x}{X}=\frac{y}{Y}=\frac{z}{Z}
$$
- **Trong đó**:
- `x, y`: tọa độ trên mặt phẳng ảnh.
- `X, Y, Z`: tọa độ của đối tượng trong không gian 3D.
- `f`: tiêu cự của camera (khoảng cách từ lỗ kim đến mặt phẳng ảnh).
### Mô hình Camera phối cảnh (Perspective Camera Model)
- Mô hình này mô tả cách các điểm trong không gian 3D được chiếu lên mặt phẳng 2D với sự bao gồm các biến dạng do ống kính (lens distortion) và các yếu tố như tiêu cự thực tế.
- Ví dụ: Một vật thể cao 1m đặt cách camera 5m. Camera sử dụng mô hình lỗ kim với tiêu cự 50mm. Tính kích thước ảnh của vật thể trên cảm biến.
Giải pháp:
**Công thức sử dụng:**
$$
\text{Kích thước ảnh} = \frac{\text{Kích thước vật thể} * \text{Tiêu cự}}{\text{Khoảng cách đến vật thể}}
$$
$$
=> \frac{1m * 50mm}{5m} = 10mm
$$
Vậy, vật thể sẽ có chiều cao 10mm trên mặt phẳng ảnh của cảm biến,
### **Hiệu ứng quang học từ chuyển động 3D:**
Khi camera hoặc vật thể di chuyển trong không gian 3D, ánh sáng chiều lên các bề mặt vật thể sẽ thay đổi theo vị trí mới. Đây được gọi là hiệu ứng quang học từ chuyển động.
### Hiệu ứng quang học từ chuyển động 3D
Các yếu tố ảnh hưởng:
- Vị trí và cường độ của nguồn sáng: Thay đổi vị trí của nguồn sáng hoặc vật thể có thể tạo ra các thay đổi về độ sáng, độ phản chiếu, và bóng tối.
- Phản xạ bề mặt: Sự thay đổi về góc ánh sáng so với bề mặt vật thể ảnh hưởng đến độ sáng của các điểm ảnh.
- Tương phản: Các điểm sáng tối có thể thay đổi do sự thay đổi vị trí của camera và ánh sáng.
## **3.2. Mô hình chuyển động**
- **Mô hình chuyển động** dùng để mô tả cách các điểm trong không gian hoặc trên mặt phẳng ảnh di chuyển từ vị trí này đến vị trí khác.
- **Hai loại mô hình chính:**
- **Chuyển động chiếu (Projected Motion)**: Chuyển động của các điểm trong không gian 3D được chiếu lên mặt phẳng ảnh.
- **Chuyển động biểu kiến (Apparent Motion)**: Chuyển động quan sát được trên mặt phẳng ảnh, không nhất thiết phản ánh chuyển động thực sự trong không gian 3D.
### Chuyển động chiếu (Projected Motion)
- Chuyển động thực tế của vật thể hoặc camera trong không gian 3D được chiều xuống mặt phẳng 2D.
- **Ví dụ:** Một chiếc ô tô di chuyển trên đường và camera ghi lại cảnh đó. Chuyển động của ô tô trong không gian 3D sẽ được chiều xuống mặt phẳng ảnh.
### Chuyển động biểu kiến (Apparent Motion)
- Chuyển động được cảm nhận trên ảnh có thể không phải là chuyển động thật của đối tượng trong không gian 3D.
- **Ví dụ:** Hiện tượng motion blur (mờ do chuyển động) xảy ra khi máy ảnh không bắt kịp chuyển động của vật thể. Vật thể có thể nhìn như chuyển động nhanh hơn thực tế.
### Ví dụ về chuyển động chiều và chuyển động biểu kiến
Trong một đoạn phim ghi lại đoàn tàu đang di chuyển từ góc quay trên cao, chuyển động thực tế của tàu **(chuyển động chiếu)** được camera ghi lại. Tuy nhiên, nều sử dụng kỹ thuật chỉnh tốc độ khung hình (frame rate), ta có thể tạo ra cảm giác chuyển động tàu nhanh hoặc chậm hơn so với thực tế, đây là **chuyển động biểu kiến**
### Mô Hình Chuyển Động Cứng 3D
- Chuyển đồng cứng: Là loại chuyển động mà một vật thể không bị biến dạng khi di chuyển. Các thành phần của chuyển động cùng bao gồm:
- Phép quay Thay đổi hướng của vật thể trong không gian.
- Phép tịnh tiến. Thay đổi vị trí của vật thể trong không gian
- Ví dụ ứng dụng:
- Chuyển động của camera trong không gian 3D.
- Chuyển động của các vật thể trong môi trường thực tế ảo
### **Công thức Mô Hình Chuyển Động Cứng 3D**
- Phép quay trong không gian 3D
- Phép quay có thể được biểu diễn bởi ma trận quay(xoay) $R$, phụ thuộc vào góc quay θ và trục quay.
- Ví dụ, phép quay quanh trục z:
$$
R_{z}(\theta) =
\begin{bmatrix}
cos\theta & -sin\theta & 0 \\
sin\theta & cos\theta & 0 \\
0 & 0 & 1
\end{bmatrix}
$$
Phép tịnh tiến trong không gian 3D:
Phép tịnh tiến được biểu diễn bởi một vector:
$$
T = [T_{x}, T_{y}, T_{z}]^T
$$
### Công thức tổng quát cho chuyển động cứng 3D:
- Với một điểm $P = [X, Y, Z]^T$ trong không gian 3D, tọa độ mới $P'$ sau khi thực hiện phép biến đổi được tính bằng:
$$
P' = R \cdot P + T
$$
- Trong đó, $R$ là ma trận quay, và $T$ là vector tịnh tiến.
**Bài toán:**
Một vật thể có tọa độ ban đầu là $P = (1, 2, 3)$. Thực hiện phép quay vật thể quanh trục $z$ một góc $90^\circ$, sau đó tịnh tiến theo hướng $x$ với một vector tịnh tiến $T = (5, 0, 0)$. Hãy tìm tọa độ mới của vật thể sau khi thực hiện các phép biến đổi này.



**Kết quả sau phép quay:**
Sau khi thực hiện phép quay, tọa độ mới của điểm sẽ là:
$$
P' =
\begin{bmatrix}
-2 \\
1 \\
3
\end{bmatrix}
$$
Tóm lại:
- Tọa độ $x$ thay đổi từ $1$ thành $-2$
- Tọa độ $y$ thay đổi từ $2$ thành $1$
- Tọa độ $z$ vẫn giữ nguyên là **3**

### Mô Hình Chuyển Động Biểu Kiến 2D
Chuyển động biểu kiến:Là chuyển động của các đối tượng trên một mặt phẳng 2D, dựa trên những thay đổi về vị trí và góc quay.
- Thường được sử dụng để mô phỏng chuyển động của vật thể trong ảnh hoặc video.
- Các phép biến đổi chính bao gồm phép quay, phép tịnh tiến, và phép co dãn.
Ví dụ ứng dụng:Chuyển động của các đối tượng trong video game 2D. Hiệu ứng chuyển động của đối tượng trong hình ảnh.
### Công thức Mô Hình Chuyển Động Biểu Kiến 2D

### Ví dụ về Chuyển Động Biểu Kiến 2D



## 3.3 Ước tính chuyển động biểu kiến 2D
**Giới thiệu:** Ước lượng chuyển động biểu kiến 2D là quá trình xác định các thay đổi vị trí của đối tượng trong không gian 2D, chủ yếu được áp dụng trong xử lý ảnh và thị giác máy tính để phân tích các chuỗi ảnh hoặc video.
**Các vấn đề chính trong ước lượng chuyển động:**
- Xácđịnh chính xác chuyển động trong khung hình.
- Giải quyết các yếu tố nhiễu như che khuất, ánh sáng thay đổi.
- Đảm bảo tính chính xác và thời gian xử lý.
**Ví dụ:** Trong phim hoạt hình hoặc game, hệ thống cần biết được vị trí chuyển động của từng nhân vật từ khung hình này sang khung hình tiếp theo. Ví dụ như khi nhân vật di chuyển qua màn hình, ước lượng chuyển động sẽ xác định vị trí mới dựa vào khung hình trước đó.
### Sự tương ứng thưa thớt, Quang Thông, và Đăng Ký Ảnh
### **Tương ứng thưa thớt:**
- **Mô tả:** Kỹ thuật tìm điểm đặc trưng giữa hai khung hình (thường là các điểm nổi bật như góc cạnh, cạnh sắc).
- **Ưu điểm:** Giảm số lượng điểm ảnh cần phân tích, tiết kiệm tài nguyên.
- **Ứng dụng:** Thường dùng trong các thuật toán theo dõi đối tượng và phân tích chuyển động.
- **Ví dụ:** Trong một chuỗi video giám sát giao thông, hệ thống chỉ tập trung vào các điểm đặc trưng của các phương tiện như đèn xe, biển số xe để xác định các chuyển động mà không cần phân tích toàn bộ điểm ảnh trong khung hình.
### Quang thông (Optical Flow):
- **Khái niệm:** Quang thông là trường vector đại diện cho chuyển động của các điểm ảnh giữa các khung.
- **Phương pháp phổ biến:** Thuật toán Lucas-Kanade (thích hợp cho chuyển động nhỏ), Horn-Schunck (tạo trường quang thông mượt mà).
- **Ví dụ:** Khi đo tốc độ của một chiếc xe từ camera giám sát, quang thông cho phép tính toán hướng di chuyển và tốc độ của xe, dựa trên sự thay đổi của các điểm ảnh trên xe giữa hai khung hình.
### Đăng ký ảnh (Image Registration):
- **Mục tiêu:** Đưa hai hoặc nhiều ảnh vào cùng một hệ tọa độ bằng cách tìm phép biến đổi hình học chính xác nhất.
- **Ứng dụng:** Phân tích hình ảnh y tế, quan sát từ vệ tinh, phát hiện thay đổi môi trường.
- **Ví dụ:** Trong xử lý ảnh y tế, việc đăng ký ảnh giúp các ảnh MRI của bệnh nhân ở các thời điểm khác nhau khớp nhau, để bác sĩ có thể phân tích thay đổi chi tiết nhỏ như sự phát triển của khối u.
### Các Chỉ Số Đo Lường Hiệu Suất Ước Lượng Chuyển Động
**Độ chính xác (Accuracy):**
- **Định nghĩa:** Mức độ khớp giữa chuyển động ước lượng và chuyển động thực tế của đối tượng.
- **Đánh giá:** Bằng cách so sánh độ lệch giữa vị trí thực và vị trí ước lượng.
- **Ví dụ:** Một hệ thống lái xe tự động phải ước lượng chính xác vị trí và hướng đi của các phương tiện khác trong tình huống giao thông phức tạp. Nếu hệ thống đo không chính xác vị trí xe đang đổi làn, nó có thể đưa ra các quyết định lái sai lệch.
**Độ bền (Robustness):**
- **Định nghĩa:** Khả năng thuật toán duy trì độ chính xác dưới các điều kiện phức tạp (ánh sáng thay đổi, che khuất, v.v.).
- **Phương pháp đo lường:** Kiểm tra độ sai số dưới các điều kiện ánh sáng khác nhau, nhiễu ảnh.
- **Ví dụ:** Trong các điều kiện môi trường khắc nghiệt như mưa, sương mù, một hệ thống giám sát giao thông cần có độ bền cao, có khả năng phân biệt được chuyển động dù ảnh bị mờ hoặc nhiễu do thời tiết.
Thời gian xử lý (Processing Time):
▪ Ýnghĩa: Đánh giá tốc độ thuật toán trong thời gian thực.
▪ Tầm quan trọng: Đặc biệt quan trọng trong các ứng dụng yêu cầu thời
gian thực như lái xe tự động và giám sát an ninh.
▪ Ví dụ: Trong ứng dụng thực tế ảo, khi người dùng di chuyển nhanh, hệ
thống phải có tốc độ xử lý cao để tránh hiện tượng lag hoặc mất độ đồng
bộ, làm ảnh hưởng đến trải nghiệm của người dùng.
Giới thiệu về Phương pháp Vi phân:
▪ Là kỹ thuật xác định chuyển động của các điểm ảnh dựa trên sự thay đổi
nhỏ về độ sáng trong không gian và thời gian.
▪ Áp dụng cho các chuỗi hình ảnh liên tiếp, giúp ước lượng quang thông để
xác định hướng và tốc độ chuyển động.
Hai phương pháp nổi bật:
▪ Phương pháp Lukas-Kanade
▪ Phương pháp Horn-Schunck
Phương pháp Lukas-Kanade :
▪ Nguyên lý:
✓ Dựa trên giả định rằng chuyển động của một điểm ảnh giữa hai khung
hình là nhỏ và nhất quán trong một vùng nhỏ xung quanh điểm ảnh đó.
✓ Phương pháp này tính toán quang thông bằng cách sử dụng cửa sổ
cục bộ (local window) quanh điểm ảnh để tìm ra sự dịch chuyển.
▪ Ưu điểm:
✓ Hiệu quả cao cho chuyển động nhỏ: Thích hợp để phát hiện chuyển
động nhỏ và chi tiết trong khung hình.
✓ Tốc độ xử lý nhanh: Thích hợp cho các ứng dụng thời gian thực do tính
toán đơn giản.
Phương pháp Lukas-Kanade :
▪ Nhược điểm:
✓ Giới hạn với chuyển động lớn: Không hiệu quả trong các trường hợp
có sự thay đổi lớn giữa các khung hình.
✓ Phụ thuộc vào cửa sổ cục bộ: Dễ bị sai số nếu chuyển động phức tạp
trong cửa sổ cục bộ.
▪ Ứng dụng: Được sử dụng rộng rãi trong theo dõi đối tượng, nhận diện
khuôn mặt, và phân tích chuyển động trong các chuỗi ảnh video.
Phương pháp Lukas-Kanade :
▪ Ví dụ: Theo dõi chuyển động của một người đi bộ trong video giám sát:
✓ Đặt một cửa sổ cục bộ quanh các điểm nổi bật (như đầu, tay) của
người đi bộ.
✓ Sử dụng phương pháp Lukas-Kanade để xác định sự dịch chuyển của
từng điểm trong chuỗi khung hình.
▪ Minh họa: Các điểm ảnh nổi bật trên đối tượng được đánh dấu và theo dõi
chuyển động qua nhiều khung hình để xác định hướng di chuyển.
Phương pháp Horn-Schunck :
▪ Nguyên lý:
✓ Phương pháp này sử dụng toàn bộ ảnh để tính toán một trường quang thông
mượt mà, nhằm mô hình hóa sự thay đổi chuyển động liên tục trên toàn ảnh.
✓ Giải quyết phương trình quang thông bằng cách thêm một ràng buộc về độ
mịn (smoothness constraint) để duy trì tính liên tục của trường quang thông.
▪ Ưu điểm:
✓ Mô hình hóa trường quang thông liên tục: Đảm bảo sự mượt mà trong chuyển
động, thích hợp cho các đối tượng di chuyển từ từ.
✓ Tính chính xác cao: Hiệu quả khi ước lượng chuyển động với nhiều chi tiết và
ít nhiễu.
Phương pháp Horn-Schunck :
▪ Nhược điểm:
✓ Tốn kém về tính toán: Đòi hỏi năng lực xử lý cao, không phù hợp cho thời gian
thực.
✓ Nhạy cảm với nhiễu: Dễ bị sai lệch trong điều kiện nhiễu hoặc ánh sáng thay
đổi nhiều.
▪ Ứng dụng: Phân tích chuyển động mượt mà trong hình ảnh y tế, nghiên cứu khoa
học, và phân tích chuyển động phức tạp như các dòng chảy chất lỏng.
Phương pháp Horn-Schunck :
▪ Ví dụ: Phân tích dòng chảy của nước trong một đoạn video thí nghiệm:
✓ Sử dụng phương pháp Horn-Schunck để xác định trường quang thông của các
dòng chảy nước trong suốt khung hình.
✓ Trường quang thông mượt mà giúp mô hình hóa và phân tích hướng dòng
chảy tổng thể.
▪ Minh họa: Ảnh video dòng chảy với các vector quang thông được vẽ lên, cho thấy
hướng và tốc độ dòng chảy.
So sánh Lukas-Kanade và Horn-Schunck:
▪ Lukas-Kanade:
✓ Đặc điểm: Phương pháp cục bộ, tính toán nhanh, hiệu quả cho chuyển động nhỏ.
✓ Nhược điểm: Giới hạn với chuyển động lớn và phức tạp.
▪ Horn-Schunck:
✓ Đặc điểm: Phương pháp toàn cục, ước lượng trường quang thông mượt mà, chính
xác cao.
✓ Nhược điểm: Đòi hỏi năng lực xử lý cao, nhạy cảm với nhiễu.
So sánh Lukas-Kanade và Horn-Schunck:
▪ Chọn phương pháp nào?
✓ Lukas-Kanade: Khi cần theo dõi chuyển động nhanh, nhỏ và trong thời gian thực.
✓ Horn-Schunck: Khi cần phân tích chuyển động mượt mà, chi tiết và không giới hạn
thời gian xử lý.
## 3.5. Các phương pháp đối sánh
Mục tiêu: Cung cấp kiến thức cơ bản về các kỹ thuật so khớp, bao gồm các
phương pháp cơ bản, thay đổi kích thước khối, phân cấp và các kỹ thuật tổng
quát hóa.
Ứng dụng chính: Phân tích chuyển động, theo dõi đối tượng, đăng ký ảnh.
So Khớp Khối Cơ Bản
Định nghĩa: Phương pháp so khớp khối cơ bản, chia hình ảnh thành
các khối có kích thước cố định để so khớp.
• Ví dụ: Theo dõi chuyển động của một chiếc xe trên video đường
phố. Mỗi khối ảnh được theo dõi từ khung hình này sang khung hình
khác để xác định chuyển động của chiếc xe.
• Ưu điểm: Dễ triển khai, tính toán đơn giản.
• Hạn chế: Độ chính xác bị hạn chế khi đối mặt với chuyển động
phức tạp hoặc biến dạng.
• Phương pháp phổ biến: Cross-Correlation và Sum of Absolute
Differences (SAD).
So Khớp Khối Kích Thước Thay Đổi
- Định nghĩa: So khớp khối với kích thước linh hoạt, tùy chỉnh kích
thước khối để phù hợp với các khu vực có chuyển động khác nhau.
• Ví dụ: Trong một cảnh phim với các đối tượng có kích thước khác
nhau (như người và ô tô), các khối nhỏ được sử dụng cho các chi tiết
nhỏ như người đi bộ, trong khi các khối lớn hơn dùng để theo dõi ô tô.
• Ưu điểm: Cải thiện độ chính xác và hiệu suất cho các cảnh phức
tạp.
• Hạn chế: Tính toán phức tạp hơn.
• Kỹ thuật điển hình: Adaptive Block Size Selection (Chọn kích thước
khối tùy biến).
So Khớp Khối Phân Cấp
So Khớp Khối Tổng Quát – Chuyển Động Biến Dạng Cục Bộ
Ước Lượng Đồng Dạng Từ Tương Ứng Đặc Trưng
## 3.6. Các phương pháp tối ưu hóa phi tuyến
Tối ưu phi tuyến tính là quá trình tìm giá trị tối ưu cho một hàm phi tuyến.
▪ Áp dụng trong nhiều lĩnh vực như xử lý ảnh và video để tìm ra sự thay đổi giữa
các khung hình.
▪ Mục tiêu: Cải thiện độ chính xác trong ước lượng chuyển động của các đối
tượng.
Ước lượng chuyển động Pel-Recursive
1. Giới thiệu Phương pháp Pel-Recursive: Sử dụng phương pháp hồi quy để
ước lượng vị trí điểm ảnh (pel) qua các khung hình.Phù hợp với chuyển động
nhỏ và sự thay đổi dần dần.
2. Ưu điểm:
▪ Chính xác cao: Giúp nắm bắt sự dịch chuyển nhỏ giữa các khung hình.
▪ Tính toán ít phức tạp: Hiệu quả trong việc xử lý theo thời gian thực.
3. Nhược điểm:
▪ Giới hạn về độ chính xác khi có chuyển động nhanh.
▪ Không phù hợp với nền phức tạp hoặc đối tượng chuyển động phức tạp.
Ví dụ: Ứng dụng Pel-Recursive trong video giám sát:
▪ Giả sử: Một camera an ninh cố định đang theo dõi một người đi bộ qua khung
hình.
▪ Ứng dụng Pel-Recursive: Ước lượng sự dịch chuyển của người đi bộ, giúp hệ
thống ghi nhận chuyển động và theo dõi.
▪ Kết quả: Đạt độ chính xác cao trong việc phát hiện chuyển động chậm, tránh
xung đột với các đối tượng khác trong khung hình.
Ước lượng chuyển động Bayes :
1. Giới thiệu Phương pháp Bayes
▪ Dựa trên xác suất điều kiện và mô hình thống kê.
▪ Dùng thông tin trước đó để cập nhật dự đoán chuyển động cho khung hình mới.
2. Ưu điểm
▪ Linh hoạt: Thích ứng tốt với các điều kiện thay đổi.
▪ Hiệu quả cao: Tận dụng dữ liệu quá khứ để cải thiện độ chính xác của dự đoán.
3. Nhược điểm
▪ Phức tạp về tính toán: Đòi hỏi tài nguyên tính toán lớn.
▪ Thời gian xử lý dài hơn: Không lý tưởng cho các ứng dụng yêu cầu xử lý thời gian
thực.
▪ Ví dụ: Áp dụng Bayes trong xử lý ảnh y tế:
▪ Giả sử: Đo sự dịch chuyển của một cơ quan nội tạng nhỏ qua các ảnh chụp
liên tiếp.
▪ Ứng dụng Ước lượng Bayes: Dự đoán chính xác vị trí nội tạng, dùng cho
các phân tích y tế hoặc chuẩn bị cho phẫu thuật.
▪ Kết quả: Cung cấp độ chính xác cao trong các tình huống phức tạp, tận dụng
dữ liệu ảnh trước đó để đưa ra dự đoán chính xác hơn.
## 3.7. Phương pháp miền biến đổi
Miền biến đổi là kỹ thuật sử dụng phép biến đổi để chuyển dữ liệu từ miền không
gian sang miền tần số.
▪ Mục đích: Đơn giản hóa quá trình phân tích và ước lượng chuyển động của đối
tượng.
▪ Ứng dụng: Thường sử dụng trong xử lý ảnh và video, đặc biệt là khi có nhiều
chuyển động hoặc khi muốn giảm nhiễu.
Phương pháp Tương quan Pha
1. Giới thiệu Phương pháp Tương quan Pha: Sử dụng biến đổi Fourier để phân
tích các khung hình.Dựa trên sự tương quan pha giữa các khung để phát hiện
sự dịch chuyển.
2. Ưu điểm
▪ Chính xác cao: Đặc biệt hiệu quả với các chuyển động tịnh tiến.
▪ Chống nhiễu tốt: Ít bị ảnh hưởng bởi nhiễu so với các phương pháp khác.
3. Nhược điểm
▪ Không phù hợp với chuyển động quay: Khó nhận diện khi đối tượng xoay
hoặc biến dạng.
▪ Yêu cầu tính toán cao: Cần tài nguyên tính toán lớn để thực hiện biến đổi
Fourier.
Phương pháp Tương quan Pha
Ví dụ: Ứng dụng trong hệ thống theo dõi đối tượng:
▪ Giả sử: Một hệ thống camera cần theo dõi sự di chuyển của một xe hơi qua
khung hình.
▪ Ứng dụng Tương quan Pha: Dùng để xác định hướng và tốc độ dịch chuyển của
xe thông qua các khung hình liên tiếp.
▪ Kết quả: Cung cấp thông tin dịch chuyển với độ chính xác cao, bất kể có nhiễu
nhẹ trong môi trường.
Phương pháp Quang phổ Không gian-Tần số
1. Giới thiệu Phương pháp Quang phổ Không gian-Tần số
▪ Kết hợp giữa miền không gian và miền tần số để phân tích hình ảnh.
▪ Sử dụng các biến đổi quang phổ để xác định sự thay đổi tần số và không gian
của đối tượng.
2. Ưu điểm
▪ Đa dạng và linh hoạt: Phân tích được cả chuyển động tịnh tiến lẫn quay.
▪ Thông tin chi tiết: Khả năng phát hiện các chuyển động phức tạp hơn.
3. Nhược điểm
▪ Tính toán phức tạp: Đòi hỏi nhiều bước biến đổi và tài nguyên xử lý.
▪ Khó áp dụng trong thời gian thực: Do yêu cầu về tính toán lớn..
Phương pháp Quang phổ Không gian-Tần số
Ví dụ: Áp dụng trong phân tích ảnh vệ tinh:
Giả sử: Một ảnh vệ tinh cần phân tích chuyển động của đám mây.
Ứng dụng Quang phổ Không gian-Tần số: Phát hiện các thay đổi trong cả không
gian và tần số để xác định hướng và tốc độ di chuyển của đám mây.
Kết quả: Giúp cung cấp thông tin chính xác về khí tượng và hỗ trợ dự báo thời tiết.
## 3.8. Ước tính cấu trúc và chuyển động 3D
Mục tiêu: Khôi phục hình dạng 3D của đối tượng và vị trí camera từ hình ảnh 2D.
Ứng dụng: Sử dụng trong thị giác máy tính, thực tế ảo, robot, và đồ họa 3D.
Hiệu chỉnh Camera
1. Giới thiệu
Hiệu chỉnh Camera là quá trình xác định các thông số của camera như tiêu
cự, tâm ảnh và hệ số méo để cải thiện độ chính xác trong quá trình chụp
hình.
2. Ưu điểmĐộ chính xác cao:
▪ Cải thiện chất lượng của mô hình 3D.
▪ Giảm méo ảnh: Hình ảnh ít bị biến dạng, đặc biệt ở các cạnh.
3. Nhược điểm
Quá trình phức tạp: Đòi hỏi nhiều hình ảnh hoặc đối tượng chuẩn.
4. Ví dụ Minh họa
Dùng bảng hiệu chuẩn (chessboard pattern) để xác định các thông số camera
cho ứng dụng robot.
Tái tạo Affine
1. Giới thiệu
Tái tạo Affine là phương pháp khôi phục cấu trúc 3D của đối tượng mà
không cần biết chính xác thông số camera, chỉ cần giữ nguyên tỷ lệ và góc.
2. Ưu điểm
▪ Đơn giản hơn các phương pháp khác: Không cần hiệu chỉnh camera hoàn
chỉnh.
▪ Độ chính xác tương đối cao: Giữ nguyên tỷ lệ hình học.
3. Nhược điểmKhông giữ được thông tin về khoảng cách thực tế: Chỉ là một
dạng gần đúng.
4. Ví dụ Minh họa
Tái tạo các điểm mốc của một tòa nhà trong ảnh để phục vụ mô phỏng kiến trúc.
Tái tạo Phép chiếu
1. Giới thiệu
Tái tạo Phép chiếu sử dụng thông tin về tỷ lệ và góc chiếu để tái tạo cấu trúc 3D
từ nhiều ảnh.
2. Ưu điểm
Linh hoạt: Dùng được trong nhiều bối cảnh khác nhau mà không cần hiệu chỉnh
camera.
3. Nhược điểm
Độ chính xác thấp hơn tái tạo Euclid: Kết quả chỉ có độ chính xác tương đối.
4. Ví dụ Minh họa
Ví dụ: Sử dụng ảnh chụp từ các góc khác nhau để tạo mô hình 3D của một
tượng điêu khắc.
Tái tạo Euclid
1. Giới thiệu: Tái tạo Euclid là phương pháp tái tạo cấu trúc 3D với độ chính
xác cao nhất, dựa trên các tham số camera được hiệu chỉnh đầy đủ.
2. Ưu điểm
Chính xác cao: Phục hồi chính xác cả tỷ lệ và khoảng cách thực tế.
3. Nhược điểm
Yêu cầu hiệu chỉnh camera chính xác: Phải biết đầy đủ thông số camera.
4. Ví dụ Minh họa
Ví dụ: Tạo mô hình 3D chính xác của một căn phòng cho thiết kế nội thất,
bao gồm cả kích thước và khoảng cách thực tế. dụ Minh họa
---
# CHƯƠNG 04: PHÂN ĐOẠN VÀ THEO DÕI VIDEO
## 4.1 Phân đoạn hình ảnh
- **Khái niệm**: Phân đoạn hình ảnh là quá trình chia nhỏ một hình ảnh thành các vùng hoặc đối tượng dựa trên các thuộc tính nhất định (như màu sắc, cường độ sáng, cạnh, hoặc kết cấu) để dễ dàng phân tích.
### Các phương pháp phân đoạn
- **Phân đoạn dựa trên ngưỡng (Thresholding)**: Chia hình ảnh thành các vùng sáng và tối dựa vào giá trị ngưỡng xác định, tạo thành hình ảnh nhị phân.
- **Phân đoạn dựa trên vùng**: Sử dụng tính chất liên kết để phát hiện các vùng có cùng đặc tính trong hình ảnh.
- **Phân đoạn dựa trên cạnh**: Xác định các cạnh của đối tượng bằng cách phát hiện thay đổi đột ngột trong cường độ sáng.
❖Ứngdụng: Được sử dụng trong các hệ thống giám sát, nhận diện khuôn mặt, xử lý
y tế (phân tích ảnh chụp X-quang, MRI).

---
## 4.2 Phát hiện thay đổi
- **Khái niệm**: Phát hiện thay đổi trong video là kỹ thuật phát hiện các khác biệt giữa các khung hình liên tiếp, giúp xác định những phần của khung hình bị thay đổi do chuyển động.
### Các phương pháp
- **So sánh khung hình (Frame Differencing)**: So sánh khung hiện tại với khung trước đó để xác định sự thay đổi, thường dùng để phát hiện chuyển động.
- **Phương pháp Mô hình nền (Background Subtraction)**: Xây dựng một mô hình nền, sau đó so sánh từng khung hình với nền để tìm ra sự khác biệt.
- **Phát hiện dựa trên quỹ đạo chuyển động**: Phân tích sự di chuyển liên tục của các đối tượng để nhận diện chuyển động phức tạp hơn.
### Ứng dụng
Hệ thống giám sát an ninh, phát hiện chuyển động, phát hiện hoạt động bất thường trong video.
---
## 4.3 Phân đoạn chuyển động
- **Khái niệm**: Phân đoạn chuyển động là quá trình xác định và tách riêng các đối tượng chuyển động trong video.
### Ứng dụng
- Hệ thống giám sát an ninh, phát hiện chuyển động, phát hiện hoạt động bất thường trong video.
### Ví dụ
- Phân đoạn chuyển động sử dụng **MOG2 (Background Subtractor MOG2)**.
---
## 4.4 Theo dõi chuyển động
**Khái niệm**: Theo dõi chuyển động là việc liên tục xác định và lưu trữ vị trí của các đối tượng đang di chuyển trong chuỗi video, theo dõi lộ trình của đối tượng qua các khung hình.
### Các phương pháp
- **Bộ lọc Kalman (Kalman Filter)**: Dự đoán và cập nhật vị trí của đối tượng dựa vào thông tin chuyển động trước đó, thích hợp cho các chuyển động tuyến tính.
- **Particle Filter (Bộ lọc hạt)**: Thường được sử dụng cho các chuyển động phức tạp, hoạt động dựa trên các phân phối xác suất.
- **Multiple Object Tracking**: Sử dụng các phương pháp như IOU, Hungarian Algorithm để theo dõi đồng thời nhiều đối tượng trong cùng khung.
### Ứng dụng
Giám sát an ninh, thể thao, phân tích hành vi trong giao thông và video.
### Ví dụ:
Dùng matplotlib để hiển thị các khung hình với đường di chuyển của các điểm đặc trưng.
---
## 4.5 Làm mờ hình ảnh và video
**Khái niệm**: Làm mờ là kỹ thuật xử lý ảnh để giảm chi tiết, làm mịn các vùng trong ảnh hoặc tạo hiệu ứng mờ.
### Các phương pháp làm mờ
- **Gaussian Blur (Làm mờ Gaussian)**: Sử dụng bộ lọc Gaussian để làm mờ ảnh một cách tự nhiên, phù hợp cho cả xử lý nhiễu và hiệu ứng hình ảnh.
- **Median Blur (Làm mờ trung vị)**: Sử dụng giá trị trung vị của các pixel xung quanh để làm mờ, tốt cho việc giảm nhiễu loại hạt muối tiêu.
- **Bilateral Filter (Bộ lọc song phương)**: Làm mờ ảnh trong khi vẫn giữ được các cạnh sắc nét.
### Ứng dụng
Làm mờ biển số xe trong video giám sát, làm mờ khuôn mặt trong các ứng dụng bảo mật, tạo hiệu ứng trong nghệ thuật và điện ảnh.
### Ví dụ:
Hiển thị các khung hình đã làm mờ bằng matplotlib.
---
## 4.6 Đánh giá hoạt động
**Khái niệm**: Đánh giá hoạt động liên quan đến việc phân tích hoạt động trong video, ví dụ như đếm số lượng người qua đường hoặc xe cộ.
### Ví dụ
Đếm các vật thể di chuyển trong vùng quan tâm.
---
# 5.1 Lý thuyết về lọc không gian-thời gian
## Khái niệm:
Lọc không gian-thời gian kết hợp thông tin từ cả không gian (các pixel lân cận) và thời gian (các khung hình trước và sau) để cải thiện chất lượng video.
## Ứng dụng:
- Giảm nhiễu.
- Tăng cường độ phân giải.
- Ổn định hình ảnh.
## Ví dụ:
Sử dụng các bộ lọc như Gaussian hoặc Median để làm mượt hình ảnh trong cả không gian và thời gian.
(code)
---
# 5.2 Chuyển đổi định dạng video
## Khái niệm:
Chuyển đổi định dạng video giúp thay đổi kích thước, độ phân giải, hoặc mã hóa video cho các mục đích khác nhau.
## Lý thuyết:
- Các định dạng phổ biến bao gồm MP4, AVI, MKV, MOV, v.v.
- Sử dụng thư viện OpenCV hoặc FFMPEG để chuyển đổi.
(code)
---
# 5.3 Lọc nhiễu đa khung hình
## Khái niệm:
Lọc nhiễu đa khung hình (Multi-Frame Denoising) là việc sử dụng nhiều khung hình để loại bỏ nhiễu từ video, nâng cao chất lượng ảnh.
## Phương pháp:
Sử dụng thuật toán như Kalman filter hoặc Median filter trên các khung hình liên tiếp để giảm nhiễu.
(code)
---
# 5.4 Phục hồi đa khung
## Khái niệm:
Phục hồi đa khung hình (Multi-Frame Restoration) là việc sử dụng nhiều khung hình để phục hồi chi tiết và cấu trúc hình ảnh bị mất trong quá trình quay.
## Phương pháp:
Sử dụng kỹ thuật lọc Wiener hoặc các phương pháp Deep Learning để phục hồi ảnh.
---
# 5.5 Độ phân giải siêu đa khung hình
## Khái niệm:
Độ phân giải siêu đa khung hình (Multi-Frame Super-Resolution) nhằm nâng cao độ phân giải của video bằng cách tổng hợp thông tin từ nhiều khung hình.
## Phương pháp:
Áp dụng mô hình Deep Learning như SRCNN hoặc các mô hình tăng cường độ phân giải để xử lý video đầu vào.
(code)
---
# CHƯƠNG 06: NÉN VIDEO
# 6.1 Các phương pháp tiếp cận nén video
## Nén nội dung (Intra-frame):
- **Khái niệm**: Nén trong phạm vi một khung hình (frame), thường áp dụng các kỹ thuật nén ảnh tĩnh như JPEG.
- **Ví dụ**: Để nén ảnh trong từng khung video, dùng phương pháp DCT (Discrete Cosine Transform) để chuyển khung hình thành các hệ số tần số, sau đó nén các hệ số ít quan trọng hơn.
## Nén liên khung (Inter-frame Compression):
- **Khái niệm**: Sử dụng sự giống nhau giữa các khung hình, dùng dự đoán chuyển động để mã hóa slượngự khác biệt.
- **Ví dụ**: Dự đoán khung tiếp theo dựa trên khung trước và khung sau, chỉ mã hóa phần thay đổi giữa các khung.
## Nén theo khối (Block-based Compression):
- **Khái niệm**: Chia khung hình thành các khối và nén từng khối.
- **Ví dụ**: MPEG-4 AVC/H.264 sử dụng phương pháp này bằng cách chia khung hình thành macroblock 16x16 và mã hóa từng block.
## Nén dựa trên mô hình (Model-based Compression):
- **Khái niệm**: Áp dụng mô hình hóa các đối tượng trong khung hình.
- **Ví dụ**: Tạo mô hình 3D để mã hóa đối tượng thay vì mã hóa toàn bộ khung hình.
---
# 6.2 Các tiêu chuẩn nén video sớm
## H.261 và H.263:
- Tiêu chuẩn nén đầu tiên, sử dụng trong truyền hình hội nghị với tốc độ bit thấp.
- Đặc điểm: Sử dụng nén theo khối và nén liên khung đơn giản.
## MPEG-1 và MPEG-2:
- Phát triển bởi MPEG, dùng trong truyền hình và DVD.
- Sử dụng kỹ thuật nén theo khối và dự đoán chuyển động.
- **Ví dụ**: Tạo file video MPEG-2 để lưu trữ hoặc truyền tải.
---
# 6.3 Tiêu chuẩn MPEG-4 AVC / ITU-T H.264
## Khái niệm:
MPEG-4 AVC/H.264 được phát triển bởi ITU-T và MPEG, sử dụng trong video trực tuyến và Blu-ray.
## Đặc điểm:
- Mã hóa khối hiệu quả cao (macroblock).
- Dự đoán chuyển động với độ chính xác cao.
- Sử dụng cấu trúc khung GOP (Group of Pictures) để tăng chất lượng.
- Khả năng nén cao, tiết kiệm băng thông.
## Ứng dụng:
Thích hợp cho phát trực tiếp và lưu trữ với các thiết bị di động.
---
# 6.4 Tiêu chuẩn mã hóa video hiệu quả cao (HEVC)
## HEVC/H.265:
- Tiêu chuẩn mới hơn, hiệu suất nén cao hơn 50% so với H.264.
## Đặc điểm:
- Chia khối lớn thành các khối nhỏ (CTU - Coding Tree Unit).
- Sử dụng dự đoán chuyển động tiên tiến và bộ lọc.
- Hỗ trợ độ phân giải cao (lên đến 8K) với tốc độ bit thấp.
## Ứng dụng:
Thích hợp cho video 4K và các ứng dụng yêu cầu chất lượng cao, như truyền hình trực tiếp và VR.
---
# 6.5 Nén video có thể mở rộng
## Khái niệm:
Nén có thể mở rộng cho phép video có nhiều lớp chất lượng hoặc độ phân giải khác nhau.
## Các loại mở rộng:
- **Mở rộng không gian**: Thay đổi độ phân giải.
- **Mở rộng thời gian**: Thay đổi tốc độ khung hình.
- **Mở rộng chất lượng**: Điều chỉnh mức chất lượng cho từng lớp.
## Ứng dụng:
Được sử dụng trong các mạng không đồng nhất, cho phép điều chỉnh chất lượng video dựa trên băng thông.
---
# 6.6 Nén video âm thanh nổi và nhiều chế độ xem
## Video 3D:
- Nén video bằng cách mã hóa hai khung hình (trái và phải) để tạo hiệu ứng âm thanh nổi.
## Video nhiều chế độ xem:
- Nén đồng thời các góc nhìn khác nhau từ nhiều camera.
- **Ví dụ**: Kết hợp nhiều góc quay để tạo hiệu ứng 3D hoặc nhiều chế độ xem.