owned this note
owned this note
Published
Linked with GitHub
# Một số khái niệm cơ bản trong Crypto
## 1.Cryptography
- Mật mã học là một lĩnh vực liên quan đến các kỹ thuật ngôn ngữ và toán học để đảm bảo an toàn thông tin đặc biệt là trong thông tin liên lạc.
- Mật mã học gắn liền với quá trình mã hóa; có nghĩa là nó gắn với các cách thức để chuyển đổi thông tin từ dạng này sang dạng khác nhưng ở đây là từ dạng thông tin có thể nhận thức được thành dạng không nhận thức được, làm cho thông tin trở thành dạng không thể đọc được nếu như không có các kiến thức bí mật.
-> để đảm bảo tính bí mật của các thông tin quan trọng, chẳng hạn trong công tác tình báo, quân sự hay ngoại giao cũng như các bí mật về kinh tế, thương mại.
- Mật mã học là một lĩnh vực liên ngành, được tạo ra từ một số lĩnh vực khác, chủ yếu liên quan với các kiểu mẫu trong ngôn ngữ.
-> Mật mã hóa là công cụ được sử dụng trong an ninh máy tính và mạng.
- Lĩnh vực có liên quan là steganography — là lĩnh vực nghiên cứu về việc che giấu sự tồn tại của thông điệp mà không nhất thiết phải che giấu nội dung của thông điệp đó (ví dụ: ảnh điểm, hay mực không màu).
## 2.Cryptanalysis (phân tích mật mã)
- Cryptanalysis là giải mã và phân tích các mã, mật mã hoặc văn bản được mã hóa. Cryptanalysis sử dụng công thức toán học để tìm kiếm các lỗ hổng thuật toán và đột nhập vào hệ thống an ninh mật mã hoặc thông tin hay có thể hiểu là một quá trình tìm kiếm các điểm yếu trong các thuật toán mật mã và sử dụng các điểm yếu này để giải mã bản mã mà không cần biết khóa bí mật (suy diễn phiên bản). Đôi khi điểm yếu không nằm ở bản thân thuật toán mật mã, mà là ở cách nó được áp dụng để làm cho việc phân tích mật mã thành công. Kẻ tấn công cũng có thể có các mục tiêu khác, chẳng hạn như:
- Total Break – Tìm khóa bí mật.
- Gobal Deduction – Tìm một thuật toán tương đương về mặt chức năng để mã hóa và giải mã mà không yêu cầu kiến thức về khóa bí mật.
- Information Deduction – Thu thập một số thông tin về bản rõ hoặc bản mã mà trước đây chưa được biết đến.
- Distinguishing Algorithm – Kẻ tấn công có khả năng phân biệt đầu ra của mã hóa (bản mã) với hoán vị ngẫu nhiên của các bit
Mục tiêu của kẻ tấn công thực hiện phá mã sẽ phụ thuộc vào nhu cầu cụ thể của kẻ tấn công trong bối cảnh tấn công nhất định. Trong hầu hết các trường hợp, nếu việc phá mã thành công, kẻ tấn công sẽ không thể suy diễn ra một số thông tin về bản rõ (mục tiêu 3). Tuy nhiên, điều đó có thể đủ đối với kẻ tấn công, tùy thuộc vào ngữ cảnh.
- Dữ liệu có thể được đọc và hiểu mà không cần bất kỳ biện pháp đặc biệt nào được gọi là plaintext, trong khi phương pháp ngụy trang plaintext để che giấu thông tin thực sự của nó được gọi là Encryption - mã hóa.
- Plaintext được mã hóa được gọi là văn bản mã hóa và quá trình hoàn nguyên dữ liệu được mã hóa trở lại văn bản thuần túy được gọi là Decryption - giải mã.
## 3.Encoding and Decoding
- Encoding là quá trình chuyển đổi chuỗi các ký tự như là chữ cái, chữ số và các ký tự đặc biệt thành một dạng format khác theo quy chuẩn nhất định (ví dụ như theo bảng mã ASCII) để truyền dẫn một cách hiệu quả.
- Decoding là quá trình chuyển đổi chuỗi ký tự đã bị encoding về lại trạng thái ban đầu. Quá trình này hoàn toàn khác với mã hóa - Encryption mà chúng ta vẫn hay lầm tưởng.
-> thường được xử dụng trong quá trình trao đổi thông tin và lưu trữ thông tin. Tuy nhiên trong trường hợp cần trao đổi những thông tin nhạy cảm, mang tính bảo mật cao thì encoding không được khuyến khích sử dụng.
## 4.Encrypt/Decrypt( mã hóa và giải mã)
- Mã hóa cơ sở dữ liệu là quá trình chuyển đổi dữ liệu, trong một cơ sở dữ liệu, định dạng văn bản đơn giản vào một văn bản mật mã vô nghĩa bằng phương tiện của một thuật toán phù hợp.
- Encryption: Là quá trình mã hóa một thông điệp, làm cho nó trở thành không-đọc-được
- Decryption: Quá trình ngược lại với encryption, biến một nội dung đã-mã-hóa trở lại về nội dung có thể hiểu được.
## 5.Symmetric and Asymmetric Cryptography( mã hóa đối xứng và mã hóa bất đối xứng)
- Symmetric Encryption (Mã hóa đối xứng)
->Mật mã khóa đối xứng(hay mã hóa đối xứng) là một loại sơ đồ mã hóa trong đó một khóa giống nhau sẽ vừa được dùng để mã hóa, vừa được dùng để giải mã các tệp tin,
là những hệ mật được sử dụng chung 1 khóa trong quá trình mã hóa và mã hóa. Do đó khóa phải được giữ bí mật tuyệt đối.
- Asymmetric Encryption (Mã hóa bất đối xứng)
-> Ở hệ mật này thay vì nguời dùng dùng chung 1 khóa như ở hệ mật mã khóa đối xứng thì ở đây sẽ dùng 1 cặp khóa có tên là public key và private key.
**Sự khác biệt** cơ bản giữa hai phương pháp mã hóa này là các thuật toán mã hóa đối xứng sử dụng một khóa đơn, còn mã hóa bất đối xứng sử dụng hai khóa khác nhau nhưng có liên quan. Chính sự khác biệt tuy có vẻ đơn giản này khiến hai hai hình thức kỹ thuật mã hóa này hoàn toàn khác nhau về chức năng và cách sử dụng của chúng.
## 6.Block Cipher and Stream Cipher( mật mã khối và mật mã dòng)
- Block Cipher là một khối trong đó một khối plaintext được coi là khối văn bản gốc cần được xử lý và được sử dụng để tạo ra một khối cipher text có độ dài bằng nhau. Thông thường, kích thước khối 64 hoặc 128 bit được sử dụng, giống như với Stream Cipher, hai người dùng chia sẻ khóa mã hóa đối xứng.
- Mật mã dòng thuộc họ mật mã khóa đối xứng. Mật mã dòng mã hóa từng chữ số văn bản thuần túy với các phép biến đổi khác nhau cho các chữ số liên tiếp. Vì mã hóa của mỗi chữ số phụ thuộc vào trạng thái hiện tại của công cụ mã hóa, mật mã dòng còn được gọi là mật mã trạng thái.
- Mật mã khối là một mật mã khóa đối xứng khác. Mật mã khối hoạt động trên các khối (nhóm bit) có độ dài cố định. Mật mã khối sử dụng một phép biến đổi cố định (không thay đổi) cho tất cả các chữ số trong khối.
Mặc dù cả mật mã dòng và mật mã khối đều thuộc họ mật mã đối xứng, nhưng có **một số điểm khác biệt**.
- Mật mã khối mã hóa các khối bit có độ dài cố định, trong khi mật mã dòng kết hợp các bit văn bản thuần túy với một dòng bit mật mã giả ngẫu nhiên sử dụng phép toán XOR. Mặc dù mật mã khối sử dụng cùng một phép biến đổi, nhưng mật mã dòng sử dụng các phép biến đổi khác nhau dựa trên trạng thái của động cơ. Mật mã luồng thường thực thi nhanh hơn mật mã khối. Về độ phức tạp của phần cứng, mật mã dòng tương đối ít phức tạp hơn. Mật mã luồng là ưu tiên điển hình so với mật mã khối khi văn bản thuần túy có sẵn với số lượng khác nhau (ví dụ: kết nối wifi an toàn), bởi vì mật mã khối không thể hoạt động trực tiếp trên các khối ngắn hơn kích thước khối. Nhưng đôi khi, sự khác biệt giữa mật mã dòng và mật mã khối không rõ ràng lắm.
->Lý do là, khi sử dụng một số chế độ hoạt động, mật mã khối có thể được sử dụng để hoạt động như một mật mã dòng bằng cách cho phép nó mã hóa đơn vị dữ liệu nhỏ nhất hiện có.
## 7.Hash Function (hàm băm)
- Hash function hay còn gọi là “hàm băm” là hàm nhận một input đầu vào, từ input đó tạo ra một giá trị output (hay còn gọi là “hash value” – “giá trị băm”) tương ứng. Giá trị đầu vào có thể có độ dài tuỳ ý nhưng giá trị băm thì luôn có độ dài cố định. Hash function là hàm mã hoá một chiều.
-> **mục đích:** mã hóa dữ liệu. Những hàm băm mật mã cũng giống như những hàm băm thông thường, nhưng mang trong mình một số đặc điểm khác, quan trọng nhất là không thể đảo ngược. Điều này có nghĩa là khi bạn có trong tay giá trị sau khi băm, bạn không thể biết giá trị ban đầu là gì. Điều này đơn giản như việc bạn uống một cốc sinh tố hỗn hợp rất ngon nhưng không thể nào liệt kê tất cả nguyên liệu của nó vậy
Ngoài ra, hàm băm mật mã còn mang một số đặc điểm khác như tính tránh va chạm (xảy ra khi hai giá trị khác nhau nhưng khi chạy qua hàm băm lại trả về hai kết quả giống nhau), tính hiệu quả (thời gian tính toán những giá trị băm phải nhanh) và cả tính nhạy cảm (chỉ cần sự thay đổi nhỏ trong giá trị ban đầu có thể thay đổi hoàn toàn giá trị băm).
**Công dụng**
- Kiểm tra sự toàn vẹn của tệp tin
Như đặc điểm của hàm băm, cùng một giá trị sẽ cho ra cùng một giá trị băm. Vậy nên có thể đối chiếu tệp tin ta tải trên mạng về với bản gốc bằng cách so sánh giá trị băm của chúng với nhau. Nếu chúng có chung giá trị băm tức là tệp tin trùng với bản gốc, nếu không tệp tin đã bị sửa đổi hoặc bị hỏng. Một số trường hợp, tệp tin của bạn tải về bị can thiệp bởi bên thứ ba trước khi đến thiết bị và chúng có thể cài mã độc vào tệp tin đó. Việc kiểm tra giá trị băm giúp đảm bảo tệp tin của bạn an toàn.
- Xác minh mật khẩu
Có một điều nên biết, trong những thiết kế cơ sở dữ liệu hiện đại, thứ lưu trong đó không phải mật khẩu của bạn dưới dạng văn bản đơn thuần mà là giá trị hash của chúng. Khi nhập mật khẩu, mật khẩu của bạn sẽ được chạy qua hàm hash, sau đó sẽ được so sánh với giá trị băm trong cơ sở dữ liệu để quyết định có được chứng thực để sử dụng dịch vụ không. Điều này làm giảm đáng kể thiệt hại khi cơ sở dữ liệu bị tấn công, khi những gì bị lộ ra ngoài là những giá trị băm chứ không phải mật khẩu. Để an toàn hơn, hệ thống còn thêm giá trị muối (salt) vào mật khẩu gốc, rồi cho chạy qua hàm băm, sau đó mới lưu vào cơ sở dữ liệu. Vậy nên kể cả khi giá trị băm của mật khẩu bị lộ và bị giải mã, kẻ tấn công vẫn chưa thể có được mật khẩu thực sự do nó đã được thêm vào giá trị "salt".
**Bài tập tự luyện:**


