# HITCON CTF 2024 Writeup ## Hyper512 * Source: ```py import secrets from hashlib import sha256 MASK1 = 0x6D6AC812F52A212D5A0B9F3117801FD5 MASK2 = 0xD736F40E0DED96B603F62CBE394FEF3D MASK3 = 0xA55746EF3955B07595ABC13B9EBEED6B MASK4 = 0xD670201BAC7515352A273372B2A95B23 class LFSR: def __init__(self, n, key, mask): self.n = n self.state = key & ((1 << n) - 1) self.mask = mask def __call__(self): b = self.state & 1 self.state = (self.state >> 1) | ( ((self.state & self.mask).bit_count() & 1) << (self.n - 1) ) return b class Cipher: def __init__(self, key: int): self.lfsr1 = LFSR(128, key, MASK1) key >>= 128 self.lfsr2 = LFSR(128, key, MASK2) key >>= 128 self.lfsr3 = LFSR(128, key, MASK3) key >>= 128 self.lfsr4 = LFSR(128, key, MASK4) def bit(self): x = self.lfsr1() ^ self.lfsr1() ^ self.lfsr1() y = self.lfsr2() z = self.lfsr3() ^ self.lfsr3() ^ self.lfsr3() ^ self.lfsr3() w = self.lfsr4() ^ self.lfsr4() return ( sha256(str((3 * x + 1 * y + 4 * z + 2 * w + 3142)).encode()).digest()[0] & 1 ) def stream(self): while True: b = 0 for i in reversed(range(8)): b |= self.bit() << i yield b def encrypt(self, pt: bytes): return bytes([x ^ y for x, y in zip(pt, self.stream())]) def decrypt(self, ct: bytes): return self.encrypt(ct) if __name__ == "__main__": with open("flag.txt", "rb") as f: flag = f.read().strip() key = secrets.randbits(512) cipher = Cipher(key) gift = cipher.encrypt(b"\x00" * 2**12) print(gift.hex()) ct = cipher.encrypt(flag) print(ct.hex()) #  # 16c63370ac3860ec7eb12f9ec357d462f8513ee887cd86481b521b2bd7995d8abecd595e2ef6fc554cb04d813848b19c06290f0818274303842e68fdc280f1fec612826f ``` ### **LFSR** là gì? * **[LFSR](https://en.wikipedia.org/wiki/Linear-feedback_shift_register)** (~Linear Feedback Shift Register~) là một loại mạch điện tử đặc biệt được sử dụng trong các ứng dụng như mã hóa, tạo số ngẫu nhiên, và kiểm tra lỗi. LFSR là một thanh ghi dịch mà trong đó đầu vào của mỗi bit được xác định bởi một hàm tuyến tính của các bit khác trong thanh ghi. * **Cấu trúc cơ bản của LFSR:** Thanh ghi dịch (Shift Register): Đây là một dãy các bit có thể dịch sang phải hoặc trái. Hàm phản hồi tuyến tính (Linear Feedback): Là hàm toán học xác định bit mới sẽ được thêm vào thanh ghi sau mỗi lần dịch. Hàm này thường là phép XOR của một số bit trong thanh ghi. * **Hoạt động của LFSR:** 1. Khởi tạo: LFSR được khởi tạo với một giá trị ban đầu, thường gọi là "seed". 2. Dịch: Tại mỗi bước, toàn bộ các bit trong thanh ghi dịch sang một vị trí. 3. Phản hồi: Bit mới nhất được tạo ra bằng cách thực hiện phép XOR trên một số bit trong thanh ghi (theo định nghĩa của hàm phản hồi). 4. Chu kỳ: LFSR tiếp tục dịch và tạo bit mới cho đến khi trở về giá trị ban đầu hoặc đạt đến một trạng thái nào đó, tạo thành một chu kỳ. * **Ứng dụng:** Mã hóa: LFSR được sử dụng trong mã hóa dòng (stream cipher) để tạo ra chuỗi bit giả ngẫu nhiên. Tạo số ngẫu nhiên: Do tính chất chu kỳ và khả năng tạo ra chuỗi bit có vẻ ngẫu nhiên, LFSR thường được sử dụng trong việc tạo số giả ngẫu nhiên. Kiểm tra lỗi: LFSR cũng được sử dụng trong các mạch kiểm tra lỗi như CRC (Cyclic Redundancy Check). * **Ví dụ**: ```py Cho seed = 01101001 Ta sẽ chọn 3 vị trí trong seed trên: Vị trí thứ 2, 5, và 7. Những vị trí này được gọi là tap. Như vậy, rõ ràng output sẽ phụ thuộc vào tap. Ta XOR những bit của seed ở những tap: seed[2] xor seed[5] xor seed[7] = 1 xor 1 xor 0 = 0 Sau đó ta đưa bit 0 này lên đầu seed, bỏ đi bit cuối. Đây là output của chúng ta : 00110100 Ta lại có thể tiếp tục thực hiện thuật toán nếu ta không ưng ý với output. ``` * Đọc thêm tại : https://codelearn.io/sharing/stream-cipher-lfsr https://www.youtube.com/watch?v=Ks1pw1X22y4 https://www.youtube.com/watch?v=SVyTSfeO2do ### Giải. * Với **LFSR** của bài này, chia làm 2 phần: * 1 là `Combined generators` hay `linear`: tính toán trên 1 phương trình tuyến tính nào đó.![image](https://hackmd.io/_uploads/BkIGJgqqR.png) * 2 là `Fillter Generator`: tính toán trên 1 phương trình không tuyến tính, hay là các phép toán Boolean ![image](https://hackmd.io/_uploads/SkCvfy95C.png) * Để giải quyết bài này thì dùng [Fast Correlation Attack](https://en.wikipedia.org/wiki/Correlation_attack) * Đọc thêm về nó tại [đây](https://iacr.org/archive/fse2011/67330055/67330055.pdf) ![image](https://hackmd.io/_uploads/SkCvfy95C.png) * Dựa vào đoạn code này thì mình đi xây dựng bảng chân trị và tìm dạng chuẩn tắc đại số của nó. * Code gen bảng chân trị: ```py from Crypto.Util.number import * from pwn import * from gmpy2 import * import math from tqdm import tqdm from sympy.ntheory.modular import crt from sympy.ntheory.residue_ntheory import discrete_log import secrets import os import secrets from hashlib import sha256 def bit(x,y,z,w): return ( sha256(str((3 * x + 1 * y + 4 * z + 2 * w + 3142)).encode()).digest()[0] & 1 ) print("-"*45) print("| x | y | z | w | f(x,y,z,w)|") for x in range(0,2): for y in range(0,2): for z in range(0,2): for w in range(0,2): print("| ",x," | ",y," | ",z," | ",w," | ",bit(x,y,z,w)," |") print("-"*45) ``` * Bảng chân trị: | x | y | z | w | f(x,y,z,w) | |:-------- |:--------:|:--------:|:--------:| --------:| | 0 | 0 | 0 | 0 | 0 | | 0 | 0 | 0 | 1 | 0 | | 0 | 0 | 1 | 0 | 1 | | 0 | 0 | 1 | 1 | 1 | | 0 | 1 | 0 | 0 | 1 | | 0 | 1 | 0 | 1 | 0 | | 0 | 1 | 1 | 0 | 0 | | 0 | 1 | 1 | 1 | 1 | | 1 | 0 | 0 | 0 | 0 | | 1 | 0 | 0 | 1 | 0 | | 1 | 0 | 1 | 0 | 1 | | 1 | 0 | 1 | 1 | 0 | | 1 | 1 | 0 | 0 | 1 | | 1 | 1 | 0 | 1 | 1 | | 1 | 1 | 1 | 0 | 1 | | 1 | 1 | 1 | 1 | 0 | * Dạng chuẩn tắc đại số : $f(x,y,z,w)=xyz+xyw+xzw+yw+y+z$ * Dựa vào bảng chân trị trên , ta thấy xác suất để $f(a) = a$ cho 4 giá trị là: * $Probability (x) = 0,5$ * $Probability (y) = 0,625$ * $Probability (z) = 0,625$ * $Probability (w) = 0,375$ * Với **Fast Correlation Attack** thì việc recover lại từng phần tử sẽ khả quan khi $Prob>0,5$. $Prob<=0,5$ thì hên xui. Vậy tức là ở bài này thì ra sẽ recover được $y,z$ hay là $key_2,key_3$ trước. * Đối với [paper này](https://iacr.org/archive/fse2011/67330055/67330055.pdf) thì thuật toán `Fast Correlation Attack` sẽ tính toán giá trị $p*$ gọi là xác suất đúng tại từng vị trí, rồi làm theo 2 thuật toán theo paper trên là **Algorithm A** và **Algorithm B**. * **Algorithm B**: * 1. Tính $p_i*$ với mỗi $keystream_i$ tương ứng dựa trên số lượng phương trình thỏa mãn. * 2. Đảo ngược tất cả các $keystream_i$ nếu $p_i*$ < $p_{thr}$. Với $p_{thr}$ ở một ngưỡng nhất định nào đó. * 3. Dừng lại tới khi hệ phương trình tuyến tính của mình giải được. * Sau khi tìm được $key_2,key_3$ thì hãy xem bảng chân trị khi $y,z = 1$. * | x | y | z | w | f(x,y,z,w) | |:---|:---:|:---:|:---:|-----------:| | 0 | 1 | 1 | 0 | 0 | | 0 | 1 | 1 | 1 | 1 | | 1 | 1 | 1 | 0 | 1 | | 1 | 1 | 1 | 1 | 0 | * Để lại cột $x,w$: * | x | w | f(x,w) | |:---|:---:|---:| | 0 | 0 | 0 | | 0 | 1 | 1 | | 1 | 0 | 1 | | 1 | 1 | 0 | * Bây giờ dạng chuẩn tắc đại số $f(x,w) = x + w$ . * $x,w$ hay là $key_1,key_4$ tìm giống như trên. * **Script**: ```py from sage.all import * from sage.matrix.berlekamp_massey import berlekamp_massey import secrets, random, sys from hashlib import sha256 from sage.crypto.boolean_function import BooleanFunction from functools import lru_cache from tqdm import tqdm, trange from chall import MASK1, MASK2, MASK3, MASK4, LFSR, Cipher from binteger import Bin F2 = GF(2) PR = PolynomialRing(F2, "x") x = PR.gen() output_file = "output.txt" if len(sys.argv) < 2 else sys.argv[1] stream = Bin(bytes.fromhex("")).list flag_ct = Bin(bytes.fromhex("16c63370ac3860ec7eb12f9ec357d462f8513ee887cd86481b521b2bd7995d8abecd595e2ef6fc554cb04d813848b19c06290f0818274303842e68fdc280f1fec612826f")).list m = len(stream) def mask_to_poly(mask, n): return PR(list(map(int, f"{mask:0{n}b}"[::-1]))) + x**n def poly_to_eq(poly): return [i for i, v in enumerate(poly) if v] def poly_to_mask(poly): return int(poly.change_ring(ZZ)(2) - 2 ** poly.degree()) def vec_to_state(v): return int("".join(map(str, v[::-1])), 2) @lru_cache def S(p, t): if t == 1: return p return p * S(p, t - 1) + (1 - p) * (1 - S(p, t - 1)) def find_square_eqs(eq, length): # find related equations by squaring # i.e. a[k]=a[k+3]+a[k+4] -> a[k]=a[k+6]+a[k+8] assert eq[0] == 0, "eq must start with 0 (constant term)" eqs = [eq] cur_eq = eq while True: if cur_eq[-1] * 2 >= length: break squared_eq = [2 * x for x in cur_eq] eqs.append(squared_eq) cur_eq = squared_eq return eqs def build_equations(eqs, length): # given a list of base equations, build all possible equations by shifting # and return a list of related equations (by index) for each position pos_eqs = [[] for _ in range(length)] new_eqs = [] for eq in tqdm(eqs, "Build equations"): assert eq[0] == 0, "eq must start with 0 (constant term)" for shift in range(length - max(eq)): eq_index = len(new_eqs) new_eqs.append(eq) for pos in eq: pos_eqs[pos].append(eq_index) eq = [x + 1 for x in eq] return new_eqs, pos_eqs def p_star_fn(p, m, h, s): p1 = p * s**h * (1 - s) ** (m - h) p2 = (1 - p) * s ** (m - h) * (1 - s) ** h return p1 / (p1 + p2) def find_candidates(eqs, pos_eqs, stream, p_corr): # find candidate positions for noise estimation # given equations and related equations for each position # as well as the stream and the correlation probability length = len(stream) t = len(eqs[0]) s = S(p_corr, t) candidates = [] # list of (p_star, pos) for pos in trange(length, desc="Find candidates"): h = 0 # number of satisfied equations at position pos for eq_index in pos_eqs[pos]: eq = eqs[eq_index] tmp = 0 for i in eq: tmp ^= stream[i] h += tmp == 0 m = len(pos_eqs[pos]) p1 = p_corr * s**h * (1 - s) ** (m - h) p2 = (1 - p_corr) * s ** (m - h) * (1 - s) ** h p_star = p1 / (p1 + p2) candidates.append((p_star, pos)) candidates.sort(reverse=True) return candidates def get_linsys(feedback_poly, length): n = feedback_poly.degree() M = companion_matrix(feedback_poly, "bottom") # 1 .... # 1... #.....1 # a1 a2 a3 .. Mn = M**n rows = [] I = matrix.identity(n) for i in trange(length // n + 1, desc="Get linear system"): rows.extend(I.rows()) I *= Mn return rows def take_linear_system(linsys, candidates, stream, to_take): mat = matrix(GF(2), [linsys[pos] for _, pos in candidates[:to_take]]) target = [] for p_star, pos in candidates[:to_take]: target.append(stream[pos]) return mat, vector(GF(2), target) def solve_fca(feedback_poly, eq, prob, stream): stream = stream[:] # copy n = feedback_poly.degree() m = len(stream) t = len(eq) print(f"{S(prob, t) = }") eqs = find_square_eqs(eq, m) print(eqs) eqs, pos_eqs = build_equations(eqs, m) linsys = get_linsys(feedback_poly, m) candidates = find_candidates(eqs, pos_eqs, stream, prob) for it in range(100): p_thr = candidates[-m // 32][0] for p_star, pos in candidates: if p_star <= p_thr: stream[pos] = 1 - stream[pos] candidates = find_candidates(eqs, pos_eqs, stream, prob) if it >= 5: mat, target = take_linear_system(linsys, candidates, stream, 2 * n) try: return mat.solve_right(target) except ValueError: continue f1 = mask_to_poly(MASK1, 128) f2 = mask_to_poly(MASK2, 128) f3 = mask_to_poly(MASK3, 128) f4 = mask_to_poly(MASK4, 128) g2 = x**612 + x**421 + 1 g3 = x**518 + x**475 + 1 assert g2 % f2 == 0 assert g3 % f3 == 0 key2 = solve_fca(f2, poly_to_eq(g2), 5 / 8, stream) key3 = solve_fca(f3, poly_to_eq(g3), 5 / 8, stream) print(key2 , key3) k2 = vec_to_state(key2) k3 = vec_to_state(key3) print(f"{k2 = :#x}") print(f"{k3 = :#x}") lfsr2 = LFSR(128, k2, MASK2) lfsr3 = LFSR(128, k3, MASK3) # 4x of the original stream2 = [lfsr2() for _ in range(m)] stream3 = [lfsr3() for _ in range(m)] print( "correlation stream ~ stream2", len([1 for x, y in zip(stream, stream2) if x != y]) / m, ) # 3/8 print( "correlation stream ~ stream3", len([1 for x, y in zip(stream, stream3) if x != y]) / m, ) # 3/8 # when y == z == 1, the output is x ^ w, which is linear # so we a treat it as a 256-bit LFSR lfsr1tmp = LFSR(128, 48763, MASK1) lfsr4tmp = LFSR(128, 48763, MASK4) def combined(): x = lfsr1tmp() ^ lfsr1tmp() ^ lfsr1tmp() w = lfsr4tmp() ^ lfsr4tmp() return x ^ w f1_cube = (companion_matrix(f1, "bottom") ** 3).charpoly() f14 = berlekamp_massey([F2(combined()) for _ in range(2048)]) assert f14 == f1_cube * f4 linsys_14 = get_linsys(f14, m) lhs = [] rhs = [] for i in range(m): s, s2, s3 = stream[i], stream2[i], stream3[i] if s2 == s3 == 1: lhs.append(linsys_14[i]) rhs.append(s) if len(lhs) >= 256 + 10: break key14 = matrix(F2, lhs).solve_right(vector(F2, rhs)) mask14 = poly_to_mask(f14) k14 = vec_to_state(key14) print(f"{k14 = :#x}") lfsr14 = LFSR(256, k14, mask14) stream14 = [lfsr14() for _ in range(m)] for i in range(m): s, s2, s3, s14 = stream[i], stream2[i], stream3[i], stream14[i] if s2 == s3 == 1: assert s14 == s, "?????" # then solve a linear system to get the initial states of LFSR1 and LFSR4 from their XOR M1 = companion_matrix(f1_cube, "bottom") M4 = companion_matrix(f4, "bottom") T = F2**256 s1_0_sym = matrix(T.gens()[:128]) s4_0_sym = matrix(T.gens()[128:]) s1_1_sym = M1**128 * s1_0_sym s4_1_sym = M4**128 * s4_0_sym sol = ( (s1_0_sym + s4_0_sym) .stack(s1_1_sym + s4_1_sym) .solve_right(vector(F2, stream14[:256])) ) key1 = list(sol[:128]) key4 = list(sol[128:]) k1 = vec_to_state(key1) k4 = vec_to_state(key4) print(f"{k1 = :#x}") print(f"{k4 = :#x}") lfsr1 = LFSR(128, k1, poly_to_mask(f1_cube)) lfsr4 = LFSR(128, k4, MASK4) stream1 = [lfsr1() for _ in range(m)] stream4 = [lfsr4() for _ in range(m)] def mix(x, y, z, w): return sha256(str((3 * x + 1 * y + 4 * z + 2 * w + 3142)).encode()).digest()[0] & 1 rec = [mix(x, y, z, w) for x, y, z, w in zip(stream1, stream2, stream3, stream4)] assert rec == stream for i in range(len(flag_ct)): flag_ct[i] ^= mix(lfsr1(), lfsr2(), lfsr3(), lfsr4()) print(Bin(flag_ct).bytes) # hitcon{larger_states_is_still_no_match_of_fast_correlation_attacks!} ```