# HITCON CTF 2024 Writeup
## Hyper512
* Source:
```py
import secrets
from hashlib import sha256
MASK1 = 0x6D6AC812F52A212D5A0B9F3117801FD5
MASK2 = 0xD736F40E0DED96B603F62CBE394FEF3D
MASK3 = 0xA55746EF3955B07595ABC13B9EBEED6B
MASK4 = 0xD670201BAC7515352A273372B2A95B23
class LFSR:
def __init__(self, n, key, mask):
self.n = n
self.state = key & ((1 << n) - 1)
self.mask = mask
def __call__(self):
b = self.state & 1
self.state = (self.state >> 1) | (
((self.state & self.mask).bit_count() & 1) << (self.n - 1)
)
return b
class Cipher:
def __init__(self, key: int):
self.lfsr1 = LFSR(128, key, MASK1)
key >>= 128
self.lfsr2 = LFSR(128, key, MASK2)
key >>= 128
self.lfsr3 = LFSR(128, key, MASK3)
key >>= 128
self.lfsr4 = LFSR(128, key, MASK4)
def bit(self):
x = self.lfsr1() ^ self.lfsr1() ^ self.lfsr1()
y = self.lfsr2()
z = self.lfsr3() ^ self.lfsr3() ^ self.lfsr3() ^ self.lfsr3()
w = self.lfsr4() ^ self.lfsr4()
return (
sha256(str((3 * x + 1 * y + 4 * z + 2 * w + 3142)).encode()).digest()[0] & 1
)
def stream(self):
while True:
b = 0
for i in reversed(range(8)):
b |= self.bit() << i
yield b
def encrypt(self, pt: bytes):
return bytes([x ^ y for x, y in zip(pt, self.stream())])
def decrypt(self, ct: bytes):
return self.encrypt(ct)
if __name__ == "__main__":
with open("flag.txt", "rb") as f:
flag = f.read().strip()
key = secrets.randbits(512)
cipher = Cipher(key)
gift = cipher.encrypt(b"\x00" * 2**12)
print(gift.hex())
ct = cipher.encrypt(flag)
print(ct.hex())
# 
# 16c63370ac3860ec7eb12f9ec357d462f8513ee887cd86481b521b2bd7995d8abecd595e2ef6fc554cb04d813848b19c06290f0818274303842e68fdc280f1fec612826f
```
### **LFSR** là gì?
* **[LFSR](https://en.wikipedia.org/wiki/Linear-feedback_shift_register)** (~Linear Feedback Shift Register~) là một loại mạch điện tử đặc biệt được sử dụng trong các ứng dụng như mã hóa, tạo số ngẫu nhiên, và kiểm tra lỗi. LFSR là một thanh ghi dịch mà trong đó đầu vào của mỗi bit được xác định bởi một hàm tuyến tính của các bit khác trong thanh ghi.
* **Cấu trúc cơ bản của LFSR:**
Thanh ghi dịch (Shift Register): Đây là một dãy các bit có thể dịch sang phải hoặc trái.
Hàm phản hồi tuyến tính (Linear Feedback): Là hàm toán học xác định bit mới sẽ được thêm vào thanh ghi sau mỗi lần dịch. Hàm này thường là phép XOR của một số bit trong thanh ghi.
* **Hoạt động của LFSR:**
1. Khởi tạo: LFSR được khởi tạo với một giá trị ban đầu, thường gọi là "seed".
2. Dịch: Tại mỗi bước, toàn bộ các bit trong thanh ghi dịch sang một vị trí.
3. Phản hồi: Bit mới nhất được tạo ra bằng cách thực hiện phép XOR trên một số bit trong thanh ghi (theo định nghĩa của hàm phản hồi).
4. Chu kỳ: LFSR tiếp tục dịch và tạo bit mới cho đến khi trở về giá trị ban đầu hoặc đạt đến một trạng thái nào đó, tạo thành một chu kỳ.
* **Ứng dụng:**
Mã hóa: LFSR được sử dụng trong mã hóa dòng (stream cipher) để tạo ra chuỗi bit giả ngẫu nhiên.
Tạo số ngẫu nhiên: Do tính chất chu kỳ và khả năng tạo ra chuỗi bit có vẻ ngẫu nhiên, LFSR thường được sử dụng trong việc tạo số giả ngẫu nhiên.
Kiểm tra lỗi: LFSR cũng được sử dụng trong các mạch kiểm tra lỗi như CRC (Cyclic Redundancy Check).
* **Ví dụ**:
```py
Cho seed = 01101001
Ta sẽ chọn 3 vị trí trong seed trên: Vị trí thứ 2, 5, và 7.
Những vị trí này được gọi là tap. Như vậy, rõ ràng output sẽ phụ thuộc vào tap.
Ta XOR những bit của seed ở những tap:
seed[2] xor seed[5] xor seed[7] = 1 xor 1 xor 0 = 0
Sau đó ta đưa bit 0 này lên đầu seed, bỏ đi bit cuối. Đây là output
của chúng ta : 00110100
Ta lại có thể tiếp tục thực hiện thuật toán nếu ta không ưng ý với output.
```
* Đọc thêm tại :
https://codelearn.io/sharing/stream-cipher-lfsr
https://www.youtube.com/watch?v=Ks1pw1X22y4
https://www.youtube.com/watch?v=SVyTSfeO2do
### Giải.
* Với **LFSR** của bài này, chia làm 2 phần:
* 1 là `Combined generators` hay `linear`: tính toán trên 1 phương trình tuyến tính nào đó.
* 2 là `Fillter Generator`: tính toán trên 1 phương trình không tuyến tính, hay là các phép toán Boolean 
* Để giải quyết bài này thì dùng [Fast Correlation Attack](https://en.wikipedia.org/wiki/Correlation_attack)
* Đọc thêm về nó tại [đây](https://iacr.org/archive/fse2011/67330055/67330055.pdf)

* Dựa vào đoạn code này thì mình đi xây dựng bảng chân trị và tìm dạng chuẩn tắc đại số của nó.
* Code gen bảng chân trị:
```py
from Crypto.Util.number import *
from pwn import *
from gmpy2 import *
import math
from tqdm import tqdm
from sympy.ntheory.modular import crt
from sympy.ntheory.residue_ntheory import discrete_log
import secrets
import os
import secrets
from hashlib import sha256
def bit(x,y,z,w):
return (
sha256(str((3 * x + 1 * y + 4 * z + 2 * w + 3142)).encode()).digest()[0] & 1
)
print("-"*45)
print("| x | y | z | w | f(x,y,z,w)|")
for x in range(0,2):
for y in range(0,2):
for z in range(0,2):
for w in range(0,2):
print("| ",x," | ",y," | ",z," | ",w," | ",bit(x,y,z,w)," |")
print("-"*45)
```
* Bảng chân trị:
| x | y | z | w | f(x,y,z,w) |
|:-------- |:--------:|:--------:|:--------:| --------:|
| 0 | 0 | 0 | 0 | 0 |
| 0 | 0 | 0 | 1 | 0 |
| 0 | 0 | 1 | 0 | 1 |
| 0 | 0 | 1 | 1 | 1 |
| 0 | 1 | 0 | 0 | 1 |
| 0 | 1 | 0 | 1 | 0 |
| 0 | 1 | 1 | 0 | 0 |
| 0 | 1 | 1 | 1 | 1 |
| 1 | 0 | 0 | 0 | 0 |
| 1 | 0 | 0 | 1 | 0 |
| 1 | 0 | 1 | 0 | 1 |
| 1 | 0 | 1 | 1 | 0 |
| 1 | 1 | 0 | 0 | 1 |
| 1 | 1 | 0 | 1 | 1 |
| 1 | 1 | 1 | 0 | 1 |
| 1 | 1 | 1 | 1 | 0 |
* Dạng chuẩn tắc đại số : $f(x,y,z,w)=xyz+xyw+xzw+yw+y+z$
* Dựa vào bảng chân trị trên , ta thấy xác suất để $f(a) = a$ cho 4 giá trị là:
* $Probability (x) = 0,5$
* $Probability (y) = 0,625$
* $Probability (z) = 0,625$
* $Probability (w) = 0,375$
* Với **Fast Correlation Attack** thì việc recover lại từng phần tử sẽ khả quan khi $Prob>0,5$. $Prob<=0,5$ thì hên xui. Vậy tức là ở bài này thì ra sẽ recover được $y,z$ hay là $key_2,key_3$ trước.
* Đối với [paper này](https://iacr.org/archive/fse2011/67330055/67330055.pdf) thì thuật toán `Fast Correlation Attack` sẽ tính toán giá trị $p*$ gọi là xác suất đúng tại từng vị trí, rồi làm theo 2 thuật toán theo paper trên là **Algorithm A** và **Algorithm B**.
* **Algorithm B**:
* 1. Tính $p_i*$ với mỗi $keystream_i$ tương ứng dựa trên số lượng phương trình thỏa mãn.
* 2. Đảo ngược tất cả các $keystream_i$ nếu $p_i*$ < $p_{thr}$. Với $p_{thr}$ ở một ngưỡng nhất định nào đó.
* 3. Dừng lại tới khi hệ phương trình tuyến tính của mình giải được.
* Sau khi tìm được $key_2,key_3$ thì hãy xem bảng chân trị khi $y,z = 1$.
*
| x | y | z | w | f(x,y,z,w) |
|:---|:---:|:---:|:---:|-----------:|
| 0 | 1 | 1 | 0 | 0 |
| 0 | 1 | 1 | 1 | 1 |
| 1 | 1 | 1 | 0 | 1 |
| 1 | 1 | 1 | 1 | 0 |
* Để lại cột $x,w$:
*
| x | w | f(x,w) |
|:---|:---:|---:|
| 0 | 0 | 0 |
| 0 | 1 | 1 |
| 1 | 0 | 1 |
| 1 | 1 | 0 |
* Bây giờ dạng chuẩn tắc đại số $f(x,w) = x + w$ .
* $x,w$ hay là $key_1,key_4$ tìm giống như trên.
* **Script**:
```py
from sage.all import *
from sage.matrix.berlekamp_massey import berlekamp_massey
import secrets, random, sys
from hashlib import sha256
from sage.crypto.boolean_function import BooleanFunction
from functools import lru_cache
from tqdm import tqdm, trange
from chall import MASK1, MASK2, MASK3, MASK4, LFSR, Cipher
from binteger import Bin
F2 = GF(2)
PR = PolynomialRing(F2, "x")
x = PR.gen()
output_file = "output.txt" if len(sys.argv) < 2 else sys.argv[1]
stream = Bin(bytes.fromhex("")).list
flag_ct = Bin(bytes.fromhex("16c63370ac3860ec7eb12f9ec357d462f8513ee887cd86481b521b2bd7995d8abecd595e2ef6fc554cb04d813848b19c06290f0818274303842e68fdc280f1fec612826f")).list
m = len(stream)
def mask_to_poly(mask, n):
return PR(list(map(int, f"{mask:0{n}b}"[::-1]))) + x**n
def poly_to_eq(poly):
return [i for i, v in enumerate(poly) if v]
def poly_to_mask(poly):
return int(poly.change_ring(ZZ)(2) - 2 ** poly.degree())
def vec_to_state(v):
return int("".join(map(str, v[::-1])), 2)
@lru_cache
def S(p, t):
if t == 1:
return p
return p * S(p, t - 1) + (1 - p) * (1 - S(p, t - 1))
def find_square_eqs(eq, length):
# find related equations by squaring
# i.e. a[k]=a[k+3]+a[k+4] -> a[k]=a[k+6]+a[k+8]
assert eq[0] == 0, "eq must start with 0 (constant term)"
eqs = [eq]
cur_eq = eq
while True:
if cur_eq[-1] * 2 >= length:
break
squared_eq = [2 * x for x in cur_eq]
eqs.append(squared_eq)
cur_eq = squared_eq
return eqs
def build_equations(eqs, length):
# given a list of base equations, build all possible equations by shifting
# and return a list of related equations (by index) for each position
pos_eqs = [[] for _ in range(length)]
new_eqs = []
for eq in tqdm(eqs, "Build equations"):
assert eq[0] == 0, "eq must start with 0 (constant term)"
for shift in range(length - max(eq)):
eq_index = len(new_eqs)
new_eqs.append(eq)
for pos in eq:
pos_eqs[pos].append(eq_index)
eq = [x + 1 for x in eq]
return new_eqs, pos_eqs
def p_star_fn(p, m, h, s):
p1 = p * s**h * (1 - s) ** (m - h)
p2 = (1 - p) * s ** (m - h) * (1 - s) ** h
return p1 / (p1 + p2)
def find_candidates(eqs, pos_eqs, stream, p_corr):
# find candidate positions for noise estimation
# given equations and related equations for each position
# as well as the stream and the correlation probability
length = len(stream)
t = len(eqs[0])
s = S(p_corr, t)
candidates = [] # list of (p_star, pos)
for pos in trange(length, desc="Find candidates"):
h = 0 # number of satisfied equations at position pos
for eq_index in pos_eqs[pos]:
eq = eqs[eq_index]
tmp = 0
for i in eq:
tmp ^= stream[i]
h += tmp == 0
m = len(pos_eqs[pos])
p1 = p_corr * s**h * (1 - s) ** (m - h)
p2 = (1 - p_corr) * s ** (m - h) * (1 - s) ** h
p_star = p1 / (p1 + p2)
candidates.append((p_star, pos))
candidates.sort(reverse=True)
return candidates
def get_linsys(feedback_poly, length):
n = feedback_poly.degree()
M = companion_matrix(feedback_poly, "bottom")
# 1 ....
# 1...
#.....1
# a1 a2 a3 ..
Mn = M**n
rows = []
I = matrix.identity(n)
for i in trange(length // n + 1, desc="Get linear system"):
rows.extend(I.rows())
I *= Mn
return rows
def take_linear_system(linsys, candidates, stream, to_take):
mat = matrix(GF(2), [linsys[pos] for _, pos in candidates[:to_take]])
target = []
for p_star, pos in candidates[:to_take]:
target.append(stream[pos])
return mat, vector(GF(2), target)
def solve_fca(feedback_poly, eq, prob, stream):
stream = stream[:] # copy
n = feedback_poly.degree()
m = len(stream)
t = len(eq)
print(f"{S(prob, t) = }")
eqs = find_square_eqs(eq, m)
print(eqs)
eqs, pos_eqs = build_equations(eqs, m)
linsys = get_linsys(feedback_poly, m)
candidates = find_candidates(eqs, pos_eqs, stream, prob)
for it in range(100):
p_thr = candidates[-m // 32][0]
for p_star, pos in candidates:
if p_star <= p_thr:
stream[pos] = 1 - stream[pos]
candidates = find_candidates(eqs, pos_eqs, stream, prob)
if it >= 5:
mat, target = take_linear_system(linsys, candidates, stream, 2 * n)
try:
return mat.solve_right(target)
except ValueError:
continue
f1 = mask_to_poly(MASK1, 128)
f2 = mask_to_poly(MASK2, 128)
f3 = mask_to_poly(MASK3, 128)
f4 = mask_to_poly(MASK4, 128)
g2 = x**612 + x**421 + 1
g3 = x**518 + x**475 + 1
assert g2 % f2 == 0
assert g3 % f3 == 0
key2 = solve_fca(f2, poly_to_eq(g2), 5 / 8, stream)
key3 = solve_fca(f3, poly_to_eq(g3), 5 / 8, stream)
print(key2 , key3)
k2 = vec_to_state(key2)
k3 = vec_to_state(key3)
print(f"{k2 = :#x}")
print(f"{k3 = :#x}")
lfsr2 = LFSR(128, k2, MASK2)
lfsr3 = LFSR(128, k3, MASK3) # 4x of the original
stream2 = [lfsr2() for _ in range(m)]
stream3 = [lfsr3() for _ in range(m)]
print(
"correlation stream ~ stream2",
len([1 for x, y in zip(stream, stream2) if x != y]) / m,
) # 3/8
print(
"correlation stream ~ stream3",
len([1 for x, y in zip(stream, stream3) if x != y]) / m,
) # 3/8
# when y == z == 1, the output is x ^ w, which is linear
# so we a treat it as a 256-bit LFSR
lfsr1tmp = LFSR(128, 48763, MASK1)
lfsr4tmp = LFSR(128, 48763, MASK4)
def combined():
x = lfsr1tmp() ^ lfsr1tmp() ^ lfsr1tmp()
w = lfsr4tmp() ^ lfsr4tmp()
return x ^ w
f1_cube = (companion_matrix(f1, "bottom") ** 3).charpoly()
f14 = berlekamp_massey([F2(combined()) for _ in range(2048)])
assert f14 == f1_cube * f4
linsys_14 = get_linsys(f14, m)
lhs = []
rhs = []
for i in range(m):
s, s2, s3 = stream[i], stream2[i], stream3[i]
if s2 == s3 == 1:
lhs.append(linsys_14[i])
rhs.append(s)
if len(lhs) >= 256 + 10:
break
key14 = matrix(F2, lhs).solve_right(vector(F2, rhs))
mask14 = poly_to_mask(f14)
k14 = vec_to_state(key14)
print(f"{k14 = :#x}")
lfsr14 = LFSR(256, k14, mask14)
stream14 = [lfsr14() for _ in range(m)]
for i in range(m):
s, s2, s3, s14 = stream[i], stream2[i], stream3[i], stream14[i]
if s2 == s3 == 1:
assert s14 == s, "?????"
# then solve a linear system to get the initial states of LFSR1 and LFSR4 from their XOR
M1 = companion_matrix(f1_cube, "bottom")
M4 = companion_matrix(f4, "bottom")
T = F2**256
s1_0_sym = matrix(T.gens()[:128])
s4_0_sym = matrix(T.gens()[128:])
s1_1_sym = M1**128 * s1_0_sym
s4_1_sym = M4**128 * s4_0_sym
sol = (
(s1_0_sym + s4_0_sym)
.stack(s1_1_sym + s4_1_sym)
.solve_right(vector(F2, stream14[:256]))
)
key1 = list(sol[:128])
key4 = list(sol[128:])
k1 = vec_to_state(key1)
k4 = vec_to_state(key4)
print(f"{k1 = :#x}")
print(f"{k4 = :#x}")
lfsr1 = LFSR(128, k1, poly_to_mask(f1_cube))
lfsr4 = LFSR(128, k4, MASK4)
stream1 = [lfsr1() for _ in range(m)]
stream4 = [lfsr4() for _ in range(m)]
def mix(x, y, z, w):
return sha256(str((3 * x + 1 * y + 4 * z + 2 * w + 3142)).encode()).digest()[0] & 1
rec = [mix(x, y, z, w) for x, y, z, w in zip(stream1, stream2, stream3, stream4)]
assert rec == stream
for i in range(len(flag_ct)):
flag_ct[i] ^= mix(lfsr1(), lfsr2(), lfsr3(), lfsr4())
print(Bin(flag_ct).bytes)
# hitcon{larger_states_is_still_no_match_of_fast_correlation_attacks!}
```