LLM은 올바른 코드를 작성하지 않는다. 그럴듯한 코드를 작성할 뿐이다.

개요

LLM(대형 언어 모델)이 생성한 코드는 컴파일되고, 테스트를 통과하고, 올바르게 보이더라도 근본적으로 잘못되었을 수 있다는 것을 실제 사례를 통해 분석한 글.

SQLite에서 id INTEGER PRIMARY KEY는 내부 rowid의 별칭 → WHERE id = 5는 O(log n) B-트리 탐색으로 처리됨
SQLite 원본의 where.c에서 iColumn == pIdx->pTable->iPKey이면 XN_ROWID로 변환 → SeekRowid 실행
Rust 재구현의 is_rowid_ref() 함수는 단 세 가지 문자열만 인식:
- "rowid", "_rowid_", "oid"
id INTEGER PRIMARY KEY로 선언된 컬럼은 내부적으로 is_ipk: true로 표시되어 있어도 인식되지 않음
결과: 모든 WHERE id = N 쿼리가 전체 테이블 풀스캔(codegen_select_full_scan())으로 처리됨
100개 행 × 100번 조회 = 10,000번 행 비교 (정상이라면 약 700번 B-트리 탐색)
O(n²) vs O(n log n) → 20,000배 차이 설명됨

각각은 "합리적인" 선택처럼 보이지만 합쳐지면 치명적:

검열관 메모 (3)

후 검열관 메모를 작성할 수 있습니다.

내용 요약 추가

코드를 신경안쓰면, 베지어 커브를 중복 구현한다던가..
성능을 똥망으로 만든다던가 하는 현상이 생기는것 같음. (지적하니 수정함)

마꾸루1개월 전

음..

캐시 히트 시에도 AST 클론	SQL 파싱은 캐시되지만 매 `sqlite3_exec()` 호출마다 AST를 `.clone()` 후 VDBE 바이트코드 재컴파일
읽기 시마다 4KB 힙 할당	페이지 캐시가 `.to_vec()`으로 데이터 반환 → 캐시 히트 시에도 새 할당 및 복사 발생 (SQLite는 핀된 캐시 메모리 직접 포인터 반환)
매 자동커밋마다 스키마 리로드	커밋 카운터 변경 시 `reload_memdb_from_pager()` 호출 → sqlite_master B-트리 순회 + 모든 CREATE TABLE 재파싱
핫패스에서의 즉시 포맷팅	`statement_sql.to_string()`이 가드 체크 전에 무조건 실행됨
명령문마다 새 객체 생성	`SimpleTransaction`, `VdbeProgram`, `MemDatabase`, `VdbeEngine` 매번 새로 할당/해제 (SQLite는 lookaside allocator로 재사용)