model-research

rodin/model-research

Fork 0

Commit Graph

Author	SHA1	Message	Date
Rodin	8cfabfdc55	experiment #32 : testability analysis — new analytical lens Tested GPT-5, Opus, Sonnet on wash-sale-tracking.md spec. Opus found a genuine spec bug (trigger logic described backwards). Confirms pattern: GPT-5 for breadth, Opus for logic contradictions, Sonnet adds no value for systematic analytical tasks.	2026-05-06 10:09:05 -07:00

Author

SHA1

Message

Date

Rodin

8cfabfdc55

experiment #32 : testability analysis — new analytical lens

Tested GPT-5, Opus, Sonnet on wash-sale-tracking.md spec.
Opus found a genuine spec bug (trigger logic described backwards).
Confirms pattern: GPT-5 for breadth, Opus for logic contradictions,
Sonnet adds no value for systematic analytical tasks.

2026-05-06 10:09:05 -07:00

1 Commits