Paradoxul lui Simpson apare atunci când două sau mai multe seturi de date prezintă o anumită relație, dar această relație dispare atunci când datele sunt combinate. Acest fenomen are loc atunci când proporțiile elementelor sunt diferite în cele două seturi de date, iar combinarea acestora conduce la rezultate greșite. Pentru a evita această problemă, este necesar ca analiza datelor să fie făcută separat pentru fiecare set de date.