qa-duplicate-detection.sqlsql

-- Find duplicate customer emails
SELECT * FROM (
  SELECT
    customer_id,
    email,
    first_name,
    created_at,
    ROW_NUMBER() OVER(
      PARTITION BY email
      ORDER BY created_at ASC
    ) AS rn
  FROM customers
) ranked
WHERE rn > 1;
-- rn > 1 means these are the duplicates (not the original)

-- Find duplicate orders (same customer, same amount, same date)
-- Possible double-submit bug
SELECT * FROM (
  SELECT
    order_id,
    customer_id,
    total_amount,
    order_date,
    ROW_NUMBER() OVER(
      PARTITION BY customer_id, total_amount, order_date
      ORDER BY order_id ASC
    ) AS rn
  FROM orders
) ranked
WHERE rn > 1;

qa-report-verification.sqlsql

-- Verify monthly revenue report
-- The dashboard shows revenue, order count, avg order value per month
SELECT
  DATE_TRUNC('month', order_date) AS month,
  COUNT(*) AS total_orders,
  SUM(total_amount) AS monthly_revenue,
  ROUND(AVG(total_amount), 2) AS avg_order_value,
  MIN(total_amount) AS min_order,
  MAX(total_amount) AS max_order
FROM orders
WHERE status IN ('completed', 'delivered')
GROUP BY DATE_TRUNC('month', order_date)
ORDER BY month;

-- Verify "Top 5 Customers" widget on admin dashboard
SELECT
  c.first_name,
  c.last_name,
  COUNT(o.order_id) AS total_orders,
  SUM(o.total_amount) AS lifetime_value
FROM customers c
INNER JOIN orders o ON c.customer_id = o.customer_id
WHERE o.status = 'completed'
GROUP BY c.customer_id, c.first_name, c.last_name
ORDER BY lifetime_value DESC
LIMIT 5;

qa-trend-analysis.sqlsql

-- Week-over-week comparison to spot sudden drops
SELECT
  week_start,
  weekly_orders,
  prev_week_orders,
  weekly_orders - prev_week_orders AS change,
  CASE
    WHEN prev_week_orders > 0 THEN
      ROUND((weekly_orders - prev_week_orders) * 100.0 / prev_week_orders, 1)
    ELSE NULL
  END AS pct_change
FROM (
  SELECT
    DATE_TRUNC('week', order_date) AS week_start,
    COUNT(*) AS weekly_orders,
    LAG(COUNT(*)) OVER(ORDER BY DATE_TRUNC('week', order_date)) AS prev_week_orders
  FROM orders
  GROUP BY DATE_TRUNC('week', order_date)
) weekly_stats
ORDER BY week_start DESC;

-- Detect hours with zero orders (possible system outage)
SELECT gs.hour_slot
FROM generate_series(
  DATE_TRUNC('day', CURRENT_DATE - INTERVAL '1 day'),
  DATE_TRUNC('day', CURRENT_DATE) - INTERVAL '1 hour',
  INTERVAL '1 hour'
) AS gs(hour_slot)
LEFT JOIN orders o ON DATE_TRUNC('hour', o.order_date) = gs.hour_slot
WHERE o.order_id IS NULL;

qa-total-mismatch.sqlsql

-- Orders where stored total does not match calculated sum of line items
SELECT
  o.order_id,
  o.total_amount AS stored_total,
  SUM(oi.quantity * oi.unit_price) AS calculated_total,
  o.total_amount - SUM(oi.quantity * oi.unit_price) AS difference
FROM orders o
INNER JOIN order_items oi ON o.order_id = oi.order_id
GROUP BY o.order_id, o.total_amount
HAVING o.total_amount != SUM(oi.quantity * oi.unit_price);

-- This is a classic bug: rounding errors, missed discount logic,
-- or stale cached totals after item updates

Real QA Scenarios — Duplicate Detection, Trend Analysis, Report Verification

Scenario 1: Duplicate Detection with ROW_NUMBER

Scenario 2: Report Verification — Dashboard Numbers

Scenario 3: Data Trend Analysis — Spot the Break

Scenario 4: Order Total Mismatch

QA Data Validation Workflow

Real QA Scenarios — Duplicate Detection, Trend Analysis, Report Verification

Scenario 1: Duplicate Detection with ROW_NUMBER

Scenario 2: Report Verification — Dashboard Numbers

Scenario 3: Data Trend Analysis — Spot the Break

Scenario 4: Order Total Mismatch

QA Data Validation Workflow