drm/i915: Slaughter the thundering i915_wait_request herd

[cascardo/linux.git] / drivers / gpu / drm / i915 / i915_irq.c
diff --git a/drivers/gpu/drm/i915/i915_irq.c b/drivers/gpu/drm/i915/i915_irq.c

index 3242a37..a11ab00 100644 (file)
--- a/drivers/gpu/drm/i915/i915_irq.c
+++ b/drivers/gpu/drm/i915/i915_irq.c
@@ -364,19 +364,7 @@ void gen6_enable_rps_interrupts(struct drm_i915_private *dev_priv)
  
  u32 gen6_sanitize_rps_pm_mask(struct drm_i915_private *dev_priv, u32 mask)
  {
-       /*
-        * SNB,IVB can while VLV,CHV may hard hang on looping batchbuffer
-        * if GEN6_PM_UP_EI_EXPIRED is masked.
-        *
-        * TODO: verify if this can be reproduced on VLV,CHV.
-        */
-       if (INTEL_INFO(dev_priv)->gen <= 7 && !IS_HASWELL(dev_priv))
-               mask &= ~GEN6_PM_RP_UP_EI_EXPIRED;
-
-       if (INTEL_INFO(dev_priv)->gen >= 8)
-               mask &= ~GEN8_PMINTR_REDIRECT_TO_NON_DISP;
-
-       return mask;
+       return (mask & ~dev_priv->rps.pm_intr_keep);
  }
  
  void gen6_disable_rps_interrupts(struct drm_i915_private *dev_priv)
@@ -600,7 +588,7 @@ i915_disable_pipestat(struct drm_i915_private *dev_priv, enum pipe pipe,
  
  /**
   * i915_enable_asle_pipestat - enable ASLE pipestat for OpRegion
- * @dev: drm device
+ * @dev_priv: i915 device private
   */
  static void i915_enable_asle_pipestat(struct drm_i915_private *dev_priv)
  {
@@ -988,13 +976,10 @@ static void ironlake_rps_change_irq_handler(struct drm_i915_private *dev_priv)
  
  static void notify_ring(struct intel_engine_cs *engine)
  {
-       if (!intel_engine_initialized(engine))
-               return;
-
-       trace_i915_gem_request_notify(engine);
-       engine->user_interrupts++;
-
-       wake_up_all(&engine->irq_queue);
+       if (intel_engine_wakeup(engine)) {
+               trace_i915_gem_request_notify(engine);
+               engine->user_interrupts++;
+       }
  }
  
  static void vlv_c0_read(struct drm_i915_private *dev_priv,
@@ -1075,7 +1060,7 @@ static bool any_waiters(struct drm_i915_private *dev_priv)
         struct intel_engine_cs *engine;
  
         for_each_engine(engine, dev_priv)
-               if (engine->irq_refcount)
+               if (intel_engine_has_waiter(engine))
                         return true;
  
         return false;
@@ -2500,11 +2485,8 @@ static irqreturn_t gen8_irq_handler(int irq, void *arg)
         return ret;
  }
  
-static void i915_error_wake_up(struct drm_i915_private *dev_priv,
-                              bool reset_completed)
+static void i915_error_wake_up(struct drm_i915_private *dev_priv)
  {
-       struct intel_engine_cs *engine;
-
         /*
          * Notify all waiters for GPU completion events that reset state has
          * been changed, and that they need to restart their wait after
@@ -2513,23 +2495,15 @@ static void i915_error_wake_up(struct drm_i915_private *dev_priv,
          */
  
         /* Wake up __wait_seqno, potentially holding dev->struct_mutex. */
-       for_each_engine(engine, dev_priv)
-               wake_up_all(&engine->irq_queue);
+       wake_up_all(&dev_priv->gpu_error.wait_queue);
  
         /* Wake up intel_crtc_wait_for_pending_flips, holding crtc->mutex. */
         wake_up_all(&dev_priv->pending_flip_queue);
-
-       /*
-        * Signal tasks blocked in i915_gem_wait_for_error that the pending
-        * reset state is cleared.
-        */
-       if (reset_completed)
-               wake_up_all(&dev_priv->gpu_error.reset_queue);
  }
  
  /**
   * i915_reset_and_wakeup - do process context error handling work
- * @dev: drm device
+ * @dev_priv: i915 device private
   *
   * Fire an error uevent so userspace can see that a hang or error
   * was detected.
@@ -2589,7 +2563,7 @@ static void i915_reset_and_wakeup(struct drm_i915_private *dev_priv)
                  * Note: The wake_up also serves as a memory barrier so that
                  * waiters see the update value of the reset counter atomic_t.
                  */
-               i915_error_wake_up(dev_priv, true);
+               wake_up_all(&dev_priv->gpu_error.reset_queue);
         }
  }
  
@@ -2686,13 +2660,14 @@ static void i915_report_and_clear_eir(struct drm_i915_private *dev_priv)
  
  /**
   * i915_handle_error - handle a gpu error
- * @dev: drm device
+ * @dev_priv: i915 device private
   * @engine_mask: mask representing engines that are hung
   * Do some basic checking of register state at error time and
   * dump it to the syslog.  Also call i915_capture_error_state() to make
   * sure we get a record and make it available in debugfs.  Fire a uevent
   * so userspace knows something bad happened (should trigger collection
   * of a ring dump etc.).
+ * @fmt: Error message format string
   */
  void i915_handle_error(struct drm_i915_private *dev_priv,
                        u32 engine_mask,
@@ -2725,7 +2700,7 @@ void i915_handle_error(struct drm_i915_private *dev_priv,
                  * ensure that the waiters see the updated value of the reset
                  * counter atomic_t.
                  */
-               i915_error_wake_up(dev_priv, false);
+               i915_error_wake_up(dev_priv);
         }
  
         i915_reset_and_wakeup(dev_priv);
@@ -3096,13 +3071,14 @@ static unsigned kick_waiters(struct intel_engine_cs *engine)
  
         if (engine->hangcheck.user_interrupts == user_interrupts &&
             !test_and_set_bit(engine->id, &i915->gpu_error.missed_irq_rings)) {
-               if (!(i915->gpu_error.test_irq_rings & intel_engine_flag(engine)))
+               if (!test_bit(engine->id, &i915->gpu_error.test_irq_rings))
                         DRM_ERROR("Hangcheck timer elapsed... %s idle\n",
                                   engine->name);
                 else
                         DRM_INFO("Fake missed irq on %s\n",
                                  engine->name);
-               wake_up_all(&engine->irq_queue);
+
+               intel_engine_enable_fake_irq(engine);
         }
  
         return user_interrupts;
@@ -3146,10 +3122,10 @@ static void i915_hangcheck_elapsed(struct work_struct *work)
         intel_uncore_arm_unclaimed_mmio_detection(dev_priv);
  
         for_each_engine_id(engine, dev_priv, id) {
+               bool busy = intel_engine_has_waiter(engine);
                 u64 acthd;
                 u32 seqno;
                 unsigned user_interrupts;
-               bool busy = true;
  
                 semaphore_clear_deadlocks(dev_priv);
  
@@ -3172,12 +3148,11 @@ static void i915_hangcheck_elapsed(struct work_struct *work)
                 if (engine->hangcheck.seqno == seqno) {
                         if (ring_idle(engine, seqno)) {
                                 engine->hangcheck.action = HANGCHECK_IDLE;
-                               if (waitqueue_active(&engine->irq_queue)) {
+                               if (busy) {
                                         /* Safeguard against driver failure */
                                         user_interrupts = kick_waiters(engine);
                                         engine->hangcheck.score += BUSY;
-                               } else
-                                       busy = false;
+                               }
                         } else {
                                 /* We always increment the hangcheck score
                                  * if the ring is busy and still processing
@@ -3251,31 +3226,14 @@ static void i915_hangcheck_elapsed(struct work_struct *work)
                 goto out;
         }
  
+       /* Reset timer in case GPU hangs without another request being added */
         if (busy_count)
-               /* Reset timer case chip hangs without another request
-                * being added */
                 i915_queue_hangcheck(dev_priv);
  
  out:
         ENABLE_RPM_WAKEREF_ASSERTS(dev_priv);
  }
  
-void i915_queue_hangcheck(struct drm_i915_private *dev_priv)
-{
-       struct i915_gpu_error *e = &dev_priv->gpu_error;
-
-       if (!i915.enable_hangcheck)
-               return;
-
-       /* Don't continually defer the hangcheck so that it is always run at
-        * least once after work has been scheduled on any ring. Otherwise,
-        * we will ignore a hung ring if a second ring is kept busy.
-        */
-
-       queue_delayed_work(e->hangcheck_wq, &e->hangcheck_work,
-                          round_jiffies_up_relative(DRM_I915_HANGCHECK_JIFFIES));
-}
-
  static void ibx_irq_reset(struct drm_device *dev)
  {
         struct drm_i915_private *dev_priv = dev->dev_private;
@@ -3797,6 +3755,7 @@ static void gen8_de_irq_postinstall(struct drm_i915_private *dev_priv)
         uint32_t de_pipe_enables;
         u32 de_port_masked = GEN8_AUX_CHANNEL_A;
         u32 de_port_enables;
+       u32 de_misc_masked = GEN8_DE_MISC_GSE;
         enum pipe pipe;
  
         if (INTEL_INFO(dev_priv)->gen >= 9) {
@@ -3832,6 +3791,7 @@ static void gen8_de_irq_postinstall(struct drm_i915_private *dev_priv)
                                           de_pipe_enables);
  
         GEN5_IRQ_INIT(GEN8_DE_PORT_, ~de_port_masked, de_port_enables);
+       GEN5_IRQ_INIT(GEN8_DE_MISC_, ~de_misc_masked, de_misc_masked);
  }
  
  static int gen8_irq_postinstall(struct drm_device *dev)
@@ -4576,6 +4536,20 @@ void intel_irq_init(struct drm_i915_private *dev_priv)
         else
                 dev_priv->pm_rps_events = GEN6_PM_RPS_EVENTS;
  
+       dev_priv->rps.pm_intr_keep = 0;
+
+       /*
+        * SNB,IVB can while VLV,CHV may hard hang on looping batchbuffer
+        * if GEN6_PM_UP_EI_EXPIRED is masked.
+        *
+        * TODO: verify if this can be reproduced on VLV,CHV.
+        */
+       if (INTEL_INFO(dev_priv)->gen <= 7 && !IS_HASWELL(dev_priv))
+               dev_priv->rps.pm_intr_keep |= GEN6_PM_RP_UP_EI_EXPIRED;
+
+       if (INTEL_INFO(dev_priv)->gen >= 8)
+               dev_priv->rps.pm_intr_keep |= GEN8_PMINTR_REDIRECT_TO_NON_DISP;
+
         INIT_DELAYED_WORK(&dev_priv->gpu_error.hangcheck_work,
                           i915_hangcheck_elapsed);