Merge tag 'powerpc-4.8-2' of git://git.kernel.org/pub/scm/linux/kernel/git/powerpc...
[cascardo/linux.git] / virt / kvm / arm / vgic / vgic-mmio.c
1 /*
2  * VGIC MMIO handling functions
3  *
4  * This program is free software; you can redistribute it and/or modify
5  * it under the terms of the GNU General Public License version 2 as
6  * published by the Free Software Foundation.
7  *
8  * This program is distributed in the hope that it will be useful,
9  * but WITHOUT ANY WARRANTY; without even the implied warranty of
10  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
11  * GNU General Public License for more details.
12  */
13
14 #include <linux/bitops.h>
15 #include <linux/bsearch.h>
16 #include <linux/kvm.h>
17 #include <linux/kvm_host.h>
18 #include <kvm/iodev.h>
19 #include <kvm/arm_vgic.h>
20
21 #include "vgic.h"
22 #include "vgic-mmio.h"
23
24 unsigned long vgic_mmio_read_raz(struct kvm_vcpu *vcpu,
25                                  gpa_t addr, unsigned int len)
26 {
27         return 0;
28 }
29
30 unsigned long vgic_mmio_read_rao(struct kvm_vcpu *vcpu,
31                                  gpa_t addr, unsigned int len)
32 {
33         return -1UL;
34 }
35
36 void vgic_mmio_write_wi(struct kvm_vcpu *vcpu, gpa_t addr,
37                         unsigned int len, unsigned long val)
38 {
39         /* Ignore */
40 }
41
42 /*
43  * Read accesses to both GICD_ICENABLER and GICD_ISENABLER return the value
44  * of the enabled bit, so there is only one function for both here.
45  */
46 unsigned long vgic_mmio_read_enable(struct kvm_vcpu *vcpu,
47                                     gpa_t addr, unsigned int len)
48 {
49         u32 intid = VGIC_ADDR_TO_INTID(addr, 1);
50         u32 value = 0;
51         int i;
52
53         /* Loop over all IRQs affected by this read */
54         for (i = 0; i < len * 8; i++) {
55                 struct vgic_irq *irq = vgic_get_irq(vcpu->kvm, vcpu, intid + i);
56
57                 if (irq->enabled)
58                         value |= (1U << i);
59
60                 vgic_put_irq(vcpu->kvm, irq);
61         }
62
63         return value;
64 }
65
66 void vgic_mmio_write_senable(struct kvm_vcpu *vcpu,
67                              gpa_t addr, unsigned int len,
68                              unsigned long val)
69 {
70         u32 intid = VGIC_ADDR_TO_INTID(addr, 1);
71         int i;
72
73         for_each_set_bit(i, &val, len * 8) {
74                 struct vgic_irq *irq = vgic_get_irq(vcpu->kvm, vcpu, intid + i);
75
76                 spin_lock(&irq->irq_lock);
77                 irq->enabled = true;
78                 vgic_queue_irq_unlock(vcpu->kvm, irq);
79
80                 vgic_put_irq(vcpu->kvm, irq);
81         }
82 }
83
84 void vgic_mmio_write_cenable(struct kvm_vcpu *vcpu,
85                              gpa_t addr, unsigned int len,
86                              unsigned long val)
87 {
88         u32 intid = VGIC_ADDR_TO_INTID(addr, 1);
89         int i;
90
91         for_each_set_bit(i, &val, len * 8) {
92                 struct vgic_irq *irq = vgic_get_irq(vcpu->kvm, vcpu, intid + i);
93
94                 spin_lock(&irq->irq_lock);
95
96                 irq->enabled = false;
97
98                 spin_unlock(&irq->irq_lock);
99                 vgic_put_irq(vcpu->kvm, irq);
100         }
101 }
102
103 unsigned long vgic_mmio_read_pending(struct kvm_vcpu *vcpu,
104                                      gpa_t addr, unsigned int len)
105 {
106         u32 intid = VGIC_ADDR_TO_INTID(addr, 1);
107         u32 value = 0;
108         int i;
109
110         /* Loop over all IRQs affected by this read */
111         for (i = 0; i < len * 8; i++) {
112                 struct vgic_irq *irq = vgic_get_irq(vcpu->kvm, vcpu, intid + i);
113
114                 if (irq->pending)
115                         value |= (1U << i);
116
117                 vgic_put_irq(vcpu->kvm, irq);
118         }
119
120         return value;
121 }
122
123 void vgic_mmio_write_spending(struct kvm_vcpu *vcpu,
124                               gpa_t addr, unsigned int len,
125                               unsigned long val)
126 {
127         u32 intid = VGIC_ADDR_TO_INTID(addr, 1);
128         int i;
129
130         for_each_set_bit(i, &val, len * 8) {
131                 struct vgic_irq *irq = vgic_get_irq(vcpu->kvm, vcpu, intid + i);
132
133                 spin_lock(&irq->irq_lock);
134                 irq->pending = true;
135                 if (irq->config == VGIC_CONFIG_LEVEL)
136                         irq->soft_pending = true;
137
138                 vgic_queue_irq_unlock(vcpu->kvm, irq);
139                 vgic_put_irq(vcpu->kvm, irq);
140         }
141 }
142
143 void vgic_mmio_write_cpending(struct kvm_vcpu *vcpu,
144                               gpa_t addr, unsigned int len,
145                               unsigned long val)
146 {
147         u32 intid = VGIC_ADDR_TO_INTID(addr, 1);
148         int i;
149
150         for_each_set_bit(i, &val, len * 8) {
151                 struct vgic_irq *irq = vgic_get_irq(vcpu->kvm, vcpu, intid + i);
152
153                 spin_lock(&irq->irq_lock);
154
155                 if (irq->config == VGIC_CONFIG_LEVEL) {
156                         irq->soft_pending = false;
157                         irq->pending = irq->line_level;
158                 } else {
159                         irq->pending = false;
160                 }
161
162                 spin_unlock(&irq->irq_lock);
163                 vgic_put_irq(vcpu->kvm, irq);
164         }
165 }
166
167 unsigned long vgic_mmio_read_active(struct kvm_vcpu *vcpu,
168                                     gpa_t addr, unsigned int len)
169 {
170         u32 intid = VGIC_ADDR_TO_INTID(addr, 1);
171         u32 value = 0;
172         int i;
173
174         /* Loop over all IRQs affected by this read */
175         for (i = 0; i < len * 8; i++) {
176                 struct vgic_irq *irq = vgic_get_irq(vcpu->kvm, vcpu, intid + i);
177
178                 if (irq->active)
179                         value |= (1U << i);
180
181                 vgic_put_irq(vcpu->kvm, irq);
182         }
183
184         return value;
185 }
186
187 static void vgic_mmio_change_active(struct kvm_vcpu *vcpu, struct vgic_irq *irq,
188                                     bool new_active_state)
189 {
190         spin_lock(&irq->irq_lock);
191         /*
192          * If this virtual IRQ was written into a list register, we
193          * have to make sure the CPU that runs the VCPU thread has
194          * synced back LR state to the struct vgic_irq.  We can only
195          * know this for sure, when either this irq is not assigned to
196          * anyone's AP list anymore, or the VCPU thread is not
197          * running on any CPUs.
198          *
199          * In the opposite case, we know the VCPU thread may be on its
200          * way back from the guest and still has to sync back this
201          * IRQ, so we release and re-acquire the spin_lock to let the
202          * other thread sync back the IRQ.
203          */
204         while (irq->vcpu && /* IRQ may have state in an LR somewhere */
205                irq->vcpu->cpu != -1) /* VCPU thread is running */
206                 cond_resched_lock(&irq->irq_lock);
207
208         irq->active = new_active_state;
209         if (new_active_state)
210                 vgic_queue_irq_unlock(vcpu->kvm, irq);
211         else
212                 spin_unlock(&irq->irq_lock);
213 }
214
215 /*
216  * If we are fiddling with an IRQ's active state, we have to make sure the IRQ
217  * is not queued on some running VCPU's LRs, because then the change to the
218  * active state can be overwritten when the VCPU's state is synced coming back
219  * from the guest.
220  *
221  * For shared interrupts, we have to stop all the VCPUs because interrupts can
222  * be migrated while we don't hold the IRQ locks and we don't want to be
223  * chasing moving targets.
224  *
225  * For private interrupts, we only have to make sure the single and only VCPU
226  * that can potentially queue the IRQ is stopped.
227  */
228 static void vgic_change_active_prepare(struct kvm_vcpu *vcpu, u32 intid)
229 {
230         if (intid < VGIC_NR_PRIVATE_IRQS)
231                 kvm_arm_halt_vcpu(vcpu);
232         else
233                 kvm_arm_halt_guest(vcpu->kvm);
234 }
235
236 /* See vgic_change_active_prepare */
237 static void vgic_change_active_finish(struct kvm_vcpu *vcpu, u32 intid)
238 {
239         if (intid < VGIC_NR_PRIVATE_IRQS)
240                 kvm_arm_resume_vcpu(vcpu);
241         else
242                 kvm_arm_resume_guest(vcpu->kvm);
243 }
244
245 void vgic_mmio_write_cactive(struct kvm_vcpu *vcpu,
246                              gpa_t addr, unsigned int len,
247                              unsigned long val)
248 {
249         u32 intid = VGIC_ADDR_TO_INTID(addr, 1);
250         int i;
251
252         vgic_change_active_prepare(vcpu, intid);
253         for_each_set_bit(i, &val, len * 8) {
254                 struct vgic_irq *irq = vgic_get_irq(vcpu->kvm, vcpu, intid + i);
255                 vgic_mmio_change_active(vcpu, irq, false);
256                 vgic_put_irq(vcpu->kvm, irq);
257         }
258         vgic_change_active_finish(vcpu, intid);
259 }
260
261 void vgic_mmio_write_sactive(struct kvm_vcpu *vcpu,
262                              gpa_t addr, unsigned int len,
263                              unsigned long val)
264 {
265         u32 intid = VGIC_ADDR_TO_INTID(addr, 1);
266         int i;
267
268         vgic_change_active_prepare(vcpu, intid);
269         for_each_set_bit(i, &val, len * 8) {
270                 struct vgic_irq *irq = vgic_get_irq(vcpu->kvm, vcpu, intid + i);
271                 vgic_mmio_change_active(vcpu, irq, true);
272                 vgic_put_irq(vcpu->kvm, irq);
273         }
274         vgic_change_active_finish(vcpu, intid);
275 }
276
277 unsigned long vgic_mmio_read_priority(struct kvm_vcpu *vcpu,
278                                       gpa_t addr, unsigned int len)
279 {
280         u32 intid = VGIC_ADDR_TO_INTID(addr, 8);
281         int i;
282         u64 val = 0;
283
284         for (i = 0; i < len; i++) {
285                 struct vgic_irq *irq = vgic_get_irq(vcpu->kvm, vcpu, intid + i);
286
287                 val |= (u64)irq->priority << (i * 8);
288
289                 vgic_put_irq(vcpu->kvm, irq);
290         }
291
292         return val;
293 }
294
295 /*
296  * We currently don't handle changing the priority of an interrupt that
297  * is already pending on a VCPU. If there is a need for this, we would
298  * need to make this VCPU exit and re-evaluate the priorities, potentially
299  * leading to this interrupt getting presented now to the guest (if it has
300  * been masked by the priority mask before).
301  */
302 void vgic_mmio_write_priority(struct kvm_vcpu *vcpu,
303                               gpa_t addr, unsigned int len,
304                               unsigned long val)
305 {
306         u32 intid = VGIC_ADDR_TO_INTID(addr, 8);
307         int i;
308
309         for (i = 0; i < len; i++) {
310                 struct vgic_irq *irq = vgic_get_irq(vcpu->kvm, vcpu, intid + i);
311
312                 spin_lock(&irq->irq_lock);
313                 /* Narrow the priority range to what we actually support */
314                 irq->priority = (val >> (i * 8)) & GENMASK(7, 8 - VGIC_PRI_BITS);
315                 spin_unlock(&irq->irq_lock);
316
317                 vgic_put_irq(vcpu->kvm, irq);
318         }
319 }
320
321 unsigned long vgic_mmio_read_config(struct kvm_vcpu *vcpu,
322                                     gpa_t addr, unsigned int len)
323 {
324         u32 intid = VGIC_ADDR_TO_INTID(addr, 2);
325         u32 value = 0;
326         int i;
327
328         for (i = 0; i < len * 4; i++) {
329                 struct vgic_irq *irq = vgic_get_irq(vcpu->kvm, vcpu, intid + i);
330
331                 if (irq->config == VGIC_CONFIG_EDGE)
332                         value |= (2U << (i * 2));
333
334                 vgic_put_irq(vcpu->kvm, irq);
335         }
336
337         return value;
338 }
339
340 void vgic_mmio_write_config(struct kvm_vcpu *vcpu,
341                             gpa_t addr, unsigned int len,
342                             unsigned long val)
343 {
344         u32 intid = VGIC_ADDR_TO_INTID(addr, 2);
345         int i;
346
347         for (i = 0; i < len * 4; i++) {
348                 struct vgic_irq *irq;
349
350                 /*
351                  * The configuration cannot be changed for SGIs in general,
352                  * for PPIs this is IMPLEMENTATION DEFINED. The arch timer
353                  * code relies on PPIs being level triggered, so we also
354                  * make them read-only here.
355                  */
356                 if (intid + i < VGIC_NR_PRIVATE_IRQS)
357                         continue;
358
359                 irq = vgic_get_irq(vcpu->kvm, vcpu, intid + i);
360                 spin_lock(&irq->irq_lock);
361
362                 if (test_bit(i * 2 + 1, &val)) {
363                         irq->config = VGIC_CONFIG_EDGE;
364                 } else {
365                         irq->config = VGIC_CONFIG_LEVEL;
366                         irq->pending = irq->line_level | irq->soft_pending;
367                 }
368
369                 spin_unlock(&irq->irq_lock);
370                 vgic_put_irq(vcpu->kvm, irq);
371         }
372 }
373
374 static int match_region(const void *key, const void *elt)
375 {
376         const unsigned int offset = (unsigned long)key;
377         const struct vgic_register_region *region = elt;
378
379         if (offset < region->reg_offset)
380                 return -1;
381
382         if (offset >= region->reg_offset + region->len)
383                 return 1;
384
385         return 0;
386 }
387
388 /* Find the proper register handler entry given a certain address offset. */
389 static const struct vgic_register_region *
390 vgic_find_mmio_region(const struct vgic_register_region *region, int nr_regions,
391                       unsigned int offset)
392 {
393         return bsearch((void *)(uintptr_t)offset, region, nr_regions,
394                        sizeof(region[0]), match_region);
395 }
396
397 /*
398  * kvm_mmio_read_buf() returns a value in a format where it can be converted
399  * to a byte array and be directly observed as the guest wanted it to appear
400  * in memory if it had done the store itself, which is LE for the GIC, as the
401  * guest knows the GIC is always LE.
402  *
403  * We convert this value to the CPUs native format to deal with it as a data
404  * value.
405  */
406 unsigned long vgic_data_mmio_bus_to_host(const void *val, unsigned int len)
407 {
408         unsigned long data = kvm_mmio_read_buf(val, len);
409
410         switch (len) {
411         case 1:
412                 return data;
413         case 2:
414                 return le16_to_cpu(data);
415         case 4:
416                 return le32_to_cpu(data);
417         default:
418                 return le64_to_cpu(data);
419         }
420 }
421
422 /*
423  * kvm_mmio_write_buf() expects a value in a format such that if converted to
424  * a byte array it is observed as the guest would see it if it could perform
425  * the load directly.  Since the GIC is LE, and the guest knows this, the
426  * guest expects a value in little endian format.
427  *
428  * We convert the data value from the CPUs native format to LE so that the
429  * value is returned in the proper format.
430  */
431 void vgic_data_host_to_mmio_bus(void *buf, unsigned int len,
432                                 unsigned long data)
433 {
434         switch (len) {
435         case 1:
436                 break;
437         case 2:
438                 data = cpu_to_le16(data);
439                 break;
440         case 4:
441                 data = cpu_to_le32(data);
442                 break;
443         default:
444                 data = cpu_to_le64(data);
445         }
446
447         kvm_mmio_write_buf(buf, len, data);
448 }
449
450 static
451 struct vgic_io_device *kvm_to_vgic_iodev(const struct kvm_io_device *dev)
452 {
453         return container_of(dev, struct vgic_io_device, dev);
454 }
455
456 static bool check_region(const struct vgic_register_region *region,
457                          gpa_t addr, int len)
458 {
459         if ((region->access_flags & VGIC_ACCESS_8bit) && len == 1)
460                 return true;
461         if ((region->access_flags & VGIC_ACCESS_32bit) &&
462             len == sizeof(u32) && !(addr & 3))
463                 return true;
464         if ((region->access_flags & VGIC_ACCESS_64bit) &&
465             len == sizeof(u64) && !(addr & 7))
466                 return true;
467
468         return false;
469 }
470
471 static int dispatch_mmio_read(struct kvm_vcpu *vcpu, struct kvm_io_device *dev,
472                               gpa_t addr, int len, void *val)
473 {
474         struct vgic_io_device *iodev = kvm_to_vgic_iodev(dev);
475         const struct vgic_register_region *region;
476         unsigned long data = 0;
477
478         region = vgic_find_mmio_region(iodev->regions, iodev->nr_regions,
479                                        addr - iodev->base_addr);
480         if (!region || !check_region(region, addr, len)) {
481                 memset(val, 0, len);
482                 return 0;
483         }
484
485         switch (iodev->iodev_type) {
486         case IODEV_CPUIF:
487                 data = region->read(vcpu, addr, len);
488                 break;
489         case IODEV_DIST:
490                 data = region->read(vcpu, addr, len);
491                 break;
492         case IODEV_REDIST:
493                 data = region->read(iodev->redist_vcpu, addr, len);
494                 break;
495         case IODEV_ITS:
496                 data = region->its_read(vcpu->kvm, iodev->its, addr, len);
497                 break;
498         }
499
500         vgic_data_host_to_mmio_bus(val, len, data);
501         return 0;
502 }
503
504 static int dispatch_mmio_write(struct kvm_vcpu *vcpu, struct kvm_io_device *dev,
505                                gpa_t addr, int len, const void *val)
506 {
507         struct vgic_io_device *iodev = kvm_to_vgic_iodev(dev);
508         const struct vgic_register_region *region;
509         unsigned long data = vgic_data_mmio_bus_to_host(val, len);
510
511         region = vgic_find_mmio_region(iodev->regions, iodev->nr_regions,
512                                        addr - iodev->base_addr);
513         if (!region)
514                 return 0;
515
516         if (!check_region(region, addr, len))
517                 return 0;
518
519         switch (iodev->iodev_type) {
520         case IODEV_CPUIF:
521                 region->write(vcpu, addr, len, data);
522                 break;
523         case IODEV_DIST:
524                 region->write(vcpu, addr, len, data);
525                 break;
526         case IODEV_REDIST:
527                 region->write(iodev->redist_vcpu, addr, len, data);
528                 break;
529         case IODEV_ITS:
530                 region->its_write(vcpu->kvm, iodev->its, addr, len, data);
531                 break;
532         }
533
534         return 0;
535 }
536
537 struct kvm_io_device_ops kvm_io_gic_ops = {
538         .read = dispatch_mmio_read,
539         .write = dispatch_mmio_write,
540 };
541
542 int vgic_register_dist_iodev(struct kvm *kvm, gpa_t dist_base_address,
543                              enum vgic_type type)
544 {
545         struct vgic_io_device *io_device = &kvm->arch.vgic.dist_iodev;
546         int ret = 0;
547         unsigned int len;
548
549         switch (type) {
550         case VGIC_V2:
551                 len = vgic_v2_init_dist_iodev(io_device);
552                 break;
553 #ifdef CONFIG_KVM_ARM_VGIC_V3
554         case VGIC_V3:
555                 len = vgic_v3_init_dist_iodev(io_device);
556                 break;
557 #endif
558         default:
559                 BUG_ON(1);
560         }
561
562         io_device->base_addr = dist_base_address;
563         io_device->iodev_type = IODEV_DIST;
564         io_device->redist_vcpu = NULL;
565
566         mutex_lock(&kvm->slots_lock);
567         ret = kvm_io_bus_register_dev(kvm, KVM_MMIO_BUS, dist_base_address,
568                                       len, &io_device->dev);
569         mutex_unlock(&kvm->slots_lock);
570
571         return ret;
572 }