f1c360fc6f708b8cd4f2b507ec1d1932b7aa2b0d4743e8f9116880bb.patch - chromiumos/third_party/kernel-rebase-patches - Git at Google

 From 6075e71db2cb54572c8b0741c7be64392a9a16a8 Mon Sep 17 00:00:00 2001
 From: David Stevens <stevensd@chromium.org>
 Date: Fri, 25 Jun 2021 16:36:13 +0900
 Subject: [PATCH] FROMLIST: KVM: mmu: introduce new gfn_to_pfn_page functions

 Introduce new gfn_to_pfn_page functions that parallel existing
 gfn_to_pfn functions. The new functions are identical except they take
 an additional out parameter that is used to return the struct page if
 the hva was resolved by gup. This allows callers to differentiate the
 gup and follow_pte cases, which in turn allows callers to only touch the
 page refcount when necessitated by gup.

 The old gfn_to_pfn functions are depreciated, and all callers should be
 migrated to the new gfn_to_pfn_page functions. In the interim, the
 gfn_to_pfn functions are reimplemented as wrappers of the corresponding
 gfn_to_pfn_page functions. The wrappers take a reference to the pfn's
 page that had previously been taken in hva_to_pfn_remapped.

 Signed-off-by: David Stevens <stevensd@chromium.org>
 (am from https://lore.kernel.org/patchwork/patch/1451585/)
 (also found at https://lore.kernel.org/r/20210625073616.2184426-3-stevensd@google.com)

 BUG=b:184929592, b:176387875
 TEST=tast run zork arc.VideoDecodeAccel.vp9_vm

 Change-Id: I78cfd54c48c501ef291a6514e3127ec504dd75f5
 Reviewed-on: https://chromium-review.googlesource.com/c/chromiumos/third_party/kernel/+/3002592
 Reviewed-by: Sean Paul <seanpaul@chromium.org>
 Reviewed-by: Suleiman Souhlal <suleiman@chromium.org>
 Tested-by: David Stevens <stevensd@chromium.org>
 Commit-Queue: David Stevens <stevensd@chromium.org>
 ---
  include/linux/kvm_host.h |  17 ++++
  virt/kvm/kvm_main.c      | 186 ++++++++++++++++++++++++++++-----------
  2 files changed, 152 insertions(+), 51 deletions(-)

 diff --git a/include/linux/kvm_host.h b/include/linux/kvm_host.h
 --- a/include/linux/kvm_host.h
 +++ b/include/linux/kvm_host.h
 @@ -868,6 +868,19 @@ kvm_pfn_t __gfn_to_pfn_memslot(struct kvm_memory_slot *slot, gfn_t gfn,
  			       bool atomic, bool *async, bool write_fault,
  			       bool *writable, hva_t *hva);

 +kvm_pfn_t gfn_to_pfn_page(struct kvm *kvm, gfn_t gfn, struct page **page);
 +kvm_pfn_t gfn_to_pfn_page_prot(struct kvm *kvm, gfn_t gfn,
 +			       bool write_fault, bool *writable,
 +			       struct page **page);
 +kvm_pfn_t gfn_to_pfn_page_memslot(struct kvm_memory_slot *slot,
 +				  gfn_t gfn, struct page **page);
 +kvm_pfn_t gfn_to_pfn_page_memslot_atomic(struct kvm_memory_slot *slot,
 +					 gfn_t gfn, struct page **page);
 +kvm_pfn_t __gfn_to_pfn_page_memslot(struct kvm_memory_slot *slot,
 +				    gfn_t gfn, bool atomic, bool *async,
 +				    bool write_fault, bool *writable,
 +				    hva_t *hva, struct page **page);
 +
  void kvm_release_pfn_clean(kvm_pfn_t pfn);
  void kvm_release_pfn_dirty(kvm_pfn_t pfn);
  void kvm_set_pfn_dirty(kvm_pfn_t pfn);
 @@ -948,6 +961,10 @@ struct kvm_memslots *kvm_vcpu_memslots(struct kvm_vcpu *vcpu);
  struct kvm_memory_slot *kvm_vcpu_gfn_to_memslot(struct kvm_vcpu *vcpu, gfn_t gfn);
  kvm_pfn_t kvm_vcpu_gfn_to_pfn_atomic(struct kvm_vcpu *vcpu, gfn_t gfn);
  kvm_pfn_t kvm_vcpu_gfn_to_pfn(struct kvm_vcpu *vcpu, gfn_t gfn);
 +kvm_pfn_t kvm_vcpu_gfn_to_pfn_page_atomic(struct kvm_vcpu *vcpu, gfn_t gfn,
 +					  struct page **page);
 +kvm_pfn_t kvm_vcpu_gfn_to_pfn_page(struct kvm_vcpu *vcpu, gfn_t gfn,
 +				   struct page **page);
  int kvm_vcpu_map(struct kvm_vcpu *vcpu, gpa_t gpa, struct kvm_host_map *map);
  int kvm_map_gfn(struct kvm_vcpu *vcpu, gfn_t gfn, struct kvm_host_map *map,
  		struct gfn_to_pfn_cache *cache, bool atomic);
 diff --git a/virt/kvm/kvm_main.c b/virt/kvm/kvm_main.c
 --- a/virt/kvm/kvm_main.c
 +++ b/virt/kvm/kvm_main.c
 @@ -2204,9 +2204,9 @@ static inline int check_user_page_hwpoison(unsigned long addr)
   * only part that runs if we can in atomic context.
   */
  static bool hva_to_pfn_fast(unsigned long addr, bool write_fault,
 -			    bool *writable, kvm_pfn_t *pfn)
 +			    bool *writable, kvm_pfn_t *pfn,
 +			    struct page **page)
  {
 -	struct page *page[1];

  	/*
  	 * Fast pin a writable pfn only if it is a write fault request
 @@ -2217,7 +2217,7 @@ static bool hva_to_pfn_fast(unsigned long addr, bool write_fault,
  		return false;

  	if (get_user_page_fast_only(addr, FOLL_WRITE, page)) {
 -		*pfn = page_to_pfn(page[0]);
 +		*pfn = page_to_pfn(*page);

  		if (writable)
  			*writable = true;
 @@ -2232,10 +2232,9 @@ static bool hva_to_pfn_fast(unsigned long addr, bool write_fault,
   * 1 indicates success, -errno is returned if error is detected.
   */
  static int hva_to_pfn_slow(unsigned long addr, bool *async, bool write_fault,
 -			   bool *writable, kvm_pfn_t *pfn)
 +			   bool *writable, kvm_pfn_t *pfn, struct page **page)
  {
  	unsigned int flags = FOLL_HWPOISON;
 -	struct page *page;
  	int npages = 0;

  	might_sleep();
 @@ -2248,7 +2247,7 @@ static int hva_to_pfn_slow(unsigned long addr, bool *async, bool write_fault,
  	if (async)
  		flags |= FOLL_NOWAIT;

 -	npages = get_user_pages_unlocked(addr, 1, &page, flags);
 +	npages = get_user_pages_unlocked(addr, 1, page, flags);
  	if (npages != 1)
  		return npages;

 @@ -2258,11 +2257,11 @@ static int hva_to_pfn_slow(unsigned long addr, bool *async, bool write_fault,

  		if (get_user_page_fast_only(addr, FOLL_WRITE, &wpage)) {
  			*writable = true;
 -			put_page(page);
 -			page = wpage;
 +			put_page(*page);
 +			*page = wpage;
  		}
  	}
 -	*pfn = page_to_pfn(page);
 +	*pfn = page_to_pfn(*page);
  	return npages;
  }

 @@ -2277,13 +2276,6 @@ static bool vma_is_valid(struct vm_area_struct *vma, bool write_fault)
  	return true;
  }

 -static int kvm_try_get_pfn(kvm_pfn_t pfn)
 -{
 -	if (kvm_is_reserved_pfn(pfn))
 -		return 1;
 -	return get_page_unless_zero(pfn_to_page(pfn));
 -}
 -
  static int hva_to_pfn_remapped(struct vm_area_struct *vma,
  			       unsigned long addr, bool *async,
  			       bool write_fault, bool *writable,
 @@ -2323,26 +2315,6 @@ static int hva_to_pfn_remapped(struct vm_area_struct *vma,
  		*writable = pte_write(*ptep);
  	pfn = pte_pfn(*ptep);

 -	/*
 -	 * Get a reference here because callers of *hva_to_pfn* and
 -	 * *gfn_to_pfn* ultimately call kvm_release_pfn_clean on the
 -	 * returned pfn.  This is only needed if the VMA has VM_MIXEDMAP
 -	 * set, but the kvm_try_get_pfn/kvm_release_pfn_clean pair will
 -	 * simply do nothing for reserved pfns.
 -	 *
 -	 * Whoever called remap_pfn_range is also going to call e.g.
 -	 * unmap_mapping_range before the underlying pages are freed,
 -	 * causing a call to our MMU notifier.
 -	 *
 -	 * Certain IO or PFNMAP mappings can be backed with valid
 -	 * struct pages, but be allocated without refcounting e.g.,
 -	 * tail pages of non-compound higher order allocations, which
 -	 * would then underflow the refcount when the caller does the
 -	 * required put_page. Don't allow those pages here.
 -	 */
 -	if (!kvm_try_get_pfn(pfn))
 -		r = -EFAULT;
 -
  out:
  	pte_unmap_unlock(ptep, ptl);
  	*p_pfn = pfn;
 @@ -2364,8 +2336,9 @@ static int hva_to_pfn_remapped(struct vm_area_struct *vma,
   * 2): @write_fault = false && @writable, @writable will tell the caller
   *     whether the mapping is writable.
   */
 -static kvm_pfn_t hva_to_pfn(unsigned long addr, bool atomic, bool *async,
 -			bool write_fault, bool *writable)
 +static kvm_pfn_t hva_to_pfn(unsigned long addr, bool atomic,
 +			    bool *async, bool write_fault, bool *writable,
 +			    struct page **page)
  {
  	struct vm_area_struct *vma;
  	kvm_pfn_t pfn = 0;
 @@ -2374,13 +2347,14 @@ static kvm_pfn_t hva_to_pfn(unsigned long addr, bool atomic, bool *async,
  	/* we can do it either atomically or asynchronously, not both */
  	BUG_ON(atomic && async);

 -	if (hva_to_pfn_fast(addr, write_fault, writable, &pfn))
 +	if (hva_to_pfn_fast(addr, write_fault, writable, &pfn, page))
  		return pfn;

  	if (atomic)
  		return KVM_PFN_ERR_FAULT;

 -	npages = hva_to_pfn_slow(addr, async, write_fault, writable, &pfn);
 +	npages = hva_to_pfn_slow(addr, async, write_fault, writable,
 +				 &pfn, page);
  	if (npages == 1)
  		return pfn;

 @@ -2412,12 +2386,14 @@ static kvm_pfn_t hva_to_pfn(unsigned long addr, bool atomic, bool *async,
  	return pfn;
  }

 -kvm_pfn_t __gfn_to_pfn_memslot(struct kvm_memory_slot *slot, gfn_t gfn,
 -			       bool atomic, bool *async, bool write_fault,
 -			       bool *writable, hva_t *hva)
 +kvm_pfn_t __gfn_to_pfn_page_memslot(struct kvm_memory_slot *slot,
 +				    gfn_t gfn, bool atomic, bool *async,
 +				    bool write_fault, bool *writable,
 +				    hva_t *hva, struct page **page)
  {
  	unsigned long addr = __gfn_to_hva_many(slot, gfn, NULL, write_fault);

 +	*page = NULL;
  	if (hva)
  		*hva = addr;

 @@ -2440,45 +2416,153 @@ kvm_pfn_t __gfn_to_pfn_memslot(struct kvm_memory_slot *slot, gfn_t gfn,
  	}

  	return hva_to_pfn(addr, atomic, async, write_fault,
 -			  writable);
 +			  writable, page);
 +}
 +EXPORT_SYMBOL_GPL(__gfn_to_pfn_page_memslot);
 +
 +kvm_pfn_t gfn_to_pfn_page_prot(struct kvm *kvm, gfn_t gfn, bool write_fault,
 +			       bool *writable, struct page **page)
 +{
 +	return __gfn_to_pfn_page_memslot(gfn_to_memslot(kvm, gfn), gfn, false,
 +					 NULL, write_fault, writable, NULL,
 +					 page);
 +}
 +EXPORT_SYMBOL_GPL(gfn_to_pfn_page_prot);
 +
 +kvm_pfn_t gfn_to_pfn_page_memslot(struct kvm_memory_slot *slot, gfn_t gfn,
 +				  struct page **page)
 +{
 +	return __gfn_to_pfn_page_memslot(slot, gfn, false, NULL, true,
 +					 NULL, NULL, page);
 +}
 +EXPORT_SYMBOL_GPL(gfn_to_pfn_page_memslot);
 +
 +kvm_pfn_t gfn_to_pfn_page_memslot_atomic(struct kvm_memory_slot *slot,
 +					 gfn_t gfn, struct page **page)
 +{
 +	return __gfn_to_pfn_page_memslot(slot, gfn, true, NULL, true, NULL,
 +					 NULL, page);
 +}
 +EXPORT_SYMBOL_GPL(gfn_to_pfn_page_memslot_atomic);
 +
 +kvm_pfn_t kvm_vcpu_gfn_to_pfn_page_atomic(struct kvm_vcpu *vcpu, gfn_t gfn,
 +					  struct page **page)
 +{
 +	return gfn_to_pfn_page_memslot_atomic(
 +			kvm_vcpu_gfn_to_memslot(vcpu, gfn), gfn, page);
 +}
 +EXPORT_SYMBOL_GPL(kvm_vcpu_gfn_to_pfn_page_atomic);
 +
 +kvm_pfn_t gfn_to_pfn_page(struct kvm *kvm, gfn_t gfn, struct page **page)
 +{
 +	return gfn_to_pfn_page_memslot(gfn_to_memslot(kvm, gfn), gfn, page);
 +}
 +EXPORT_SYMBOL_GPL(gfn_to_pfn_page);
 +
 +kvm_pfn_t kvm_vcpu_gfn_to_pfn_page(struct kvm_vcpu *vcpu, gfn_t gfn,
 +				   struct page **page)
 +{
 +	return gfn_to_pfn_page_memslot(kvm_vcpu_gfn_to_memslot(vcpu, gfn),
 +				       gfn, page);
 +}
 +EXPORT_SYMBOL_GPL(kvm_vcpu_gfn_to_pfn_page);
 +
 +static kvm_pfn_t ensure_pfn_ref(struct page *page, kvm_pfn_t pfn)
 +{
 +	if (page || is_error_pfn(pfn) || kvm_is_reserved_pfn(pfn))
 +		return pfn;
 +
 +	/*
 +	 * Certain IO or PFNMAP mappings can be backed with valid
 +	 * struct pages, but be allocated without refcounting e.g.,
 +	 * tail pages of non-compound higher order allocations, which
 +	 * would then underflow the refcount when the caller does the
 +	 * required put_page. Don't allow those pages here.
 +	 */
 +	if (get_page_unless_zero(pfn_to_page(pfn)))
 +		return pfn;
 +
 +	return KVM_PFN_ERR_FAULT;
 +}
 +
 +kvm_pfn_t __gfn_to_pfn_memslot(struct kvm_memory_slot *slot, gfn_t gfn,
 +			       bool atomic, bool *async, bool write_fault,
 +			       bool *writable, hva_t *hva)
 +{
 +	struct page *page;
 +	kvm_pfn_t pfn;
 +
 +	pfn = __gfn_to_pfn_page_memslot(slot, gfn, atomic, async,
 +					write_fault, writable, hva, &page);
 +
 +	return ensure_pfn_ref(page, pfn);
  }
  EXPORT_SYMBOL_GPL(__gfn_to_pfn_memslot);

  kvm_pfn_t gfn_to_pfn_prot(struct kvm *kvm, gfn_t gfn, bool write_fault,
  		      bool *writable)
  {
 -	return __gfn_to_pfn_memslot(gfn_to_memslot(kvm, gfn), gfn, false, NULL,
 -				    write_fault, writable, NULL);
 +	struct page *page;
 +	kvm_pfn_t pfn;
 +
 +	pfn = gfn_to_pfn_page_prot(kvm, gfn, write_fault, writable, &page);
 +
 +	return ensure_pfn_ref(page, pfn);
  }
  EXPORT_SYMBOL_GPL(gfn_to_pfn_prot);

  kvm_pfn_t gfn_to_pfn_memslot(struct kvm_memory_slot *slot, gfn_t gfn)
  {
 -	return __gfn_to_pfn_memslot(slot, gfn, false, NULL, true, NULL, NULL);
 +	struct page *page;
 +	kvm_pfn_t pfn;
 +
 +	pfn = gfn_to_pfn_page_memslot(slot, gfn, &page);
 +
 +	return ensure_pfn_ref(page, pfn);
  }
  EXPORT_SYMBOL_GPL(gfn_to_pfn_memslot);

  kvm_pfn_t gfn_to_pfn_memslot_atomic(struct kvm_memory_slot *slot, gfn_t gfn)
  {
 -	return __gfn_to_pfn_memslot(slot, gfn, true, NULL, true, NULL, NULL);
 +	struct page *page;
 +	kvm_pfn_t pfn;
 +
 +	pfn = gfn_to_pfn_page_memslot_atomic(slot, gfn, &page);
 +
 +	return ensure_pfn_ref(page, pfn);
  }
  EXPORT_SYMBOL_GPL(gfn_to_pfn_memslot_atomic);

  kvm_pfn_t kvm_vcpu_gfn_to_pfn_atomic(struct kvm_vcpu *vcpu, gfn_t gfn)
  {
 -	return gfn_to_pfn_memslot_atomic(kvm_vcpu_gfn_to_memslot(vcpu, gfn), gfn);
 +	struct page *page;
 +	kvm_pfn_t pfn;
 +
 +	pfn = kvm_vcpu_gfn_to_pfn_page_atomic(vcpu, gfn, &page);
 +
 +	return ensure_pfn_ref(page, pfn);
  }
  EXPORT_SYMBOL_GPL(kvm_vcpu_gfn_to_pfn_atomic);

  kvm_pfn_t gfn_to_pfn(struct kvm *kvm, gfn_t gfn)
  {
 -	return gfn_to_pfn_memslot(gfn_to_memslot(kvm, gfn), gfn);
 +	struct page *page;
 +	kvm_pfn_t pfn;
 +
 +	pfn = gfn_to_pfn_page(kvm, gfn, &page);
 +
 +	return ensure_pfn_ref(page, pfn);
  }
  EXPORT_SYMBOL_GPL(gfn_to_pfn);

  kvm_pfn_t kvm_vcpu_gfn_to_pfn(struct kvm_vcpu *vcpu, gfn_t gfn)
  {
 -	return gfn_to_pfn_memslot(kvm_vcpu_gfn_to_memslot(vcpu, gfn), gfn);
 +	struct page *page;
 +	kvm_pfn_t pfn;
 +
 +	pfn = kvm_vcpu_gfn_to_pfn_page(vcpu, gfn, &page);
 +
 +	return ensure_pfn_ref(page, pfn);
  }
  EXPORT_SYMBOL_GPL(kvm_vcpu_gfn_to_pfn);

 --
 2.33.0.464.g1972c5931b-goog
	From 6075e71db2cb54572c8b0741c7be64392a9a16a8 Mon Sep 17 00:00:00 2001
	From: David Stevens <stevensd@chromium.org>
	Date: Fri, 25 Jun 2021 16:36:13 +0900
	Subject: [PATCH] FROMLIST: KVM: mmu: introduce new gfn_to_pfn_page functions

	Introduce new gfn_to_pfn_page functions that parallel existing
	gfn_to_pfn functions. The new functions are identical except they take
	an additional out parameter that is used to return the struct page if
	the hva was resolved by gup. This allows callers to differentiate the
	gup and follow_pte cases, which in turn allows callers to only touch the
	page refcount when necessitated by gup.

	The old gfn_to_pfn functions are depreciated, and all callers should be
	migrated to the new gfn_to_pfn_page functions. In the interim, the
	gfn_to_pfn functions are reimplemented as wrappers of the corresponding
	gfn_to_pfn_page functions. The wrappers take a reference to the pfn's
	page that had previously been taken in hva_to_pfn_remapped.

	Signed-off-by: David Stevens <stevensd@chromium.org>
	(am from https://lore.kernel.org/patchwork/patch/1451585/)
	(also found at https://lore.kernel.org/r/20210625073616.2184426-3-stevensd@google.com)

	BUG=b:184929592, b:176387875
	TEST=tast run zork arc.VideoDecodeAccel.vp9_vm

	Change-Id: I78cfd54c48c501ef291a6514e3127ec504dd75f5
	Reviewed-on: https://chromium-review.googlesource.com/c/chromiumos/third_party/kernel/+/3002592
	Reviewed-by: Sean Paul <seanpaul@chromium.org>
	Reviewed-by: Suleiman Souhlal <suleiman@chromium.org>
	Tested-by: David Stevens <stevensd@chromium.org>
	Commit-Queue: David Stevens <stevensd@chromium.org>
	---
	include/linux/kvm_host.h \| 17 ++++
	virt/kvm/kvm_main.c \| 186 ++++++++++++++++++++++++++++-----------
	2 files changed, 152 insertions(+), 51 deletions(-)

	diff --git a/include/linux/kvm_host.h b/include/linux/kvm_host.h
	--- a/include/linux/kvm_host.h
	+++ b/include/linux/kvm_host.h
	@@ -868,6 +868,19 @@ kvm_pfn_t __gfn_to_pfn_memslot(struct kvm_memory_slot *slot, gfn_t gfn,
	bool atomic, bool *async, bool write_fault,
	bool writable, hva_t hva);

	+kvm_pfn_t gfn_to_pfn_page(struct kvm kvm, gfn_t gfn, struct page *page);
	+kvm_pfn_t gfn_to_pfn_page_prot(struct kvm *kvm, gfn_t gfn,
	+ bool write_fault, bool *writable,
	+ struct page **page);
	+kvm_pfn_t gfn_to_pfn_page_memslot(struct kvm_memory_slot *slot,
	+ gfn_t gfn, struct page **page);
	+kvm_pfn_t gfn_to_pfn_page_memslot_atomic(struct kvm_memory_slot *slot,
	+ gfn_t gfn, struct page **page);
	+kvm_pfn_t __gfn_to_pfn_page_memslot(struct kvm_memory_slot *slot,
	+ gfn_t gfn, bool atomic, bool *async,
	+ bool write_fault, bool *writable,
	+ hva_t hva, struct page *page);
	+
	void kvm_release_pfn_clean(kvm_pfn_t pfn);
	void kvm_release_pfn_dirty(kvm_pfn_t pfn);
	void kvm_set_pfn_dirty(kvm_pfn_t pfn);
	@@ -948,6 +961,10 @@ struct kvm_memslots kvm_vcpu_memslots(struct kvm_vcpu vcpu);
	struct kvm_memory_slot kvm_vcpu_gfn_to_memslot(struct kvm_vcpu vcpu, gfn_t gfn);
	kvm_pfn_t kvm_vcpu_gfn_to_pfn_atomic(struct kvm_vcpu *vcpu, gfn_t gfn);
	kvm_pfn_t kvm_vcpu_gfn_to_pfn(struct kvm_vcpu *vcpu, gfn_t gfn);
	+kvm_pfn_t kvm_vcpu_gfn_to_pfn_page_atomic(struct kvm_vcpu *vcpu, gfn_t gfn,
	+ struct page **page);
	+kvm_pfn_t kvm_vcpu_gfn_to_pfn_page(struct kvm_vcpu *vcpu, gfn_t gfn,
	+ struct page **page);
	int kvm_vcpu_map(struct kvm_vcpu vcpu, gpa_t gpa, struct kvm_host_map map);
	int kvm_map_gfn(struct kvm_vcpu vcpu, gfn_t gfn, struct kvm_host_map map,
	struct gfn_to_pfn_cache *cache, bool atomic);
	diff --git a/virt/kvm/kvm_main.c b/virt/kvm/kvm_main.c
	--- a/virt/kvm/kvm_main.c
	+++ b/virt/kvm/kvm_main.c
	@@ -2204,9 +2204,9 @@ static inline int check_user_page_hwpoison(unsigned long addr)
	* only part that runs if we can in atomic context.
	*/
	static bool hva_to_pfn_fast(unsigned long addr, bool write_fault,
	- bool writable, kvm_pfn_t pfn)
	+ bool writable, kvm_pfn_t pfn,
	+ struct page **page)
	{
	- struct page *page[1];

	/*
	* Fast pin a writable pfn only if it is a write fault request
	@@ -2217,7 +2217,7 @@ static bool hva_to_pfn_fast(unsigned long addr, bool write_fault,
	return false;

	if (get_user_page_fast_only(addr, FOLL_WRITE, page)) {
	- *pfn = page_to_pfn(page[0]);
	+ pfn = page_to_pfn(page);

	if (writable)
	*writable = true;
	@@ -2232,10 +2232,9 @@ static bool hva_to_pfn_fast(unsigned long addr, bool write_fault,
	* 1 indicates success, -errno is returned if error is detected.
	*/
	static int hva_to_pfn_slow(unsigned long addr, bool *async, bool write_fault,
	- bool writable, kvm_pfn_t pfn)
	+ bool writable, kvm_pfn_t pfn, struct page **page)
	{
	unsigned int flags = FOLL_HWPOISON;
	- struct page *page;
	int npages = 0;

	might_sleep();
	@@ -2248,7 +2247,7 @@ static int hva_to_pfn_slow(unsigned long addr, bool *async, bool write_fault,
	if (async)
	flags \|= FOLL_NOWAIT;

	- npages = get_user_pages_unlocked(addr, 1, &page, flags);
	+ npages = get_user_pages_unlocked(addr, 1, page, flags);
	if (npages != 1)
	return npages;

	@@ -2258,11 +2257,11 @@ static int hva_to_pfn_slow(unsigned long addr, bool *async, bool write_fault,

	if (get_user_page_fast_only(addr, FOLL_WRITE, &wpage)) {
	*writable = true;
	- put_page(page);
	- page = wpage;
	+ put_page(*page);
	+ *page = wpage;
	}
	}
	- *pfn = page_to_pfn(page);
	+ pfn = page_to_pfn(page);
	return npages;
	}

	@@ -2277,13 +2276,6 @@ static bool vma_is_valid(struct vm_area_struct *vma, bool write_fault)
	return true;
	}

	-static int kvm_try_get_pfn(kvm_pfn_t pfn)
	-{
	- if (kvm_is_reserved_pfn(pfn))
	- return 1;
	- return get_page_unless_zero(pfn_to_page(pfn));
	-}
	-
	static int hva_to_pfn_remapped(struct vm_area_struct *vma,
	unsigned long addr, bool *async,
	bool write_fault, bool *writable,
	@@ -2323,26 +2315,6 @@ static int hva_to_pfn_remapped(struct vm_area_struct *vma,
	writable = pte_write(ptep);
	pfn = pte_pfn(*ptep);

	- /*
	- * Get a reference here because callers of hva_to_pfn and
	- * gfn_to_pfn ultimately call kvm_release_pfn_clean on the
	- * returned pfn. This is only needed if the VMA has VM_MIXEDMAP
	- * set, but the kvm_try_get_pfn/kvm_release_pfn_clean pair will
	- * simply do nothing for reserved pfns.
	- *
	- * Whoever called remap_pfn_range is also going to call e.g.
	- * unmap_mapping_range before the underlying pages are freed,
	- * causing a call to our MMU notifier.
	- *
	- * Certain IO or PFNMAP mappings can be backed with valid
	- * struct pages, but be allocated without refcounting e.g.,
	- * tail pages of non-compound higher order allocations, which
	- * would then underflow the refcount when the caller does the
	- * required put_page. Don't allow those pages here.
	- */
	- if (!kvm_try_get_pfn(pfn))
	- r = -EFAULT;
	-
	out:
	pte_unmap_unlock(ptep, ptl);
	*p_pfn = pfn;
	@@ -2364,8 +2336,9 @@ static int hva_to_pfn_remapped(struct vm_area_struct *vma,
	* 2): @write_fault = false && @writable, @writable will tell the caller
	* whether the mapping is writable.
	*/
	-static kvm_pfn_t hva_to_pfn(unsigned long addr, bool atomic, bool *async,
	- bool write_fault, bool *writable)
	+static kvm_pfn_t hva_to_pfn(unsigned long addr, bool atomic,
	+ bool async, bool write_fault, bool writable,
	+ struct page **page)
	{
	struct vm_area_struct *vma;
	kvm_pfn_t pfn = 0;
	@@ -2374,13 +2347,14 @@ static kvm_pfn_t hva_to_pfn(unsigned long addr, bool atomic, bool *async,
	/* we can do it either atomically or asynchronously, not both */
	BUG_ON(atomic && async);

	- if (hva_to_pfn_fast(addr, write_fault, writable, &pfn))
	+ if (hva_to_pfn_fast(addr, write_fault, writable, &pfn, page))
	return pfn;

	if (atomic)
	return KVM_PFN_ERR_FAULT;

	- npages = hva_to_pfn_slow(addr, async, write_fault, writable, &pfn);
	+ npages = hva_to_pfn_slow(addr, async, write_fault, writable,
	+ &pfn, page);
	if (npages == 1)
	return pfn;

	@@ -2412,12 +2386,14 @@ static kvm_pfn_t hva_to_pfn(unsigned long addr, bool atomic, bool *async,
	return pfn;
	}

	-kvm_pfn_t __gfn_to_pfn_memslot(struct kvm_memory_slot *slot, gfn_t gfn,
	- bool atomic, bool *async, bool write_fault,
	- bool writable, hva_t hva)
	+kvm_pfn_t __gfn_to_pfn_page_memslot(struct kvm_memory_slot *slot,
	+ gfn_t gfn, bool atomic, bool *async,
	+ bool write_fault, bool *writable,
	+ hva_t hva, struct page *page)
	{
	unsigned long addr = __gfn_to_hva_many(slot, gfn, NULL, write_fault);

	+ *page = NULL;
	if (hva)
	*hva = addr;

	@@ -2440,45 +2416,153 @@ kvm_pfn_t __gfn_to_pfn_memslot(struct kvm_memory_slot *slot, gfn_t gfn,
	}

	return hva_to_pfn(addr, atomic, async, write_fault,
	- writable);
	+ writable, page);
	+}
	+EXPORT_SYMBOL_GPL(__gfn_to_pfn_page_memslot);
	+
	+kvm_pfn_t gfn_to_pfn_page_prot(struct kvm *kvm, gfn_t gfn, bool write_fault,
	+ bool writable, struct page *page)
	+{
	+ return __gfn_to_pfn_page_memslot(gfn_to_memslot(kvm, gfn), gfn, false,
	+ NULL, write_fault, writable, NULL,
	+ page);
	+}
	+EXPORT_SYMBOL_GPL(gfn_to_pfn_page_prot);
	+
	+kvm_pfn_t gfn_to_pfn_page_memslot(struct kvm_memory_slot *slot, gfn_t gfn,
	+ struct page **page)
	+{
	+ return __gfn_to_pfn_page_memslot(slot, gfn, false, NULL, true,
	+ NULL, NULL, page);
	+}
	+EXPORT_SYMBOL_GPL(gfn_to_pfn_page_memslot);
	+
	+kvm_pfn_t gfn_to_pfn_page_memslot_atomic(struct kvm_memory_slot *slot,
	+ gfn_t gfn, struct page **page)
	+{
	+ return __gfn_to_pfn_page_memslot(slot, gfn, true, NULL, true, NULL,
	+ NULL, page);
	+}
	+EXPORT_SYMBOL_GPL(gfn_to_pfn_page_memslot_atomic);
	+
	+kvm_pfn_t kvm_vcpu_gfn_to_pfn_page_atomic(struct kvm_vcpu *vcpu, gfn_t gfn,
	+ struct page **page)
	+{
	+ return gfn_to_pfn_page_memslot_atomic(
	+ kvm_vcpu_gfn_to_memslot(vcpu, gfn), gfn, page);
	+}
	+EXPORT_SYMBOL_GPL(kvm_vcpu_gfn_to_pfn_page_atomic);
	+
	+kvm_pfn_t gfn_to_pfn_page(struct kvm kvm, gfn_t gfn, struct page *page)
	+{
	+ return gfn_to_pfn_page_memslot(gfn_to_memslot(kvm, gfn), gfn, page);
	+}
	+EXPORT_SYMBOL_GPL(gfn_to_pfn_page);
	+
	+kvm_pfn_t kvm_vcpu_gfn_to_pfn_page(struct kvm_vcpu *vcpu, gfn_t gfn,
	+ struct page **page)
	+{
	+ return gfn_to_pfn_page_memslot(kvm_vcpu_gfn_to_memslot(vcpu, gfn),
	+ gfn, page);
	+}
	+EXPORT_SYMBOL_GPL(kvm_vcpu_gfn_to_pfn_page);
	+
	+static kvm_pfn_t ensure_pfn_ref(struct page *page, kvm_pfn_t pfn)
	+{
	+ if (page \|\| is_error_pfn(pfn) \|\| kvm_is_reserved_pfn(pfn))
	+ return pfn;
	+
	+ /*
	+ * Certain IO or PFNMAP mappings can be backed with valid
	+ * struct pages, but be allocated without refcounting e.g.,
	+ * tail pages of non-compound higher order allocations, which
	+ * would then underflow the refcount when the caller does the
	+ * required put_page. Don't allow those pages here.
	+ */
	+ if (get_page_unless_zero(pfn_to_page(pfn)))
	+ return pfn;
	+
	+ return KVM_PFN_ERR_FAULT;
	+}
	+
	+kvm_pfn_t __gfn_to_pfn_memslot(struct kvm_memory_slot *slot, gfn_t gfn,
	+ bool atomic, bool *async, bool write_fault,
	+ bool writable, hva_t hva)
	+{
	+ struct page *page;
	+ kvm_pfn_t pfn;
	+
	+ pfn = __gfn_to_pfn_page_memslot(slot, gfn, atomic, async,
	+ write_fault, writable, hva, &page);
	+
	+ return ensure_pfn_ref(page, pfn);
	}
	EXPORT_SYMBOL_GPL(__gfn_to_pfn_memslot);

	kvm_pfn_t gfn_to_pfn_prot(struct kvm *kvm, gfn_t gfn, bool write_fault,
	bool *writable)
	{
	- return __gfn_to_pfn_memslot(gfn_to_memslot(kvm, gfn), gfn, false, NULL,
	- write_fault, writable, NULL);
	+ struct page *page;
	+ kvm_pfn_t pfn;
	+
	+ pfn = gfn_to_pfn_page_prot(kvm, gfn, write_fault, writable, &page);
	+
	+ return ensure_pfn_ref(page, pfn);
	}
	EXPORT_SYMBOL_GPL(gfn_to_pfn_prot);

	kvm_pfn_t gfn_to_pfn_memslot(struct kvm_memory_slot *slot, gfn_t gfn)
	{
	- return __gfn_to_pfn_memslot(slot, gfn, false, NULL, true, NULL, NULL);
	+ struct page *page;
	+ kvm_pfn_t pfn;
	+
	+ pfn = gfn_to_pfn_page_memslot(slot, gfn, &page);
	+
	+ return ensure_pfn_ref(page, pfn);
	}
	EXPORT_SYMBOL_GPL(gfn_to_pfn_memslot);

	kvm_pfn_t gfn_to_pfn_memslot_atomic(struct kvm_memory_slot *slot, gfn_t gfn)
	{
	- return __gfn_to_pfn_memslot(slot, gfn, true, NULL, true, NULL, NULL);
	+ struct page *page;
	+ kvm_pfn_t pfn;
	+
	+ pfn = gfn_to_pfn_page_memslot_atomic(slot, gfn, &page);
	+
	+ return ensure_pfn_ref(page, pfn);
	}
	EXPORT_SYMBOL_GPL(gfn_to_pfn_memslot_atomic);

	kvm_pfn_t kvm_vcpu_gfn_to_pfn_atomic(struct kvm_vcpu *vcpu, gfn_t gfn)
	{
	- return gfn_to_pfn_memslot_atomic(kvm_vcpu_gfn_to_memslot(vcpu, gfn), gfn);
	+ struct page *page;
	+ kvm_pfn_t pfn;
	+
	+ pfn = kvm_vcpu_gfn_to_pfn_page_atomic(vcpu, gfn, &page);
	+
	+ return ensure_pfn_ref(page, pfn);
	}
	EXPORT_SYMBOL_GPL(kvm_vcpu_gfn_to_pfn_atomic);

	kvm_pfn_t gfn_to_pfn(struct kvm *kvm, gfn_t gfn)
	{
	- return gfn_to_pfn_memslot(gfn_to_memslot(kvm, gfn), gfn);
	+ struct page *page;
	+ kvm_pfn_t pfn;
	+
	+ pfn = gfn_to_pfn_page(kvm, gfn, &page);
	+
	+ return ensure_pfn_ref(page, pfn);
	}
	EXPORT_SYMBOL_GPL(gfn_to_pfn);

	kvm_pfn_t kvm_vcpu_gfn_to_pfn(struct kvm_vcpu *vcpu, gfn_t gfn)
	{
	- return gfn_to_pfn_memslot(kvm_vcpu_gfn_to_memslot(vcpu, gfn), gfn);
	+ struct page *page;
	+ kvm_pfn_t pfn;
	+
	+ pfn = kvm_vcpu_gfn_to_pfn_page(vcpu, gfn, &page);
	+
	+ return ensure_pfn_ref(page, pfn);
	}
	EXPORT_SYMBOL_GPL(kvm_vcpu_gfn_to_pfn);

	--
	2.33.0.464.g1972c5931b-goog