blob: 3808cdd2fe1c9b5019974ba9e1710501e78c2ed8 [file] [log] [blame]
; NOTE: Assertions have been autogenerated by utils/update_test_checks.py
; RUN: opt -loop-idiom < %s -S | FileCheck %s
; CHECK: source_filename
; CHECK-NOT; bcmp
; CHECK-NOT; memcmp
target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64"
define i1 @three_blocks_and_two_latches_in_loop(i8* %ptr0, i8* %ptr1) {
entry:
br label %for.body
for.body:
%i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ], [ 0, %for.passthrough ]
%arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08
%v0 = load i8, i8* %arrayidx
%arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08
%v1 = load i8, i8* %arrayidx1
%cmp3 = icmp eq i8 %v0, %v1
%inc = add nuw nsw i64 %i.08, 1
br i1 %cmp3, label %for.passthrough, label %cleanup
for.passthrough:
br i1 true, label %for.cond, label %for.body
for.cond:
%cmp = icmp ult i64 %inc, 8
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.cond ]
ret i1 %res
}
define i1 @three_blocks_in_loop(i8* %ptr0, i8* %ptr1) {
entry:
br label %for.body
for.body:
%i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ]
%arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08
%v0 = load i8, i8* %arrayidx
%arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08
%v1 = load i8, i8* %arrayidx1
%cmp3 = icmp eq i8 %v0, %v1
%inc = add nuw nsw i64 %i.08, 1
br i1 %cmp3, label %for.passthrough, label %cleanup
for.passthrough:
br label %for.cond
for.cond:
%cmp = icmp ult i64 %inc, 8
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.cond ]
ret i1 %res
}
define i1 @exit_block_is_not_dedicated(i8* %ptr0, i8* %ptr1) {
entry:
br i1 true, label %for.body, label %cleanup
for.body:
%i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ]
%arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08
%v0 = load i8, i8* %arrayidx
%arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08
%v1 = load i8, i8* %arrayidx1
%cmp3 = icmp eq i8 %v0, %v1
%inc = add nuw nsw i64 %i.08, 1
br i1 %cmp3, label %for.cond, label %cleanup
for.cond:
%cmp = icmp ult i64 %inc, 8
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.cond ], [ false, %entry ]
ret i1 %res
}
define i1 @body_cmp_is_not_equality(i8* %ptr0, i8* %ptr1) {
entry:
br label %for.body
for.body:
%i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ]
%arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08
%v0 = load i8, i8* %arrayidx
%arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08
%v1 = load i8, i8* %arrayidx1
%cmp3 = icmp ult i8 %v0, %v1
%inc = add nuw nsw i64 %i.08, 1
br i1 %cmp3, label %for.cond, label %cleanup
for.cond:
%cmp = icmp ult i64 %inc, 8
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.cond ]
ret i1 %res
}
define i1 @only_one_load(i8* %ptr0, i8* %ptr1) {
entry:
br label %for.body
for.body:
%i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ]
%arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08
%v0 = load i8, i8* %arrayidx
%cmp3 = icmp eq i8 %v0, 0
%inc = add nuw nsw i64 %i.08, 1
br i1 %cmp3, label %for.cond, label %cleanup
for.cond:
%cmp = icmp ult i64 %inc, 8
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.cond ]
ret i1 %res
}
define i1 @loads_of_less_than_byte(i7* %ptr0, i7* %ptr1) {
entry:
br label %for.body
for.body:
%i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ]
%arrayidx = getelementptr inbounds i7, i7* %ptr0, i64 %i.08
%v0 = load i7, i7* %arrayidx
%arrayidx1 = getelementptr inbounds i7, i7* %ptr1, i64 %i.08
%v1 = load i7, i7* %arrayidx1
%cmp3 = icmp ult i7 %v0, %v1
%inc = add nuw nsw i64 %i.08, 1
br i1 %cmp3, label %for.cond, label %cleanup
for.cond:
%cmp = icmp ult i64 %inc, 8
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.cond ]
ret i1 %res
}
define i1 @loads_of_not_multiple_of_a_byte(i9* %ptr0, i9* %ptr1) {
entry:
br label %for.body
for.body:
%i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ]
%arrayidx = getelementptr inbounds i9, i9* %ptr0, i64 %i.08
%v0 = load i9, i9* %arrayidx
%arrayidx1 = getelementptr inbounds i9, i9* %ptr1, i64 %i.08
%v1 = load i9, i9* %arrayidx1
%cmp3 = icmp ult i9 %v0, %v1
%inc = add nuw nsw i64 %i.08, 1
br i1 %cmp3, label %for.cond, label %cleanup
for.cond:
%cmp = icmp ult i64 %inc, 8
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.cond ]
ret i1 %res
}
define i1 @loop_instruction_used_in_phi_node_outside_loop(i8* %ptr0, i8* %ptr1) {
entry:
br label %for.body
for.body:
%i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ]
%arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08
%v0 = load i8, i8* %arrayidx
%arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08
%v1 = load i8, i8* %arrayidx1
%cmp3 = icmp eq i8 %v0, %v1
%inc = add nuw nsw i64 %i.08, 1
br i1 %cmp3, label %for.cond, label %cleanup
for.cond:
%cmp = icmp ult i64 %inc, 8
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ %cmp3, %for.body ], [ true, %for.cond ]
ret i1 %res
}
define i1 @loop_has_write(i8* %ptr0, i8* %ptr1, i32* %write) {
entry:
br label %for.body
for.body:
%i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ]
%arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08
%v0 = load i8, i8* %arrayidx
%arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08
%v1 = load i8, i8* %arrayidx1
%cmp3 = icmp eq i8 %v0, %v1
%inc = add nuw nsw i64 %i.08, 1
br i1 %cmp3, label %for.cond, label %cleanup
for.cond:
%cmp = icmp ult i64 %inc, 8
store i32 0, i32* %write
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.cond ]
ret i1 %res
}
declare void @sink()
define i1 @loop_has_call(i8* %ptr0, i8* %ptr1, i32* %load) {
entry:
br label %for.body
for.body:
%i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ]
%arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08
%v0 = load i8, i8* %arrayidx
%arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08
%v1 = load i8, i8* %arrayidx1
%cmp3 = icmp eq i8 %v0, %v1
%inc = add nuw nsw i64 %i.08, 1
br i1 %cmp3, label %for.cond, label %cleanup
for.cond:
%cmp = icmp ult i64 %inc, 8
tail call void @sink()
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.cond ]
ret i1 %res
}
define i1 @loop_has_atomic_load(i8* %ptr0, i8* %ptr1, i32* %load) {
entry:
br label %for.body
for.body:
%i.08 = phi i64 [ 0, %entry ], [ %inc, %for.cond ]
%arrayidx = getelementptr inbounds i8, i8* %ptr0, i64 %i.08
%v0 = load i8, i8* %arrayidx
%arrayidx1 = getelementptr inbounds i8, i8* %ptr1, i64 %i.08
%v1 = load i8, i8* %arrayidx1
%cmp3 = icmp eq i8 %v0, %v1
%inc = add nuw nsw i64 %i.08, 1
br i1 %cmp3, label %for.cond, label %cleanup
for.cond:
%cmp = icmp ult i64 %inc, 8
%tmp = load atomic i32, i32* %load unordered, align 1
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.cond ]
ret i1 %res
}
define i1 @different_load_step(i8* %ptr) {
entry:
%add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8
br label %for.body
for.body:
%i.015 = phi i64 [ 0, %entry ], [ %inc, %for.inc ]
%ptr1.014 = phi i8* [ %add.ptr, %entry ], [ %add.ptr3, %for.inc ]
%ptr0.013 = phi i8* [ %ptr, %entry ], [ %incdec.ptr, %for.inc ]
%v0 = load i8, i8* %ptr0.013
%v1 = load i8, i8* %ptr1.014
%cmp2 = icmp eq i8 %v0, %v1
br i1 %cmp2, label %for.inc, label %cleanup
for.inc:
%inc = add nuw nsw i64 %i.015, 1
%incdec.ptr = getelementptr inbounds i8, i8* %ptr0.013, i64 1
%add.ptr3 = getelementptr inbounds i8, i8* %ptr1.014, i64 2
%cmp = icmp ult i64 %inc, 16
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.inc ]
ret i1 %res
}
define i1 @step_is_variable(i8* %ptr, i64 %step) {
entry:
%add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8
br label %for.body
for.body:
%i.015 = phi i64 [ 0, %entry ], [ %inc, %for.inc ]
%ptr1.014 = phi i8* [ %add.ptr, %entry ], [ %add.ptr3, %for.inc ]
%ptr0.013 = phi i8* [ %ptr, %entry ], [ %incdec.ptr, %for.inc ]
%v0 = load i8, i8* %ptr0.013
%v1 = load i8, i8* %ptr1.014
%cmp2 = icmp eq i8 %v0, %v1
br i1 %cmp2, label %for.inc, label %cleanup
for.inc:
%inc = add nuw nsw i64 %i.015, %step
%incdec.ptr = getelementptr inbounds i8, i8* %ptr0.013, i64 1
%add.ptr3 = getelementptr inbounds i8, i8* %ptr1.014, i64 1
%cmp = icmp ult i64 %inc, 16
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.inc ]
ret i1 %res
}
define i1 @load_step_is_variable(i8* %ptr, i64 %step) {
entry:
%add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8
br label %for.body
for.body:
%i.015 = phi i64 [ 0, %entry ], [ %inc, %for.inc ]
%ptr1.014 = phi i8* [ %add.ptr, %entry ], [ %add.ptr3, %for.inc ]
%ptr0.013 = phi i8* [ %ptr, %entry ], [ %incdec.ptr, %for.inc ]
%v0 = load i8, i8* %ptr0.013
%v1 = load i8, i8* %ptr1.014
%cmp2 = icmp eq i8 %v0, %v1
br i1 %cmp2, label %for.inc, label %cleanup
for.inc:
%inc = add nuw nsw i64 %i.015, 1
%incdec.ptr = getelementptr inbounds i8, i8* %ptr0.013, i64 %step
%add.ptr3 = getelementptr inbounds i8, i8* %ptr1.014, i64 %step
%cmp = icmp ult i64 %inc, 16
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.inc ]
ret i1 %res
}
define i1 @step_and_load_step_is_variable(i8* %ptr, i64 %step) {
entry:
%add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8
br label %for.body
for.body:
%i.015 = phi i64 [ 0, %entry ], [ %inc, %for.inc ]
%ptr1.014 = phi i8* [ %add.ptr, %entry ], [ %add.ptr3, %for.inc ]
%ptr0.013 = phi i8* [ %ptr, %entry ], [ %incdec.ptr, %for.inc ]
%v0 = load i8, i8* %ptr0.013
%v1 = load i8, i8* %ptr1.014
%cmp2 = icmp eq i8 %v0, %v1
br i1 %cmp2, label %for.inc, label %cleanup
for.inc:
%inc = add nuw nsw i64 %i.015, %step
%incdec.ptr = getelementptr inbounds i8, i8* %ptr0.013, i64 %step
%add.ptr3 = getelementptr inbounds i8, i8* %ptr1.014, i64 %step
%cmp = icmp ult i64 %inc, 16
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.inc ]
ret i1 %res
}
define i1 @load_step_not_affine(i8* %ptr) {
entry:
%add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8
br label %for.body
for.body:
%i.018 = phi i64 [ 0, %entry ], [ %inc, %for.inc ]
%ptr1.017 = phi i8* [ %add.ptr, %entry ], [ %add.ptr4, %for.inc ]
%ptr0.016 = phi i8* [ %ptr, %entry ], [ %add.ptr3, %for.inc ]
%v0 = load i8, i8* %ptr0.016
%v1 = load i8, i8* %ptr1.017
%cmp2 = icmp eq i8 %v0, %v1
br i1 %cmp2, label %for.inc, label %cleanup
for.inc:
%inc = add nuw nsw i64 %i.018, 1
%add.ptr3 = getelementptr inbounds i8, i8* %ptr0.016, i64 %inc
%add.ptr4 = getelementptr inbounds i8, i8* %ptr1.017, i64 %inc
%cmp = icmp ult i64 %inc, 16
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.inc ]
ret i1 %res
}
define i1 @no_overlap_between_loads(i8* %ptr) {
entry:
%add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8
br label %for.body
for.body:
%i.016 = phi i64 [ 0, %entry ], [ %inc, %for.inc ]
%ptr1.015 = phi i8* [ %add.ptr, %entry ], [ %add.ptr4, %for.inc ]
%ptr0.014 = phi i8* [ %ptr, %entry ], [ %add.ptr3, %for.inc ]
%v0 = load i8, i8* %ptr0.014
%v1 = load i8, i8* %ptr1.015
%cmp2 = icmp eq i8 %v0, %v1
br i1 %cmp2, label %for.inc, label %cleanup
for.inc:
%inc = add nuw nsw i64 %i.016, 1
%add.ptr3 = getelementptr inbounds i8, i8* %ptr0.014, i64 2
%add.ptr4 = getelementptr inbounds i8, i8* %ptr1.015, i64 2
%cmp = icmp ult i64 %inc, 16
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.inc ]
ret i1 %res
}
define i1 @volatile_loads(i8* %ptr) {
entry:
%add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8
br label %for.body
for.body:
%i.016 = phi i64 [ 0, %entry ], [ %inc, %for.inc ]
%ptr1.015 = phi i8* [ %add.ptr, %entry ], [ %add.ptr4, %for.inc ]
%ptr0.014 = phi i8* [ %ptr, %entry ], [ %add.ptr3, %for.inc ]
%v0 = load volatile i8, i8* %ptr0.014
%v1 = load volatile i8, i8* %ptr1.015
%cmp2 = icmp eq i8 %v0, %v1
br i1 %cmp2, label %for.inc, label %cleanup
for.inc:
%inc = add nuw nsw i64 %i.016, 1
%add.ptr3 = getelementptr inbounds i8, i8* %ptr0.014, i64 1
%add.ptr4 = getelementptr inbounds i8, i8* %ptr1.015, i64 1
%cmp = icmp ult i64 %inc, 16
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.inc ]
ret i1 %res
}
define i1 @atomic_loads(i8* %ptr) {
entry:
%add.ptr = getelementptr inbounds i8, i8* %ptr, i64 8
br label %for.body
for.body:
%i.016 = phi i64 [ 0, %entry ], [ %inc, %for.inc ]
%ptr1.015 = phi i8* [ %add.ptr, %entry ], [ %add.ptr4, %for.inc ]
%ptr0.014 = phi i8* [ %ptr, %entry ], [ %add.ptr3, %for.inc ]
%v0 = load atomic i8, i8* %ptr0.014 unordered, align 1
%v1 = load atomic i8, i8* %ptr1.015 unordered, align 1
%cmp2 = icmp eq i8 %v0, %v1
br i1 %cmp2, label %for.inc, label %cleanup
for.inc:
%inc = add nuw nsw i64 %i.016, 1
%add.ptr3 = getelementptr inbounds i8, i8* %ptr0.014, i64 1
%add.ptr4 = getelementptr inbounds i8, i8* %ptr1.015, i64 1
%cmp = icmp ult i64 %inc, 16
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.inc ]
ret i1 %res
}
define i1 @address_space(i8 addrspace(1)* %ptr) {
entry:
%add.ptr = getelementptr inbounds i8, i8 addrspace(1)* %ptr, i64 8
br label %for.body
for.body:
%i.016 = phi i64 [ 0, %entry ], [ %inc, %for.inc ]
%ptr1.015 = phi i8 addrspace(1)* [ %add.ptr, %entry ], [ %add.ptr4, %for.inc ]
%ptr0.014 = phi i8 addrspace(1)* [ %ptr, %entry ], [ %add.ptr3, %for.inc ]
%v0 = load i8, i8 addrspace(1)* %ptr0.014
%v1 = load i8, i8 addrspace(1)* %ptr1.015
%cmp2 = icmp eq i8 %v0, %v1
br i1 %cmp2, label %for.inc, label %cleanup
for.inc:
%inc = add nuw nsw i64 %i.016, 1
%add.ptr3 = getelementptr inbounds i8, i8 addrspace(1)* %ptr0.014, i64 1
%add.ptr4 = getelementptr inbounds i8, i8 addrspace(1)* %ptr1.015, i64 1
%cmp = icmp ult i64 %inc, 16
br i1 %cmp, label %for.body, label %cleanup
cleanup:
%res = phi i1 [ false, %for.body ], [ true, %for.inc ]
ret i1 %res
}