dm/appengine/mutate/finish_execution.go - infra/luci/luci-go - Git at Google

 // Copyright 2016 The LUCI Authors.
 //
 // Licensed under the Apache License, Version 2.0 (the "License");
 // you may not use this file except in compliance with the License.
 // You may obtain a copy of the License at
 //
 //      http://www.apache.org/licenses/LICENSE-2.0
 //
 // Unless required by applicable law or agreed to in writing, software
 // distributed under the License is distributed on an "AS IS" BASIS,
 // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 // See the License for the specific language governing permissions and
 // limitations under the License.

 package mutate

 import (
 	"context"
 	"fmt"

 	ds "go.chromium.org/luci/gae/service/datastore"

 	"go.chromium.org/luci/common/logging"
 	dm "go.chromium.org/luci/dm/api/service/v1"
 	"go.chromium.org/luci/dm/appengine/model"
 	"go.chromium.org/luci/tumble"
 )

 // FinishExecution records the final state of the Execution, and advances the
 // Attempt state machine.
 type FinishExecution struct {
 	EID    *dm.Execution_ID
 	Result *dm.Result
 }

 // Root implements tumble.Mutation
 func (f *FinishExecution) Root(c context.Context) *ds.Key {
 	return model.ExecutionKeyFromID(c, f.EID)
 }

 // shouldRetry loads the quest for this attempt, to determine if the attempt can
 // be retried. As a side-effect, it increments the RetryState counter for the
 // indicated failure type.
 //
 // If stat is not a retryable AbnormalFinish_Status, this will panic.
 func shouldRetry(c context.Context, a *model.Attempt, stat dm.AbnormalFinish_Status) (retry bool, err error) {
 	if !stat.CouldRetry() {
 		return
 	}
 	q := model.QuestFromID(a.ID.Quest)

 	if err = ds.Get(ds.WithoutTransaction(c), q); err != nil {
 		return
 	}
 	var cur, max uint32
 	switch stat {
 	case dm.AbnormalFinish_FAILED:
 		cur, max = a.RetryState.Failed, q.Desc.Meta.Retry.Failed
 		a.RetryState.Failed++
 	case dm.AbnormalFinish_CRASHED:
 		cur, max = a.RetryState.Crashed, q.Desc.Meta.Retry.Crashed
 		a.RetryState.Crashed++
 	case dm.AbnormalFinish_EXPIRED:
 		cur, max = a.RetryState.Expired, q.Desc.Meta.Retry.Expired
 		a.RetryState.Expired++
 	case dm.AbnormalFinish_TIMED_OUT:
 		cur, max = a.RetryState.TimedOut, q.Desc.Meta.Retry.TimedOut
 		a.RetryState.TimedOut++
 	default:
 		panic(fmt.Errorf("do not know how to retry %q", stat))
 	}
 	retry = cur < max
 	return
 }

 // RollForward implements tumble.Mutation
 func (f *FinishExecution) RollForward(c context.Context) (muts []tumble.Mutation, err error) {
 	a := model.AttemptFromID(f.EID.AttemptID())
 	e := model.ExecutionFromID(c, f.EID)

 	if err = ds.Get(c, a, e); err != nil {
 		return
 	}

 	if a.State != dm.Attempt_EXECUTING || a.CurExecution != f.EID.Id || e.State.Terminal() {
 		logging.Errorf(c, "EARLY EXIT: %s: %s v %s: terminal: %s", a.State, a.CurExecution, f.EID.Id, e.State.Terminal())
 		return
 	}

 	if f.Result.AbnormalFinish == nil && e.State != dm.Execution_STOPPING {
 		f.Result.AbnormalFinish = &dm.AbnormalFinish{
 			Status: dm.AbnormalFinish_FAILED,
 			Reason: fmt.Sprintf("distributor finished execution while it was in the %s state.", e.State),
 		}
 	}

 	e.Result = *f.Result

 	if ab := e.Result.AbnormalFinish; ab != nil {
 		a.IsAbnormal = true
 		e.IsAbnormal = true
 		if err = e.ModifyState(c, dm.Execution_ABNORMAL_FINISHED); err != nil {
 			return
 		}

 		var retry bool
 		if retry, err = shouldRetry(c, a, ab.Status); err != nil {
 			return
 		} else if retry {
 			if err = a.ModifyState(c, dm.Attempt_SCHEDULING); err != nil {
 				return
 			}
 			a.DepMap.Reset()
 			muts = append(muts, &ScheduleExecution{&a.ID})
 		} else {
 			// ran out of retries, or non-retriable error type
 			if err = a.ModifyState(c, dm.Attempt_ABNORMAL_FINISHED); err != nil {
 				return
 			}
 			a.Result.AbnormalFinish = ab
 		}
 	} else {
 		if err = e.ModifyState(c, dm.Execution_FINISHED); err != nil {
 			return
 		}
 		a.LastSuccessfulExecution = uint32(e.ID)
 		a.RetryState.Reset()

 		if a.DepMap.Size() > 0 {
 			if a.DepMap.All(true) {
 				if err = a.ModifyState(c, dm.Attempt_SCHEDULING); err != nil {
 					return
 				}
 				a.DepMap.Reset()
 				muts = append(muts, &ScheduleExecution{&a.ID})
 			} else if err = a.ModifyState(c, dm.Attempt_WAITING); err != nil {
 				return
 			}
 		} else {
 			if err = a.ModifyState(c, dm.Attempt_FINISHED); err != nil {
 				return
 			}
 			muts = append(muts, &RecordCompletion{f.EID.AttemptID()})
 		}
 	}

 	// best-effort reset execution timeout
 	_ = ResetExecutionTimeout(c, e)

 	err = ds.Put(c, a, e)
 	return
 }

 // FinishExecutionFn is the implementation of distributor.FinishExecutionFn.
 // It's defined here to avoid a circular dependency.
 func FinishExecutionFn(c context.Context, eid *dm.Execution_ID, rslt *dm.Result) ([]tumble.Mutation, error) {
 	if rslt.Data != nil {
 		if normErr := rslt.Data.Normalize(); normErr != nil {
 			logging.WithError(normErr).Errorf(c, "Could not normalize distributor Result!")
 			rslt = &dm.Result{
 				AbnormalFinish: &dm.AbnormalFinish{
 					Status: dm.AbnormalFinish_RESULT_MALFORMED,
 					Reason: fmt.Sprintf("distributor result malformed: %q in %q", normErr, rslt.Data.Object),
 				},
 			}
 		}
 	}

 	return []tumble.Mutation{&FinishExecution{EID: eid, Result: rslt}}, nil
 }

 // NewFinishExecutionAbnormal is a shorthand to make a FinishExecution mutation
 // with some abnomal result.
 func NewFinishExecutionAbnormal(eid *dm.Execution_ID, status dm.AbnormalFinish_Status, reason string) *FinishExecution {
 	return &FinishExecution{
 		eid, &dm.Result{
 			AbnormalFinish: &dm.AbnormalFinish{Status: status, Reason: reason}}}
 }

 func init() {
 	tumble.Register((*FinishExecution)(nil))
 }
	// Copyright 2016 The LUCI Authors.
	//
	// Licensed under the Apache License, Version 2.0 (the "License");
	// you may not use this file except in compliance with the License.
	// You may obtain a copy of the License at
	//
	// http://www.apache.org/licenses/LICENSE-2.0
	//
	// Unless required by applicable law or agreed to in writing, software
	// distributed under the License is distributed on an "AS IS" BASIS,
	// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
	// See the License for the specific language governing permissions and
	// limitations under the License.

	package mutate

	import (
	"context"
	"fmt"

	ds "go.chromium.org/luci/gae/service/datastore"

	"go.chromium.org/luci/common/logging"
	dm "go.chromium.org/luci/dm/api/service/v1"
	"go.chromium.org/luci/dm/appengine/model"
	"go.chromium.org/luci/tumble"
	)

	// FinishExecution records the final state of the Execution, and advances the
	// Attempt state machine.
	type FinishExecution struct {
	EID *dm.Execution_ID
	Result *dm.Result
	}

	// Root implements tumble.Mutation
	func (f FinishExecution) Root(c context.Context) ds.Key {
	return model.ExecutionKeyFromID(c, f.EID)
	}

	// shouldRetry loads the quest for this attempt, to determine if the attempt can
	// be retried. As a side-effect, it increments the RetryState counter for the
	// indicated failure type.
	//
	// If stat is not a retryable AbnormalFinish_Status, this will panic.
	func shouldRetry(c context.Context, a *model.Attempt, stat dm.AbnormalFinish_Status) (retry bool, err error) {
	if !stat.CouldRetry() {
	return
	}
	q := model.QuestFromID(a.ID.Quest)

	if err = ds.Get(ds.WithoutTransaction(c), q); err != nil {
	return
	}
	var cur, max uint32
	switch stat {
	case dm.AbnormalFinish_FAILED:
	cur, max = a.RetryState.Failed, q.Desc.Meta.Retry.Failed
	a.RetryState.Failed++
	case dm.AbnormalFinish_CRASHED:
	cur, max = a.RetryState.Crashed, q.Desc.Meta.Retry.Crashed
	a.RetryState.Crashed++
	case dm.AbnormalFinish_EXPIRED:
	cur, max = a.RetryState.Expired, q.Desc.Meta.Retry.Expired
	a.RetryState.Expired++
	case dm.AbnormalFinish_TIMED_OUT:
	cur, max = a.RetryState.TimedOut, q.Desc.Meta.Retry.TimedOut
	a.RetryState.TimedOut++
	default:
	panic(fmt.Errorf("do not know how to retry %q", stat))
	}
	retry = cur < max
	return
	}

	// RollForward implements tumble.Mutation
	func (f *FinishExecution) RollForward(c context.Context) (muts []tumble.Mutation, err error) {
	a := model.AttemptFromID(f.EID.AttemptID())
	e := model.ExecutionFromID(c, f.EID)

	if err = ds.Get(c, a, e); err != nil {
	return
	}

	if a.State != dm.Attempt_EXECUTING \|\| a.CurExecution != f.EID.Id \|\| e.State.Terminal() {
	logging.Errorf(c, "EARLY EXIT: %s: %s v %s: terminal: %s", a.State, a.CurExecution, f.EID.Id, e.State.Terminal())
	return
	}

	if f.Result.AbnormalFinish == nil && e.State != dm.Execution_STOPPING {
	f.Result.AbnormalFinish = &dm.AbnormalFinish{
	Status: dm.AbnormalFinish_FAILED,
	Reason: fmt.Sprintf("distributor finished execution while it was in the %s state.", e.State),
	}
	}

	e.Result = *f.Result

	if ab := e.Result.AbnormalFinish; ab != nil {
	a.IsAbnormal = true
	e.IsAbnormal = true
	if err = e.ModifyState(c, dm.Execution_ABNORMAL_FINISHED); err != nil {
	return
	}

	var retry bool
	if retry, err = shouldRetry(c, a, ab.Status); err != nil {
	return
	} else if retry {
	if err = a.ModifyState(c, dm.Attempt_SCHEDULING); err != nil {
	return
	}
	a.DepMap.Reset()
	muts = append(muts, &ScheduleExecution{&a.ID})
	} else {
	// ran out of retries, or non-retriable error type
	if err = a.ModifyState(c, dm.Attempt_ABNORMAL_FINISHED); err != nil {
	return
	}
	a.Result.AbnormalFinish = ab
	}
	} else {
	if err = e.ModifyState(c, dm.Execution_FINISHED); err != nil {
	return
	}
	a.LastSuccessfulExecution = uint32(e.ID)
	a.RetryState.Reset()

	if a.DepMap.Size() > 0 {
	if a.DepMap.All(true) {
	if err = a.ModifyState(c, dm.Attempt_SCHEDULING); err != nil {
	return
	}
	a.DepMap.Reset()
	muts = append(muts, &ScheduleExecution{&a.ID})
	} else if err = a.ModifyState(c, dm.Attempt_WAITING); err != nil {
	return
	}
	} else {
	if err = a.ModifyState(c, dm.Attempt_FINISHED); err != nil {
	return
	}
	muts = append(muts, &RecordCompletion{f.EID.AttemptID()})
	}
	}

	// best-effort reset execution timeout
	_ = ResetExecutionTimeout(c, e)

	err = ds.Put(c, a, e)
	return
	}

	// FinishExecutionFn is the implementation of distributor.FinishExecutionFn.
	// It's defined here to avoid a circular dependency.
	func FinishExecutionFn(c context.Context, eid dm.Execution_ID, rslt dm.Result) ([]tumble.Mutation, error) {
	if rslt.Data != nil {
	if normErr := rslt.Data.Normalize(); normErr != nil {
	logging.WithError(normErr).Errorf(c, "Could not normalize distributor Result!")
	rslt = &dm.Result{
	AbnormalFinish: &dm.AbnormalFinish{
	Status: dm.AbnormalFinish_RESULT_MALFORMED,
	Reason: fmt.Sprintf("distributor result malformed: %q in %q", normErr, rslt.Data.Object),
	},
	}
	}
	}

	return []tumble.Mutation{&FinishExecution{EID: eid, Result: rslt}}, nil
	}

	// NewFinishExecutionAbnormal is a shorthand to make a FinishExecution mutation
	// with some abnomal result.
	func NewFinishExecutionAbnormal(eid dm.Execution_ID, status dm.AbnormalFinish_Status, reason string) FinishExecution {
	return &FinishExecution{
	eid, &dm.Result{
	AbnormalFinish: &dm.AbnormalFinish{Status: status, Reason: reason}}}
	}

	func init() {
	tumble.Register((*FinishExecution)(nil))
	}