content/browser/ai/echo_ai_language_model.cc - chromium/src - Git at Google

 // Copyright 2024 The Chromium Authors
 // Use of this source code is governed by a BSD-style license that can be
 // found in the LICENSE file.

 #include "content/browser/ai/echo_ai_language_model.h"

 #include <optional>

 #include "base/functional/bind.h"
 #include "base/location.h"
 #include "base/time/time.h"
 #include "components/optimization_guide/core/optimization_guide_features.h"
 #include "content/browser/ai/echo_ai_manager_impl.h"
 #include "content/public/browser/browser_thread.h"
 #include "mojo/public/cpp/bindings/remote.h"
 #include "mojo/public/cpp/bindings/self_owned_receiver.h"
 #include "third_party/blink/public/mojom/ai/ai_common.mojom.h"
 #include "third_party/blink/public/mojom/ai/ai_language_model.mojom.h"
 #include "third_party/blink/public/mojom/ai/model_streaming_responder.mojom.h"

 namespace content {

 namespace {
 constexpr char kResponsePrefix[] =
     "On-device model is not available in Chromium, this API is just echoing "
     "back the input:\n";
 }

 EchoAILanguageModel::EchoAILanguageModel() = default;

 EchoAILanguageModel::~EchoAILanguageModel() = default;

 void EchoAILanguageModel::DoMockExecution(
     const std::string& input,
     mojo::RemoteSetElementId responder_id) {
   blink::mojom::ModelStreamingResponder* responder =
       responder_set_.Get(responder_id);
   if (!responder) {
     return;
   }

   if (input.size() > EchoAIManagerImpl::kMaxContextSizeInTokens) {
     responder->OnError(blink::mojom::ModelStreamingResponseStatus::
                            kErrorPromptRequestTooLarge);
     return;
   }
   if (current_tokens_ >
       EchoAIManagerImpl::kMaxContextSizeInTokens - input.size()) {
     current_tokens_ = input.size();
     responder->OnContextOverflow();
   }
   current_tokens_ += input.size();
   responder->OnStreaming(kResponsePrefix,
                          blink::mojom::ModelStreamingResponderAction::kAppend);
   responder->OnStreaming(input,
                          blink::mojom::ModelStreamingResponderAction::kAppend);
   responder->OnCompletion(
       blink::mojom::ModelExecutionContextInfo::New(current_tokens_));
 }

 void EchoAILanguageModel::Prompt(
     on_device_model::mojom::InputPtr input,
     mojo::PendingRemote<blink::mojom::ModelStreamingResponder>
         pending_responder) {
   if (is_destroyed_) {
     mojo::Remote<blink::mojom::ModelStreamingResponder> responder(
         std::move(pending_responder));
     responder->OnError(
         blink::mojom::ModelStreamingResponseStatus::kErrorSessionDestroyed);
     return;
   }

   CHECK_EQ(input->pieces.size(), 1u);
   CHECK(std::holds_alternative<std::string>(input->pieces[0]));
   const std::string& response = std::get<std::string>(input->pieces[0]);

   mojo::RemoteSetElementId responder_id =
       responder_set_.Add(std::move(pending_responder));
   // Simulate the time taken by model execution.
   content::GetUIThreadTaskRunner()->PostDelayedTask(
       FROM_HERE,
       base::BindOnce(&EchoAILanguageModel::DoMockExecution,
                      weak_ptr_factory_.GetWeakPtr(), response, responder_id),
       base::Seconds(1));
 }

 void EchoAILanguageModel::Fork(
     mojo::PendingRemote<blink::mojom::AIManagerCreateLanguageModelClient>
         client) {
   mojo::Remote<blink::mojom::AIManagerCreateLanguageModelClient> client_remote(
       std::move(client));
   mojo::PendingRemote<blink::mojom::AILanguageModel> language_model;

   mojo::MakeSelfOwnedReceiver(std::make_unique<EchoAILanguageModel>(),
                               language_model.InitWithNewPipeAndPassReceiver());
   client_remote->OnResult(
       std::move(language_model),
       blink::mojom::AILanguageModelInstanceInfo::New(
           EchoAIManagerImpl::kMaxContextSizeInTokens, current_tokens_,
           blink::mojom::AILanguageModelSamplingParams::New(
               optimization_guide::features::GetOnDeviceModelDefaultTopK(),
               optimization_guide::features::
                   GetOnDeviceModelDefaultTemperature()),
           std::nullopt));
 }

 void EchoAILanguageModel::Destroy() {
   is_destroyed_ = true;

   for (auto& responder : responder_set_) {
     responder->OnError(
         blink::mojom::ModelStreamingResponseStatus::kErrorSessionDestroyed);
   }
   responder_set_.Clear();
 }

 void EchoAILanguageModel::CountPromptTokens(
     const std::string& input,
     mojo::PendingRemote<blink::mojom::AILanguageModelCountPromptTokensClient>
         client) {
   mojo::Remote<blink::mojom::AILanguageModelCountPromptTokensClient>(
       std::move(client))
       ->OnResult(input.size());
 }

 }  // namespace content
	// Copyright 2024 The Chromium Authors
	// Use of this source code is governed by a BSD-style license that can be
	// found in the LICENSE file.

	#include "content/browser/ai/echo_ai_language_model.h"

	#include <optional>

	#include "base/functional/bind.h"
	#include "base/location.h"
	#include "base/time/time.h"
	#include "components/optimization_guide/core/optimization_guide_features.h"
	#include "content/browser/ai/echo_ai_manager_impl.h"
	#include "content/public/browser/browser_thread.h"
	#include "mojo/public/cpp/bindings/remote.h"
	#include "mojo/public/cpp/bindings/self_owned_receiver.h"
	#include "third_party/blink/public/mojom/ai/ai_common.mojom.h"
	#include "third_party/blink/public/mojom/ai/ai_language_model.mojom.h"
	#include "third_party/blink/public/mojom/ai/model_streaming_responder.mojom.h"

	namespace content {

	namespace {
	constexpr char kResponsePrefix[] =
	"On-device model is not available in Chromium, this API is just echoing "
	"back the input:\n";
	}

	EchoAILanguageModel::EchoAILanguageModel() = default;

	EchoAILanguageModel::~EchoAILanguageModel() = default;

	void EchoAILanguageModel::DoMockExecution(
	const std::string& input,
	mojo::RemoteSetElementId responder_id) {
	blink::mojom::ModelStreamingResponder* responder =
	responder_set_.Get(responder_id);
	if (!responder) {
	return;
	}

	if (input.size() > EchoAIManagerImpl::kMaxContextSizeInTokens) {
	responder->OnError(blink::mojom::ModelStreamingResponseStatus::
	kErrorPromptRequestTooLarge);
	return;
	}
	if (current_tokens_ >
	EchoAIManagerImpl::kMaxContextSizeInTokens - input.size()) {
	current_tokens_ = input.size();
	responder->OnContextOverflow();
	}
	current_tokens_ += input.size();
	responder->OnStreaming(kResponsePrefix,
	blink::mojom::ModelStreamingResponderAction::kAppend);
	responder->OnStreaming(input,
	blink::mojom::ModelStreamingResponderAction::kAppend);
	responder->OnCompletion(
	blink::mojom::ModelExecutionContextInfo::New(current_tokens_));
	}

	void EchoAILanguageModel::Prompt(
	on_device_model::mojom::InputPtr input,
	mojo::PendingRemote<blink::mojom::ModelStreamingResponder>
	pending_responder) {
	if (is_destroyed_) {
	mojo::Remote<blink::mojom::ModelStreamingResponder> responder(
	std::move(pending_responder));
	responder->OnError(
	blink::mojom::ModelStreamingResponseStatus::kErrorSessionDestroyed);
	return;
	}

	CHECK_EQ(input->pieces.size(), 1u);
	CHECK(std::holds_alternative<std::string>(input->pieces[0]));
	const std::string& response = std::get<std::string>(input->pieces[0]);

	mojo::RemoteSetElementId responder_id =
	responder_set_.Add(std::move(pending_responder));
	// Simulate the time taken by model execution.
	content::GetUIThreadTaskRunner()->PostDelayedTask(
	FROM_HERE,
	base::BindOnce(&EchoAILanguageModel::DoMockExecution,
	weak_ptr_factory_.GetWeakPtr(), response, responder_id),
	base::Seconds(1));
	}

	void EchoAILanguageModel::Fork(
	mojo::PendingRemote<blink::mojom::AIManagerCreateLanguageModelClient>
	client) {
	mojo::Remote<blink::mojom::AIManagerCreateLanguageModelClient> client_remote(
	std::move(client));
	mojo::PendingRemote<blink::mojom::AILanguageModel> language_model;

	mojo::MakeSelfOwnedReceiver(std::make_unique<EchoAILanguageModel>(),
	language_model.InitWithNewPipeAndPassReceiver());
	client_remote->OnResult(
	std::move(language_model),
	blink::mojom::AILanguageModelInstanceInfo::New(
	EchoAIManagerImpl::kMaxContextSizeInTokens, current_tokens_,
	blink::mojom::AILanguageModelSamplingParams::New(
	optimization_guide::features::GetOnDeviceModelDefaultTopK(),
	optimization_guide::features::
	GetOnDeviceModelDefaultTemperature()),
	std::nullopt));
	}

	void EchoAILanguageModel::Destroy() {
	is_destroyed_ = true;

	for (auto& responder : responder_set_) {
	responder->OnError(
	blink::mojom::ModelStreamingResponseStatus::kErrorSessionDestroyed);
	}
	responder_set_.Clear();
	}

	void EchoAILanguageModel::CountPromptTokens(
	const std::string& input,
	mojo::PendingRemote<blink::mojom::AILanguageModelCountPromptTokensClient>
	client) {
	mojo::Remote<blink::mojom::AILanguageModelCountPromptTokensClient>(
	std::move(client))
	->OnResult(input.size());
	}

	} // namespace content