ShadowrunnerLeon
diff --git a/‎DllProjects/SpeechRecognitionModule.zip‎
14.9 MB b/‎DllProjects/SpeechRecognitionModule.zip‎
14.9 MB
diff --git a/‎Source/SmartCompanion/Commands/CommandHandler/CommandHandler.cpp‎
Lines changed: 6 additions & 3 deletions b/‎Source/SmartCompanion/Commands/CommandHandler/CommandHandler.cpp‎
Lines changed: 6 additions & 3 deletions
diff --git a/‎Source/SmartCompanion/Commands/CommandHandler/CommandHandler.h‎
Lines changed: 0 additions & 4 deletions b/‎Source/SmartCompanion/Commands/CommandHandler/CommandHandler.h‎
Lines changed: 0 additions & 4 deletions
diff --git a/‎Source/UEComputerVision/UEComputerVision.Build.cs‎
Lines changed: 1 addition & 0 deletions b/‎Source/UEComputerVision/UEComputerVision.Build.cs‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎Source/UESpeechRecognition/UESpeechRecognition.Build.cs‎
Lines changed: 6 additions & 17 deletions b/‎Source/UESpeechRecognition/UESpeechRecognition.Build.cs‎
Lines changed: 6 additions & 17 deletions
diff --git a/‎Source/UESpeechRecognition/UESpeechRecognitionModule.cpp‎
Lines changed: 18 additions & 155 deletions b/‎Source/UESpeechRecognition/UESpeechRecognitionModule.cpp‎
Lines changed: 18 additions & 155 deletions
diff --git a/‎Source/UESpeechRecognition/UESpeechRecognitionModule.h‎
Lines changed: 6 additions & 31 deletions b/‎Source/UESpeechRecognition/UESpeechRecognitionModule.h‎
Lines changed: 6 additions & 31 deletions
@@ -41,7 +41,10 @@ bool CommandHandler::Init()
 
 	commandStorage.Add(FString("red"), TSharedPtr<ICommand>(new KillRed()));
 	commandStorage.Add(FString("read"), TSharedPtr<ICommand>(new KillRed()));
+	commandStorage.Add(FString("and"), TSharedPtr<ICommand>(new KillRed()));
+	commandStorage.Add(FString("read"), TSharedPtr<ICommand>(new KillRed()));
 	commandStorage.Add(FString("blue"), TSharedPtr<ICommand>(new KillBlue()));
+	commandStorage.Add(FString("you"), TSharedPtr<ICommand>(new KillBlue()));
 
 	bRunThread = true;
 	return true;
@@ -53,8 +56,8 @@ uint32 CommandHandler::Run()
 	{
 		if (isActivateSpeechRecognition)
 		{
-			//FindCommand();
-			commandStorage[FString("blue")]->Run();
+			for (int i = 0; i < 10; ++i) FindCommand();
+			//commandStorage[FString("blue")]->Run();
 			isActivateSpeechRecognition = false;
 		}
 	}
@@ -69,7 +72,7 @@ void CommandHandler::Stop()
 
 void CommandHandler::FindCommand()
 {
-	auto text = speechRecoginitonModule.Run();
+	std::string text(SPEECHRECOGNITION_SINGLETON.Run());
 
 	for (auto& [key, value] : commandStorage)
 	{
 
@@ -33,9 +33,5 @@ class CommandHandler : public FRunnable
 
 		bool isActivateSpeechRecognition;
 		TMap<FString, TSharedPtr<ICommand>> commandStorage;
-
-		UESpeechRecognitionModule speechRecoginitonModule;
-		UEComputerVisionModule computerVisionModule;
-
 		UWorld* worldContext;
 };
@@ -25,6 +25,7 @@ public void LoadComputerVisionModule(ReadOnlyTargetRules Target)
         //PublicDelayLoadDLLs.Add("ComputerVisionModule.dll");
 
         CopyToBinaries(baseDir + "\\ThirdParty\\ComputerVisionModule\\bin\\ComputerVisionModule.dll", Target);
+        CopyToBinaries(baseDir + "\\ThirdParty\\OpenCV\\bin\\opencv_world470.dll", Target);
     }
 
     public UEComputerVision(ReadOnlyTargetRules Target) : base(Target)
 
@@ -18,29 +18,19 @@ private void CopyToBinaries(string Filepath, ReadOnlyTargetRules Target)
             File.Copy(Filepath, Path.Combine(binariesDir, filename), true);
     }
 
-    public void LoadVosk(ReadOnlyTargetRules Target)
+    public void LoadSpeechRecognitionModule(ReadOnlyTargetRules Target)
     {
-        PublicAdditionalLibraries.Add(baseDir + "\\ThirdParty\\Vosk\\vosk-win64\\libvosk.lib");
-        PublicIncludePaths.Add(baseDir + "\\ThirdParty\\Vosk\\vosk-win64");
-        RuntimeDependencies.Add(baseDir + "\\ThirdParty\\Vosk\\vosk-win64\\libvosk.dll");
-        PublicDelayLoadDLLs.Add("libvosk.dll");
+        PublicAdditionalLibraries.Add(baseDir + "\\ThirdParty\\SpeechRecognitionModule\\lib\\SpeechRecognitionModule.lib");
+        RuntimeDependencies.Add(baseDir + "\\ThirdParty\\SpeechRecognitionModule\\bin\\SpeechRecognitionModule.dll");
 
+        CopyToBinaries(baseDir + "\\ThirdParty\\SpeechRecognitionModule\\bin\\SpeechRecognitionModule.dll", Target);
+        CopyToBinaries(baseDir + "\\ThirdParty\\PortAudio\\Lib\\Release\\portaudio_x64.dll", Target);
         CopyToBinaries(baseDir + "\\ThirdParty\\Vosk\\vosk-win64\\libgcc_s_seh-1.dll", Target);
         CopyToBinaries(baseDir + "\\ThirdParty\\Vosk\\vosk-win64\\libstdc++-6.dll", Target);
         CopyToBinaries(baseDir + "\\ThirdParty\\Vosk\\vosk-win64\\libwinpthread-1.dll", Target);
         CopyToBinaries(baseDir + "\\ThirdParty\\Vosk\\vosk-win64\\libvosk.dll", Target);
     }
 
-    public void LoadPortAudio(ReadOnlyTargetRules Target)
-    {
-        PublicAdditionalLibraries.Add(baseDir + "\\ThirdParty\\PortAudio\\Lib\\Release\\portaudio_x64.lib");
-        PublicIncludePaths.Add(baseDir + "\\ThirdParty\\PortAudio\\Include");
-        RuntimeDependencies.Add(baseDir + "\\ThirdParty\\PortAudio\\Lib\\Release\\portaudio_x64.dll");
-        PublicDelayLoadDLLs.Add("portaudio_x64.dll");
-
-        CopyToBinaries(baseDir + "\\ThirdParty\\PortAudio\\Lib\\Release\\portaudio_x64.dll", Target);
-    }
-
     public UESpeechRecognition(ReadOnlyTargetRules Target) : base(Target)
 	{
         bEnableExceptions = true;
@@ -50,7 +40,6 @@ public UESpeechRecognition(ReadOnlyTargetRules Target) : base(Target)
             "Core"
         });
 
-        LoadVosk(Target);
-        LoadPortAudio(Target);
+        LoadSpeechRecognitionModule(Target);
     }
 }
@@ -1,182 +1,45 @@
 // Copyright Epic Games, Inc. All Rights Reserved.
 
 #include "UESpeechRecognitionModule.h"
-#include "simpleson/json.h"
 #include "Modules/ModuleManager.h"
 
-void UESpeechRecognitionModule::StartupVosk()
+void UESpeechRecognitionModule::StartupUESpeechRecognitionModule()
 {
-	const FString LibVoskPath = FPaths::Combine(*BasePluginDir, TEXT("Binaries/Win64/libvosk.dll"));
-	DynamicLibVoskHandle = FPlatformProcess::GetDllHandle(*LibVoskPath);
+	const FString LibSpeechRecognitionModule = FPaths::Combine("E:/SmartCompanion/", TEXT("Binaries/Win64/SpeechRecognitionModule.dll"));
+	DynamicLibSpeechRecognitionModuleHandle = FPlatformProcess::GetDllHandle(*LibSpeechRecognitionModule);
 
-	if (DynamicLibVoskHandle)
+	if (DynamicLibSpeechRecognitionModuleHandle)
 	{
-		UE_LOG(LogTemp, Log, TEXT("libvosk.dll loaded successfully!"));
+		UE_LOG(LogTemp, Log, TEXT("SpeechRecognitionModule.dll loaded successfully!"));
 	}
 	else
 	{
-		UE_LOG(LogTemp, Fatal, TEXT("libvosk.dll failed to load!"));
+		UE_LOG(LogTemp, Fatal, TEXT("SpeechRecognitionModule.dll failed to load!"));
 	}
 }
 
-void UESpeechRecognitionModule::StatupPortAudio()
+void UESpeechRecognitionModule::ShutdownUESpeechRecognitionModule()
 {
-	const FString LibPortAudioPath = FPaths::Combine(*BasePluginDir, TEXT("Binaries/Win64/portaudio_x64.dll"));
-	DynamicLibPortAudioHandle = FPlatformProcess::GetDllHandle(*LibPortAudioPath);
-
-	if (DynamicLibPortAudioHandle)
-	{
-		UE_LOG(LogTemp, Log, TEXT("portaudio_x64.dll loaded successfully!"));
-	}
-	else
-	{
-		UE_LOG(LogTemp, Fatal, TEXT("portaudio_x64.dll failed to load!"));
-	}
-}
-
-void UESpeechRecognitionModule::ShutdownVosk()
-{
-	if (DynamicLibVoskHandle) FPlatformProcess::FreeDllHandle(DynamicLibVoskHandle);
-	DynamicLibVoskHandle = nullptr;
-}
-
-void UESpeechRecognitionModule::ShutdownPortAudio()
-{
-	if (DynamicLibPortAudioHandle) FPlatformProcess::FreeDllHandle(DynamicLibPortAudioHandle);
-	DynamicLibPortAudioHandle = nullptr;
+	FPlatformProcess::FreeDllHandle(DynamicLibSpeechRecognitionModuleHandle);
+	DynamicLibSpeechRecognitionModuleHandle = nullptr;
 }
 
 void UESpeechRecognitionModule::StartupModule()
 {
-	//StartupVosk();
-	//StatupPortAudio();
-
-	if (!InializeModelAndRecognizer()) return;
-	if (!InitializePortAudio()) return;
-	if (!SetAudioDevice()) return;
-	if (!OpenStream()) return;
-	if (!StartStream()) return;
-}
-
-void UESpeechRecognitionModule::ShutdownModule()
-{
-	Pa_CloseStream(stream);
-	vosk_recognizer_free(recognizer);
-	vosk_model_free(model);
-
-	//if (DynamicLibVoskHandle) ShutdownVosk();
-	//if (DynamicLibPortAudioHandle) ShutdownPortAudio();
-}
-
-bool UESpeechRecognitionModule::InializeModelAndRecognizer()
-{
-	std::string path = baseDir + "\\Models\\Vosk\\vosk-model-small-en-us-0.15";
-	
-	model = vosk_model_new(path.c_str());
-	if (!model)
-	{
-		UE_LOG(LogTemp, Display, TEXT("vosk_model_new: error"));
-		return false;
-	}
-
-	recognizer = vosk_recognizer_new(model, 16000.0);
-	if (!recognizer)
-	{
-		UE_LOG(LogTemp, Display, TEXT("vosk_recognizer_new: error"));
-		return false;
-	}
-
-	return true;
-}
-
-bool UESpeechRecognitionModule::InitializePortAudio()
-{
-	PaError err = Pa_Initialize();
-	if (err != paNoError)
-	{
-		UE_LOG(LogTemp, Display, TEXT("Pa_Initialize: "), Pa_GetErrorText(err));
-		return false;
-	}
-
-	return true;
-}
-
-bool UESpeechRecognitionModule::SetAudioDevice()
-{
-	inputParametrs.channelCount = 1;
-	inputParametrs.sampleFormat = paInt16;
-	inputParametrs.hostApiSpecificStreamInfo = nullptr;
-	inputParametrs.device = Pa_GetDefaultInputDevice();
+	StartupUESpeechRecognitionModule();
 
-	if (inputParametrs.device == paNoDevice)
-	{
-		UE_LOG(LogTemp, Display, TEXT("Pa_GetDefaultInputDevice: no device"));
-		return false;
-	}
-
-	return true;
-}
-
-bool UESpeechRecognitionModule::OpenStream()
-{
-	PaError err = Pa_OpenStream(&stream, &inputParametrs, nullptr, 16000.0, 8192, 0, nullptr, nullptr);
-	if (err != paNoError)
-	{
-		UE_LOG(LogTemp, Display, TEXT("Pa_OpenStream: "), Pa_GetErrorText(err));
-		return false;
-	}
-
-	return true;
-}
-
-bool UESpeechRecognitionModule::StartStream()
-{
-	PaError err = Pa_StartStream(stream);
-	if (err != paNoError)
-	{
-		UE_LOG(LogTemp, Display, TEXT("Pa_StartStream: "), Pa_GetErrorText(err));
-		return false;
-	}
+	Initialize = (const char*(*)())(FPlatformProcess::GetDllExport(DynamicLibSpeechRecognitionModuleHandle, TEXT("Initialize")));
+	Run = (const char* (*)())(FPlatformProcess::GetDllExport(DynamicLibSpeechRecognitionModuleHandle, TEXT("Run")));
+	Shutdown = (void(*)())(FPlatformProcess::GetDllExport(DynamicLibSpeechRecognitionModuleHandle, TEXT("Shutdown")));
 
-	return true;
+	FString resInitialize(Initialize());
+	UE_LOG(LogTemp, Display, TEXT("%s"), FString(resInitialize));
 }
 
-std::string UESpeechRecognitionModule::Run()
-{
-	bool isCorrectRead = ReadDataFromStream();
-	if (!isCorrectRead) return {};
-
-	std::string recognizedText = Recognize();
-	return recognizedText;
-}
-
-bool UESpeechRecognitionModule::ReadDataFromStream()
-{
-	PaError err = Pa_ReadStream(stream, (void*)data, SPEECH_BUFFER_SIZE / 2);
-	if (err != paNoError && err != paInputOverflowed)
-	{
-		UE_LOG(LogTemp, Display, TEXT("Pa_ReadStream: "), Pa_GetErrorText(err));
-		return false;
-	}
-
-	return true;
-}
-
-std::string UESpeechRecognitionModule::Recognize()
+void UESpeechRecognitionModule::ShutdownModule()
 {
-	if (vosk_recognizer_accept_waveform(recognizer, data, sizeof(data)) == -1)
-	{
-		UE_LOG(LogTemp, Display, TEXT("vosk_recognizer_accept_waveform: error"));
-		return {};
-	}
-
-	auto resRegonition(vosk_recognizer_result(recognizer));
-	auto resJSON = json::jobject::parse(resRegonition);
-
-	FString textFString(resJSON.get("text").c_str());
-	UE_LOG(LogTemp, Display, TEXT("TEXT: %s"), *textFString);
-
-	return resJSON.get("text");
+	Shutdown();
+	ShutdownUESpeechRecognitionModule();
 }
 
 IMPLEMENT_MODULE(UESpeechRecognitionModule, UESpeechRecognition);
 
@@ -6,48 +6,23 @@
 #include "../ConfigData.h"
 #include "../ISmartModule.h"
 
-#pragma comment(lib, "E:\\SmartCompanion\\ThirdParty\\PortAudio\\Lib\\Release\\portaudio_static_x64.lib")
-#pragma comment(lib, "E:\\SmartCompanion\\ThirdParty\\Vosk\\vosk-win64\\libvosk.lib")
-
-#include "..\..\ThirdParty\PortAudio\Include\portaudio.h"
-#include "..\..\ThirdParty\Vosk\vosk-win64\vosk_api.h"
-
 #define SPEECHRECOGNITION_SINGLETON 	((UESpeechRecognitionModule&)(FModuleManager::Get().LoadModuleChecked(TEXT("UESpeechRecognition"))))
 
 class UESpeechRecognitionModule : public ISmartModule
 {
 	private:
-		VoskModel* model;
-		VoskRecognizer* recognizer;
-		PaStream* stream;
-		PaStreamParameters inputParametrs;
-
-		char data[SPEECH_BUFFER_SIZE];
-
-		const FString BasePluginDir = "E:/SmartCompanion";
-
-		void* DynamicLibVoskHandle;
-		void* DynamicLibPortAudioHandle;
+		void* DynamicLibSpeechRecognitionModuleHandle;
 
 	private:
-		bool InializeModelAndRecognizer();
-		bool InitializePortAudio();
-		bool SetAudioDevice();
-		bool OpenStream();
-		bool StartStream();
-		
-		bool ReadDataFromStream();
-		std::string Recognize();
-
-		void StartupVosk();
-		void StatupPortAudio();
+		const char* (*Initialize)();
+    	void (*Shutdown)();
 
-		void ShutdownVosk();
-		void ShutdownPortAudio();
+		void StartupUESpeechRecognitionModule();
+		void ShutdownUESpeechRecognitionModule();
 
 	public:
 		UESPEECHRECOGNITION_API void StartupModule() override;
 		UESPEECHRECOGNITION_API void ShutdownModule() override;
 
-		UESPEECHRECOGNITION_API std::string Run();
+		const char* (*Run)();
 };
Original file line number	Diff line number	Diff line change
`@@ -41,7 +41,10 @@ bool CommandHandler::Init()`
`41`	`41`
`42`	`42`	`commandStorage.Add(FString("red"), TSharedPtr<ICommand>(new KillRed()));`
`43`	`43`	`commandStorage.Add(FString("read"), TSharedPtr<ICommand>(new KillRed()));`
	`44`	`+ commandStorage.Add(FString("and"), TSharedPtr<ICommand>(new KillRed()));`
	`45`	`+ commandStorage.Add(FString("read"), TSharedPtr<ICommand>(new KillRed()));`
`44`	`46`	`commandStorage.Add(FString("blue"), TSharedPtr<ICommand>(new KillBlue()));`
	`47`	`+ commandStorage.Add(FString("you"), TSharedPtr<ICommand>(new KillBlue()));`
`45`	`48`
`46`	`49`	`bRunThread = true;`
`47`	`50`	`return true;`
`@@ -53,8 +56,8 @@ uint32 CommandHandler::Run()`
`53`	`56`	`{`
`54`	`57`	`if (isActivateSpeechRecognition)`
`55`	`58`	`{`
`56`		`- //FindCommand();`
`57`		`- commandStorage[FString("blue")]->Run();`
	`59`	`+ for (int i = 0; i < 10; ++i) FindCommand();`
	`60`	`+ //commandStorage[FString("blue")]->Run();`
`58`	`61`	`isActivateSpeechRecognition = false;`
`59`	`62`	`}`
`60`	`63`	`}`
`@@ -69,7 +72,7 @@ void CommandHandler::Stop()`
`69`	`72`
`70`	`73`	`void CommandHandler::FindCommand()`
`71`	`74`	`{`
`72`		`- auto text = speechRecoginitonModule.Run();`
	`75`	`+ std::string text(SPEECHRECOGNITION_SINGLETON.Run());`
`73`	`76`
`74`	`77`	`for (auto& [key, value] : commandStorage)`
`75`	`78`	`{`
Original file line number	Diff line number	Diff line change
`@@ -25,6 +25,7 @@ public void LoadComputerVisionModule(ReadOnlyTargetRules Target)`
`25`	`25`	`//PublicDelayLoadDLLs.Add("ComputerVisionModule.dll");`
`26`	`26`
`27`	`27`	`CopyToBinaries(baseDir + "\\ThirdParty\\ComputerVisionModule\\bin\\ComputerVisionModule.dll", Target);`
	`28`	`+ CopyToBinaries(baseDir + "\\ThirdParty\\OpenCV\\bin\\opencv_world470.dll", Target);`
`28`	`29`	`}`
`29`	`30`
`30`	`31`	`public UEComputerVision(ReadOnlyTargetRules Target) : base(Target)`