MesserLab · bhaller · Dec 18, 2025 · Dec 17, 2025 · Dec 17, 2025 · Dec 17, 2025
diff --git a/VERSIONS b/VERSIONS
@@ -28,6 +28,7 @@ development head (in the master branch):
 	SIMD optimizations for spatial interaction strength calculations, thanks to Andy Kern, https://github.com/MesserLab/SLiM/pull/590
 	fix #593, Student's T distribution had a sign error in tdist(), thanks to Andy Kern, https://github.com/MesserLab/SLiM/issues/591
 	add comprehensive tests for spatial interaction kernel calculations; includes SIMD vs scalar consistency tests, C++ level tests, and script-level tests, thanks to Andy Kern, https://github.com/MesserLab/SLiM/pull/592
+	add SIMD acceleration for trig functions (sin(), cos(), tan(), asin(), acos(), atan(), atan2()), power functions (^ opperator, pow, SpatialMap.pow()), thanks to Andy Kern, https://github.com/MesserLab/SLiM/pull/595
 
 
 version 5.1 (Eidos version 4.1):

diff --git a/core/slim_test_other.cpp b/core/slim_test_other.cpp
@@ -1668,9 +1668,9 @@ void _RunSpatialMapTests(void)
 		SLiMAssertScriptStop(prefix_1D + "m1.divide(mv2); if (identical(mv1 / mv2, m1.gridValues())) stop(); } ");
 		SLiMAssertScriptStop(prefix_1D + "m1.divide(m2); if (identical(mv1 / mv2, m1.gridValues())) stop(); } ");
 
-		SLiMAssertScriptStop(prefix_1D + "m1.power(0.25); if (identical(mv1 ^ 0.25, m1.gridValues())) stop(); } ");
-		SLiMAssertScriptStop(prefix_1D + "m1.power(mv2); if (identical(mv1 ^ mv2, m1.gridValues())) stop(); } ");
-		SLiMAssertScriptStop(prefix_1D + "m1.power(m2); if (identical(mv1 ^ mv2, m1.gridValues())) stop(); } ");
+		SLiMAssertScriptStop(prefix_1D + "m1.power(0.25); if (allClose(mv1 ^ 0.25, m1.gridValues())) stop(); } ");
+		SLiMAssertScriptStop(prefix_1D + "m1.power(mv2); if (allClose(mv1 ^ mv2, m1.gridValues())) stop(); } ");
+		SLiMAssertScriptStop(prefix_1D + "m1.power(m2); if (allClose(mv1 ^ mv2, m1.gridValues())) stop(); } ");
 
 		SLiMAssertScriptStop(prefix_1D + "m1.exp(); if (allClose(exp(mv1), m1.gridValues())) stop(); } ");
 
@@ -1783,9 +1783,9 @@ void _RunSpatialMapTests(void)
 		SLiMAssertScriptStop(prefix_2D + "m1.divide(mv2); if (identical(mv1 / mv2, m1.gridValues())) stop(); } ");
 		SLiMAssertScriptStop(prefix_2D + "m1.divide(m2); if (identical(mv1 / mv2, m1.gridValues())) stop(); } ");
 
-		SLiMAssertScriptStop(prefix_2D + "m1.power(0.25); if (identical(mv1 ^ 0.25, m1.gridValues())) stop(); } ");
-		SLiMAssertScriptStop(prefix_2D + "m1.power(mv2); if (identical(mv1 ^ mv2, m1.gridValues())) stop(); } ");
-		SLiMAssertScriptStop(prefix_2D + "m1.power(m2); if (identical(mv1 ^ mv2, m1.gridValues())) stop(); } ");
+		SLiMAssertScriptStop(prefix_2D + "m1.power(0.25); if (allClose(mv1 ^ 0.25, m1.gridValues())) stop(); } ");
+		SLiMAssertScriptStop(prefix_2D + "m1.power(mv2); if (allClose(mv1 ^ mv2, m1.gridValues())) stop(); } ");
+		SLiMAssertScriptStop(prefix_2D + "m1.power(m2); if (allClose(mv1 ^ mv2, m1.gridValues())) stop(); } ");
 
 		SLiMAssertScriptStop(prefix_2D + "m1.exp(); if (allClose(exp(mv1), m1.gridValues())) stop(); } ");
 
@@ -1899,9 +1899,9 @@ void _RunSpatialMapTests(void)
 		SLiMAssertScriptStop(prefix_3D + "m1.divide(mv2); if (identical(mv1 / mv2, m1.gridValues())) stop(); } ");
 		SLiMAssertScriptStop(prefix_3D + "m1.divide(m2); if (identical(mv1 / mv2, m1.gridValues())) stop(); } ");
 
-		SLiMAssertScriptStop(prefix_3D + "m1.power(0.25); if (identical(mv1 ^ 0.25, m1.gridValues())) stop(); } ");
-		SLiMAssertScriptStop(prefix_3D + "m1.power(mv2); if (identical(mv1 ^ mv2, m1.gridValues())) stop(); } ");
-		SLiMAssertScriptStop(prefix_3D + "m1.power(m2); if (identical(mv1 ^ mv2, m1.gridValues())) stop(); } ");
+		SLiMAssertScriptStop(prefix_3D + "m1.power(0.25); if (allClose(mv1 ^ 0.25, m1.gridValues())) stop(); } ");
+		SLiMAssertScriptStop(prefix_3D + "m1.power(mv2); if (allClose(mv1 ^ mv2, m1.gridValues())) stop(); } ");
+		SLiMAssertScriptStop(prefix_3D + "m1.power(m2); if (allClose(mv1 ^ mv2, m1.gridValues())) stop(); } ");
 
 		SLiMAssertScriptStop(prefix_3D + "m1.exp(); if (allClose(exp(mv1), m1.gridValues())) stop(); } ");
 

diff --git a/core/spatial_map.cpp b/core/spatial_map.cpp
@@ -1654,8 +1654,7 @@ EidosValue_SP SpatialMap::ExecuteMethod_power(EidosGlobalStringID p_method_id, c
 		double power_scalar = x_value->NumericAtIndex_NOCAST(0, nullptr);
 
 		// FIXME: TO BE PARALLELIZED
-		for (int64_t i = 0; i < values_size_; ++i)
-			values_[i] = pow(values_[i], power_scalar);
+		Eidos_SIMD::pow_float64_scalar_exp(values_, power_scalar, values_, values_size_);
 	}
 	else
 	{
@@ -1666,8 +1665,7 @@ EidosValue_SP SpatialMap::ExecuteMethod_power(EidosGlobalStringID p_method_id, c
 			EIDOS_TERMINATION << "ERROR (SpatialMap::ExecuteMethod_power): power() requires the target SpatialMap to be compatible with the SpatialMap supplied in x (using the same spatiality and bounds, and having the same grid resolution)." << EidosTerminate();
 
 		// FIXME: TO BE PARALLELIZED
-		for (int64_t i = 0; i < values_size_; ++i)
-			values_[i] = pow(values_[i], power_map_values[i]);
+		Eidos_SIMD::pow_float64(values_, power_map_values, values_, values_size_);
 	}
 
 	_ValuesChanged();

diff --git a/eidos/eidos_functions_math.cpp b/eidos/eidos_functions_math.cpp
@@ -111,12 +111,26 @@ EidosValue_SP Eidos_ExecuteFunction_acos(const std::vector<EidosValue_SP> &p_arg
 	EidosValue_SP result_SP(nullptr);
 
 	EidosValue *x_value = p_arguments[0].get();
+	EidosValueType x_type = x_value->Type();
 	int x_count = x_value->Count();
-	EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
-	result_SP = EidosValue_SP(float_result);
 
-	for (int value_index = 0; value_index < x_count; ++value_index)
-		float_result->set_float_no_check(acos(x_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	if (x_type == EidosValueType::kValueInt)
+	{
+		EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
+		result_SP = EidosValue_SP(float_result);
+
+		for (int value_index = 0; value_index < x_count; ++value_index)
+			float_result->set_float_no_check(acos(x_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	}
+	else if (x_type == EidosValueType::kValueFloat)
+	{
+		const double *float_data = x_value->FloatData();
+		EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
+		double *float_result_data = float_result->data_mutable();
+		result_SP = EidosValue_SP(float_result);
+
+		Eidos_SIMD::acos_float64(float_data, float_result_data, x_count);
+	}
 
 	result_SP->CopyDimensionsFromValue(x_value);
 
@@ -129,12 +143,26 @@ EidosValue_SP Eidos_ExecuteFunction_asin(const std::vector<EidosValue_SP> &p_arg
 	EidosValue_SP result_SP(nullptr);
 
 	EidosValue *x_value = p_arguments[0].get();
+	EidosValueType x_type = x_value->Type();
 	int x_count = x_value->Count();
-	EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
-	result_SP = EidosValue_SP(float_result);
 
-	for (int value_index = 0; value_index < x_count; ++value_index)
-		float_result->set_float_no_check(asin(x_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	if (x_type == EidosValueType::kValueInt)
+	{
+		EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
+		result_SP = EidosValue_SP(float_result);
+
+		for (int value_index = 0; value_index < x_count; ++value_index)
+			float_result->set_float_no_check(asin(x_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	}
+	else if (x_type == EidosValueType::kValueFloat)
+	{
+		const double *float_data = x_value->FloatData();
+		EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
+		double *float_result_data = float_result->data_mutable();
+		result_SP = EidosValue_SP(float_result);
+
+		Eidos_SIMD::asin_float64(float_data, float_result_data, x_count);
+	}
 
 	result_SP->CopyDimensionsFromValue(x_value);
 
@@ -147,12 +175,26 @@ EidosValue_SP Eidos_ExecuteFunction_atan(const std::vector<EidosValue_SP> &p_arg
 	EidosValue_SP result_SP(nullptr);
 
 	EidosValue *x_value = p_arguments[0].get();
+	EidosValueType x_type = x_value->Type();
 	int x_count = x_value->Count();
-	EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
-	result_SP = EidosValue_SP(float_result);
 
-	for (int value_index = 0; value_index < x_count; ++value_index)
-		float_result->set_float_no_check(atan(x_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	if (x_type == EidosValueType::kValueInt)
+	{
+		EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
+		result_SP = EidosValue_SP(float_result);
+
+		for (int value_index = 0; value_index < x_count; ++value_index)
+			float_result->set_float_no_check(atan(x_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	}
+	else if (x_type == EidosValueType::kValueFloat)
+	{
+		const double *float_data = x_value->FloatData();
+		EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
+		double *float_result_data = float_result->data_mutable();
+		result_SP = EidosValue_SP(float_result);
+
+		Eidos_SIMD::atan_float64(float_data, float_result_data, x_count);
+	}
 
 	result_SP->CopyDimensionsFromValue(x_value);
 
@@ -166,8 +208,10 @@ EidosValue_SP Eidos_ExecuteFunction_atan2(const std::vector<EidosValue_SP> &p_ar
 
 	EidosValue *x_value = p_arguments[0].get();
 	int x_count = x_value->Count();
+	EidosValueType x_type = x_value->Type();
 	EidosValue *y_value = p_arguments[1].get();
 	int y_count = y_value->Count();
+	EidosValueType y_type = y_value->Type();
 
 	if (x_count != y_count)
 		EIDOS_TERMINATION << "ERROR (Eidos_ExecuteFunction_atan2): function atan2() requires arguments of equal length." << EidosTerminate(nullptr);
@@ -183,8 +227,20 @@ EidosValue_SP Eidos_ExecuteFunction_atan2(const std::vector<EidosValue_SP> &p_ar
 	EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
 	result_SP = EidosValue_SP(float_result);
 
-	for (int value_index = 0; value_index < x_count; ++value_index)
-		float_result->set_float_no_check(atan2(x_value->NumericAtIndex_NOCAST(value_index, nullptr), y_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	// Use SIMD when both operands are float type
+	if ((x_type == EidosValueType::kValueFloat) && (y_type == EidosValueType::kValueFloat))
+	{
+		const double *x_data = x_value->FloatData();
+		const double *y_data = y_value->FloatData();
+		double *float_result_data = float_result->data_mutable();
+
+		Eidos_SIMD::atan2_float64(x_data, y_data, float_result_data, x_count);
+	}
+	else
+	{
+		for (int value_index = 0; value_index < x_count; ++value_index)
+			float_result->set_float_no_check(atan2(x_value->NumericAtIndex_NOCAST(value_index, nullptr), y_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	}
 
 	// Copy dimensions from whichever operand we chose at the beginning
 	result_SP->CopyDimensionsFromValue(result_dim_source.get());
@@ -225,12 +281,26 @@ EidosValue_SP Eidos_ExecuteFunction_cos(const std::vector<EidosValue_SP> &p_argu
 	EidosValue_SP result_SP(nullptr);
 
 	EidosValue *x_value = p_arguments[0].get();
+	EidosValueType x_type = x_value->Type();
 	int x_count = x_value->Count();
-	EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
-	result_SP = EidosValue_SP(float_result);
 
-	for (int value_index = 0; value_index < x_count; ++value_index)
-		float_result->set_float_no_check(cos(x_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	if (x_type == EidosValueType::kValueInt)
+	{
+		EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
+		result_SP = EidosValue_SP(float_result);
+
+		for (int value_index = 0; value_index < x_count; ++value_index)
+			float_result->set_float_no_check(cos(x_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	}
+	else if (x_type == EidosValueType::kValueFloat)
+	{
+		const double *float_data = x_value->FloatData();
+		EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
+		double *float_result_data = float_result->data_mutable();
+		result_SP = EidosValue_SP(float_result);
+
+		Eidos_SIMD::cos_float64(float_data, float_result_data, x_count);
+	}
 
 	result_SP->CopyDimensionsFromValue(x_value);
 
@@ -2429,12 +2499,26 @@ EidosValue_SP Eidos_ExecuteFunction_sin(const std::vector<EidosValue_SP> &p_argu
 	EidosValue_SP result_SP(nullptr);
 
 	EidosValue *x_value = p_arguments[0].get();
+	EidosValueType x_type = x_value->Type();
 	int x_count = x_value->Count();
-	EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
-	result_SP = EidosValue_SP(float_result);
 
-	for (int value_index = 0; value_index < x_count; ++value_index)
-		float_result->set_float_no_check(sin(x_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	if (x_type == EidosValueType::kValueInt)
+	{
+		EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
+		result_SP = EidosValue_SP(float_result);
+
+		for (int value_index = 0; value_index < x_count; ++value_index)
+			float_result->set_float_no_check(sin(x_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	}
+	else if (x_type == EidosValueType::kValueFloat)
+	{
+		const double *float_data = x_value->FloatData();
+		EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
+		double *float_result_data = float_result->data_mutable();
+		result_SP = EidosValue_SP(float_result);
+
+		Eidos_SIMD::sin_float64(float_data, float_result_data, x_count);
+	}
 
 	result_SP->CopyDimensionsFromValue(x_value);
 
@@ -2619,12 +2703,26 @@ EidosValue_SP Eidos_ExecuteFunction_tan(const std::vector<EidosValue_SP> &p_argu
 	EidosValue_SP result_SP(nullptr);
 
 	EidosValue *x_value = p_arguments[0].get();
+	EidosValueType x_type = x_value->Type();
 	int x_count = x_value->Count();
-	EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
-	result_SP = EidosValue_SP(float_result);
 
-	for (int value_index = 0; value_index < x_count; ++value_index)
-		float_result->set_float_no_check(tan(x_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	if (x_type == EidosValueType::kValueInt)
+	{
+		EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
+		result_SP = EidosValue_SP(float_result);
+
+		for (int value_index = 0; value_index < x_count; ++value_index)
+			float_result->set_float_no_check(tan(x_value->NumericAtIndex_NOCAST(value_index, nullptr)), value_index);
+	}
+	else if (x_type == EidosValueType::kValueFloat)
+	{
+		const double *float_data = x_value->FloatData();
+		EidosValue_Float *float_result = (new (gEidosValuePool->AllocateChunk()) EidosValue_Float())->resize_no_initialize(x_count);
+		double *float_result_data = float_result->data_mutable();
+		result_SP = EidosValue_SP(float_result);
+
+		Eidos_SIMD::tan_float64(float_data, float_result_data, x_count);
+	}
 
 	result_SP->CopyDimensionsFromValue(x_value);
 

diff --git a/eidos/eidos_interpreter.cpp b/eidos/eidos_interpreter.cpp
@@ -23,6 +23,7 @@
 #include "eidos_ast_node.h"
 #include "eidos_rng.h"
 #include "eidos_call_signature.h"
+#include "eidos_simd.h"
 
 #include <sstream>
 #include <stdexcept>
@@ -3211,9 +3212,9 @@ EidosValue_SP EidosInterpreter::Evaluate_Exp(const EidosASTNode *p_node)
 		{
 			const double *first_child_data = first_child_value->FloatData();
 			const double *second_child_data = second_child_value->FloatData();
+			double *float_result_data = float_result->data_mutable();
 
-			for (int value_index = 0; value_index < first_child_count; ++value_index)
-				float_result->set_float_no_check(pow(first_child_data[value_index], second_child_data[value_index]), value_index);
+			Eidos_SIMD::pow_float64(first_child_data, second_child_data, float_result_data, first_child_count);
 		}
 		else if ((first_child_type == EidosValueType::kValueFloat) && (second_child_type == EidosValueType::kValueInt))
 		{
@@ -3258,9 +3259,9 @@ EidosValue_SP EidosInterpreter::Evaluate_Exp(const EidosASTNode *p_node)
 		else	// (second_child_type == EidosValueType::kValueFloat)
 		{
 			const double *second_child_data = second_child_value->FloatData();
+			double *float_result_data = float_result->data_mutable();
 
-			for (int value_index = 0; value_index < second_child_count; ++value_index)
-				float_result->set_float_no_check(pow(singleton_float, second_child_data[value_index]), value_index);
+			Eidos_SIMD::pow_float64_scalar_base(singleton_float, second_child_data, float_result_data, second_child_count);
 		}
 
 		result_SP = float_result_SP;
@@ -3281,9 +3282,9 @@ EidosValue_SP EidosInterpreter::Evaluate_Exp(const EidosASTNode *p_node)
 		else	// (first_child_type == EidosValueType::kValueFloat)
 		{
 			const double *first_child_data = first_child_value->FloatData();
+			double *float_result_data = float_result->data_mutable();
 
-			for (int value_index = 0; value_index < first_child_count; ++value_index)
-				float_result->set_float_no_check(pow(first_child_data[value_index], singleton_float), value_index);
+			Eidos_SIMD::pow_float64_scalar_exp(first_child_data, singleton_float, float_result_data, first_child_count);
 		}
 
 		result_SP = float_result_SP;