neo4j
diff --git a/‎graphdatascience/procedure_surface/api/similarity/node_similarity_endpoints.py‎
Lines changed: 396 additions & 0 deletions b/‎graphdatascience/procedure_surface/api/similarity/node_similarity_endpoints.py‎
Lines changed: 396 additions & 0 deletions
diff --git a/‎graphdatascience/procedure_surface/api/similarity/node_similarity_filtered_endpoints.py‎
Lines changed: 425 additions & 0 deletions b/‎graphdatascience/procedure_surface/api/similarity/node_similarity_filtered_endpoints.py‎
Lines changed: 425 additions & 0 deletions
diff --git a/‎graphdatascience/procedure_surface/api/similarity/node_similarity_results.py‎
Lines changed: 35 additions & 0 deletions b/‎graphdatascience/procedure_surface/api/similarity/node_similarity_results.py‎
Lines changed: 35 additions & 0 deletions
diff --git a/‎graphdatascience/procedure_surface/arrow/similarity/node_similarity_arrow_endpoints.py‎
Lines changed: 289 additions & 0 deletions b/‎graphdatascience/procedure_surface/arrow/similarity/node_similarity_arrow_endpoints.py‎
Lines changed: 289 additions & 0 deletions
@@ -0,0 +1,35 @@
+from typing import Any
+
+from graphdatascience.procedure_surface.api.base_result import BaseResult
+
+
+class NodeSimilarityMutateResult(BaseResult):
+    pre_processing_millis: int
+    compute_millis: int
+    mutate_millis: int
+    post_processing_millis: int
+    nodes_compared: int
+    relationships_written: int
+    similarity_distribution: dict[str, Any]
+    configuration: dict[str, Any]
+
+
+class NodeSimilarityStatsResult(BaseResult):
+    pre_processing_millis: int
+    compute_millis: int
+    post_processing_millis: int
+    nodes_compared: int
+    similarity_pairs: int
+    similarity_distribution: dict[str, Any]
+    configuration: dict[str, Any]
+
+
+class NodeSimilarityWriteResult(BaseResult):
+    pre_processing_millis: int
+    compute_millis: int
+    write_millis: int
+    post_processing_millis: int
+    nodes_compared: int
+    relationships_written: int
+    similarity_distribution: dict[str, Any]
+    configuration: dict[str, Any]
@@ -0,0 +1,289 @@
+from __future__ import annotations
+
+from typing import Any
+
+from pandas import DataFrame
+
+from graphdatascience.arrow_client.authenticated_flight_client import AuthenticatedArrowClient
+from graphdatascience.arrow_client.v2.remote_write_back_client import RemoteWriteBackClient
+from graphdatascience.procedure_surface.api.catalog.graph_api import GraphV2
+from graphdatascience.procedure_surface.api.estimation_result import EstimationResult
+from graphdatascience.procedure_surface.api.similarity.node_similarity_endpoints import NodeSimilarityEndpoints
+from graphdatascience.procedure_surface.api.similarity.node_similarity_filtered_endpoints import (
+    NodeSimilarityFilteredEndpoints,
+)
+from graphdatascience.procedure_surface.api.similarity.node_similarity_results import (
+    NodeSimilarityMutateResult,
+    NodeSimilarityStatsResult,
+    NodeSimilarityWriteResult,
+)
+from graphdatascience.procedure_surface.arrow.relationship_endpoints_helper import RelationshipEndpointsHelper
+from graphdatascience.procedure_surface.arrow.similarity.node_similarity_filtered_arrow_endpoints import (
+    NodeSimilarityFilteredArrowEndpoints,
+)
+from graphdatascience.procedure_surface.arrow.stream_result_mapper import rename_similarity_stream_result
+
+
+class NodeSimilarityArrowEndpoints(NodeSimilarityEndpoints):
+    def __init__(
+        self,
+        arrow_client: AuthenticatedArrowClient,
+        write_back_client: RemoteWriteBackClient | None = None,
+        show_progress: bool = False,
+    ):
+        self._endpoints_helper = RelationshipEndpointsHelper(
+            arrow_client, write_back_client=write_back_client, show_progress=show_progress
+        )
+
+    @property
+    def filtered(self) -> NodeSimilarityFilteredEndpoints:
+        return NodeSimilarityFilteredArrowEndpoints(
+            self._endpoints_helper._arrow_client,
+            self._endpoints_helper._write_back_client,
+            self._endpoints_helper._show_progress,
+        )
+
+    def mutate(
+        self,
+        G: GraphV2,
+        mutate_relationship_type: str,
+        mutate_property: str,
+        top_k: int = 10,
+        bottom_k: int = 10,
+        top_n: int = 0,
+        bottom_n: int = 0,
+        similarity_cutoff: float = 1.0e-42,
+        degree_cutoff: int = 1,
+        upper_degree_cutoff: int = 2147483647,
+        similarity_metric: str = "JACCARD",
+        use_components: bool | str = False,
+        relationship_weight_property: str | None = None,
+        relationship_types: list[str] | None = None,
+        node_labels: list[str] | None = None,
+        sudo: bool = False,
+        log_progress: bool = True,
+        username: str | None = None,
+        concurrency: int | None = None,
+        job_id: str | None = None,
+    ) -> NodeSimilarityMutateResult:
+        config = self._endpoints_helper.create_base_config(
+            G,
+            topK=top_k,
+            bottomK=bottom_k,
+            topN=top_n,
+            bottomN=bottom_n,
+            similarityCutoff=similarity_cutoff,
+            degreeCutoff=degree_cutoff,
+            upperDegreeCutoff=upper_degree_cutoff,
+            similarityMetric=similarity_metric,
+            useComponents=use_components,
+            relationshipWeightProperty=relationship_weight_property,
+            relationshipTypes=relationship_types,
+            nodeLabels=node_labels,
+            sudo=sudo,
+            logProgress=log_progress,
+            username=username,
+            concurrency=concurrency,
+            jobId=job_id,
+        )
+
+        result = self._endpoints_helper.run_job_and_mutate(
+            "v2/similarity.nodeSimilarity", config, mutate_property, mutate_relationship_type
+        )
+
+        return NodeSimilarityMutateResult(**result)
+
+    def stats(
+        self,
+        G: GraphV2,
+        top_k: int = 10,
+        bottom_k: int = 10,
+        top_n: int = 0,
+        bottom_n: int = 0,
+        similarity_cutoff: float = 1.0e-42,
+        degree_cutoff: int = 1,
+        upper_degree_cutoff: int = 2147483647,
+        similarity_metric: str = "JACCARD",
+        use_components: bool | str = False,
+        relationship_weight_property: str | None = None,
+        relationship_types: list[str] | None = None,
+        node_labels: list[str] | None = None,
+        sudo: bool = False,
+        log_progress: bool = True,
+        username: str | None = None,
+        concurrency: int | None = None,
+        job_id: str | None = None,
+    ) -> NodeSimilarityStatsResult:
+        config = self._endpoints_helper.create_base_config(
+            G,
+            topK=top_k,
+            bottomK=bottom_k,
+            topN=top_n,
+            bottomN=bottom_n,
+            similarityCutoff=similarity_cutoff,
+            degreeCutoff=degree_cutoff,
+            upperDegreeCutoff=upper_degree_cutoff,
+            similarityMetric=similarity_metric,
+            useComponents=use_components,
+            relationshipWeightProperty=relationship_weight_property,
+            relationshipTypes=relationship_types,
+            nodeLabels=node_labels,
+            sudo=sudo,
+            logProgress=log_progress,
+            username=username,
+            concurrency=concurrency,
+            jobId=job_id,
+        )
+
+        result = self._endpoints_helper.run_job_and_get_summary(
+            "v2/similarity.nodeSimilarity",
+            config,
+        )
+        if "similarityPairs" not in result:
+            result["similarityPairs"] = result.get("relationshipsWritten", 0)
+
+        return NodeSimilarityStatsResult(**result)
+
+    def stream(
+        self,
+        G: GraphV2,
+        top_k: int = 10,
+        bottom_k: int = 10,
+        top_n: int = 0,
+        bottom_n: int = 0,
+        similarity_cutoff: float = 1.0e-42,
+        degree_cutoff: int = 1,
+        upper_degree_cutoff: int = 2147483647,
+        similarity_metric: str = "JACCARD",
+        use_components: bool | str = False,
+        relationship_weight_property: str | None = None,
+        relationship_types: list[str] | None = None,
+        node_labels: list[str] | None = None,
+        sudo: bool = False,
+        log_progress: bool = True,
+        username: str | None = None,
+        concurrency: int | None = None,
+        job_id: str | None = None,
+    ) -> DataFrame:
+        config = self._endpoints_helper.create_base_config(
+            G,
+            topK=top_k,
+            bottomK=bottom_k,
+            topN=top_n,
+            bottomN=bottom_n,
+            similarityCutoff=similarity_cutoff,
+            degreeCutoff=degree_cutoff,
+            upperDegreeCutoff=upper_degree_cutoff,
+            similarityMetric=similarity_metric,
+            useComponents=use_components,
+            relationshipWeightProperty=relationship_weight_property,
+            relationshipTypes=relationship_types,
+            nodeLabels=node_labels,
+            sudo=sudo,
+            logProgress=log_progress,
+            username=username,
+            concurrency=concurrency,
+            jobId=job_id,
+        )
+
+        result = self._endpoints_helper.run_job_and_stream("v2/similarity.nodeSimilarity", G, config)
+
+        rename_similarity_stream_result(result)
+        return result
+
+    def write(
+        self,
+        G: GraphV2,
+        write_relationship_type: str,
+        write_property: str,
+        top_k: int = 10,
+        bottom_k: int = 10,
+        top_n: int = 0,
+        bottom_n: int = 0,
+        similarity_cutoff: float = 1.0e-42,
+        degree_cutoff: int = 1,
+        upper_degree_cutoff: int = 2147483647,
+        similarity_metric: str = "JACCARD",
+        use_components: bool | str = False,
+        relationship_weight_property: str | None = None,
+        relationship_types: list[str] | None = None,
+        node_labels: list[str] | None = None,
+        sudo: bool = False,
+        log_progress: bool = True,
+        username: str | None = None,
+        concurrency: int | None = None,
+        job_id: str | None = None,
+        write_concurrency: int | None = None,
+    ) -> NodeSimilarityWriteResult:
+        config = self._endpoints_helper.create_base_config(
+            G,
+            topK=top_k,
+            bottomK=bottom_k,
+            topN=top_n,
+            bottomN=bottom_n,
+            similarityCutoff=similarity_cutoff,
+            degreeCutoff=degree_cutoff,
+            upperDegreeCutoff=upper_degree_cutoff,
+            similarityMetric=similarity_metric,
+            useComponents=use_components,
+            relationshipWeightProperty=relationship_weight_property,
+            relationshipTypes=relationship_types,
+            nodeLabels=node_labels,
+            sudo=sudo,
+            logProgress=log_progress,
+            username=username,
+            concurrency=concurrency,
+            jobId=job_id,
+            writeConcurrency=write_concurrency,
+        )
+
+        result = self._endpoints_helper.run_job_and_write(
+            "v2/similarity.nodeSimilarity",
+            G,
+            config,
+            property_overwrites=write_property,
+            relationship_type_overwrite=write_relationship_type,
+            write_concurrency=write_concurrency,
+            concurrency=concurrency,
+        )
+
+        return NodeSimilarityWriteResult(**result)
+
+    def estimate(
+        self,
+        G: GraphV2 | dict[str, Any],
+        top_k: int = 10,
+        bottom_k: int = 10,
+        top_n: int = 0,
+        bottom_n: int = 0,
+        similarity_cutoff: float = 1.0e-42,
+        degree_cutoff: int = 1,
+        upper_degree_cutoff: int = 2147483647,
+        similarity_metric: str = "JACCARD",
+        use_components: bool | str = False,
+        relationship_weight_property: str | None = None,
+        relationship_types: list[str] | None = None,
+        node_labels: list[str] | None = None,
+        sudo: bool = False,
+        username: str | None = None,
+        concurrency: int | None = None,
+    ) -> EstimationResult:
+        config = self._endpoints_helper.create_estimate_config(
+            topK=top_k,
+            bottomK=bottom_k,
+            topN=top_n,
+            bottomN=bottom_n,
+            similarityCutoff=similarity_cutoff,
+            degreeCutoff=degree_cutoff,
+            upperDegreeCutoff=upper_degree_cutoff,
+            similarityMetric=similarity_metric,
+            useComponents=use_components,
+            relationshipWeightProperty=relationship_weight_property,
+            relationshipTypes=relationship_types,
+            nodeLabels=node_labels,
+            sudo=sudo,
+            username=username,
+            concurrency=concurrency,
+        )
+
+        return self._endpoints_helper.estimate("v2/similarity.nodeSimilarity.estimate", G, config)