[WIP] Fix tensor conversion issue in preprocessing method by Copilot · Pull Request #4 · NickScherbakov/mask-stabilization

Copilot · 2025-12-20T21:50:57Z

Fix NumPy 2.x Compatibility in _preprocess_frame

Plan:

Replace self.transform() usage with manual tensor conversion in _preprocess_frame() method
Remove dependency on torchvision's ToTensor() transform
Implement manual conversion: numpy → float32 → normalize → CHW format → torch tensor
Apply ImageNet normalization manually (mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
Remove unused self.transform initialization from __init__ method
Remove unused PIL Image import (no longer needed)
Run existing test to verify the fix works
Ensure no other methods are affected by the change

Original prompt

Проблема НЕ РЕШЕНА

Предыдущий PR (#2) добавил конвертацию в PIL Image, но ошибка осталась:
TypeError: expected np.ndarray (got numpy.ndarray)
Проблема в том, что torchvision.transforms.functional.to_tensor() внутри ToTensor() несовместим с NumPy 2.x. Даже PIL Image конвертируется обратно в numpy array внутри torchvision, и там происходит ошибка.

Текущий код (НЕ РАБОТАЕТ)
def _preprocess_frame(self, frame):
    frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    pil_image = Image.fromarray(frame_rgb)
    input_tensor = self.transform(pil_image)  # <-- ОШИБКА ЗДЕСЬ
    return input_tensor
Требуемое решение

Полностью заменить использование self.transform() на ручную конвертацию в методе _preprocess_frame() в файле src/segmentation.py:
def _preprocess_frame(self, frame):
    """
    Preprocess a frame for model input.
    
    Args:
        frame: Frame as numpy array (BGR format from OpenCV)
        
    Returns:
        Preprocessed tensor
    """
    # Convert BGR to RGB
    frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    
    # Manual tensor conversion (bypasses torchvision ToTensor for NumPy 2.x compatibility)
    img = frame_rgb.astype('float32') / 255.0
    img = img.transpose((2, 0, 1))  # HWC -> CHW format
    input_tensor = torch.from_numpy(img.copy()).float()
    
    # Apply ImageNet normalization manually
    mean = torch.tensor([0.485, 0.456, 0.406]).view(3, 1, 1)
    std = torch.tensor([0.229, 0.224, 0.225]).view(3, 1, 1)
    input_tensor = (input_tensor - mean) / std

    return input_tensor
Важно

НЕ использовать self.transform() вообще

НЕ использовать ToTensor() из torchvision

Делать всю конвертацию вручную через numpy и torch

Использовать img.copy() чтобы избежать проблем с памятью

Сохранить ImageNet нормализацию (mean/std) как в оригинале

This pull request was created from Copilot chat.

💡 You can make Copilot smarter by setting up custom instructions, customizing its development environment and configuring Model Context Protocol (MCP) servers. Learn more Copilot coding agent tips in the docs.

Copilot

Copilot wasn't able to review any files in this pull request.

💡 Add Copilot custom instructions for smarter, more guided reviews. Learn how to get started.

Initial plan

9d3c0fe

Copilot AI assigned Copilot and NickScherbakov Dec 20, 2025

Copilot started work on behalf of NickScherbakov December 20, 2025 21:51 View session

NickScherbakov marked this pull request as ready for review December 20, 2025 21:53

Copilot AI review requested due to automatic review settings December 20, 2025 21:53

Copilot AI reviewed Dec 20, 2025

View reviewed changes

NickScherbakov merged commit f9c0f7b into main Dec 20, 2025
1 check failed

Copilot AI requested a review from NickScherbakov December 20, 2025 21:53

Copilot stopped work on behalf of NickScherbakov due to an error December 20, 2025 21:53
Copilot has encountered an error. See logs for additional details.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[WIP] Fix tensor conversion issue in preprocessing method#4

[WIP] Fix tensor conversion issue in preprocessing method#4
NickScherbakov merged 1 commit intomainfrom
copilot/fix-preprocess-frame-error

Copilot AI commented Dec 20, 2025 •

edited

Loading

Uh oh!

Copilot AI left a comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Conversation

Copilot AI commented Dec 20, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Fix NumPy 2.x Compatibility in _preprocess_frame

Plan:

Проблема НЕ РЕШЕНА

Текущий код (НЕ РАБОТАЕТ)

Требуемое решение

Важно

Uh oh!

Copilot AI left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Copilot AI commented Dec 20, 2025 •

edited

Loading