NVIDIA CUDA Toolkit zawiera funkcję jednolitego adresowania wirtualnego (UVA). Umożliwia jednolitej, połączonej przestrzeni adresowej złożonej z pamięci głównej komputera i pamięci procesorów graficznych, w celu przyśpieszenia i ułatwienia programowania równoległego. Kolejny element to biblioteki szablonów wydajnych elementów podstawowych języka C++ Thrust. Jest to kolekcja potężnych algorytmów obsługi obliczeń równoległych i struktur danych, wraz z otwartym kodem źródłowym, która ułatwia pracę programistów języka C++. Standardowe zadania (np. sortowanie równoległe) realizowane za pomocą bibliotek Thrust są od 5 do 100 razy szybsze w porównaniu ze standardowymi bibliotekami Standard Template Library (STL) lub bibliotekami Threading Building Blocks (TBB).
Architektura CUDA 4.0 cechuje się ponadto szeregiem innych funkcji i możliwości, w tym: integracja MPI z aplikacjami CUDA, współdzielenie procesorów graficznych między wieloma wątkami, dostęp do wielu procesorów dla jednego wątku procesora centralnego, nowa biblioteka obrazu i wizualizacji komputerowej NPP, automatyczna analiza wydajności w aplikacji Visual Profiler, nowe funkcje cuda-gdb i obsługa systemu MacOS, dodana obsługa operatorów języka C++, np. new/delete i funkcji wirtualnych, nowy deasembler binarny dla procesorów graficznych, itd.
Wersja „Release Candidate” zestawu narzędziowego CUDA Toolkit 4.0 zostanie udostępniona bezpłatnie z dniem 4 marca 2011 r. Aby uzyskać do niej dostęp, należy zarejestrować się w programie CUDA Registered Developer. W ramach programu CUDA Registered Developer można uzyskać dostęp do bogatego zbioru narzędzi, zasobów i informacji dla programistów aplikacji równoległych, który umożliwia jak najpełniejsze wykorzystanie potencjału architektury CUDA.
Więcej informacji na temat funkcji i możliwości zestawu narzędziowego CUDA i aplikacji na graficznych procesorach obliczeniowych można znaleźć pod adresem: www.nvidia.com/cuda.
Źródło: NVIDIA