/* take CHUNK slices instead of one process them repeat */ #include #include #include #include #include #include #include "row.hpp" #include "sort_algorithms.hpp" using namespace std; // flat row-major tensor: [slices][n][n] uint8_t *tensor; int n; int slices; int k; int next_slice = 0; int CHUNK = 3; boost::mutex mtx; // row-major index inline int idx(int z, int i, int j) { return z * n * n + i * n + j; } // -------------------------------- void sort_slice_rows_chunk(int tid) { while(true) { int start; int end; // critical section: assign chunk mtx.lock(); if(next_slice >= slices) { mtx.unlock(); return; } start = next_slice; next_slice += CHUNK; mtx.unlock(); end = start + CHUNK; if(end > slices) end = slices; for(int slice = start; slice < end; slice++) { cout << "Thread " << tid << " START slice " << slice << endl; for(int i=0; i r(row_ptr, n); quick_sort(r); for(int j = 0; j < n; j++) row_ptr[j] = r[j]; //cout << "After: "; //for(int j=0; j(t2 - t1); // -------------------------------- // print results // -------------------------------- cout << "\nSorted tensor:\n"; print_tensor(); cout << "\nTotal thread execution time: " << elapsed.count() << " ms\n"; delete[] tensor; return 0; }