jdk-sandbox: comparison hotspot/src/share/vm/gc_implementation/g1/concurrentG1RefineThread.cpp

equal deleted inserted replaced

-:986f111ef897
+:74a1337e4acc
 // ======= Concurrent Mark Thread ========
 // The CM thread is created when the G1 garbage collector is used
 ConcurrentG1RefineThread::
-ConcurrentG1RefineThread(ConcurrentG1Refine* cg1r) :
+ConcurrentG1RefineThread(ConcurrentG1Refine* cg1r, ConcurrentG1RefineThread *next, int worker_id) :
 ConcurrentGCThread(),
+_worker_id(worker_id),
+_active(false),
+_next(next),
 _cg1r(cg1r),
-_started(false),
-_in_progress(false),
-_do_traversal(false),
 _vtime_accum(0.0),
 _co_tracker(G1CRGroup),
 _interval_ms(5.0)
 {
 create_and_start();
 }
-const long timeout = 200; // ms.
+void ConcurrentG1RefineThread::sample_young_list_rs_lengths() {
+G1CollectedHeap* g1h = G1CollectedHeap::heap();
-void ConcurrentG1RefineThread::traversalBasedRefinement() {
+G1CollectorPolicy* g1p = g1h->g1_policy();
-_cg1r->wait_for_ConcurrentG1Refine_enabled();
+if (g1p->adaptive_young_list_length()) {
-MutexLocker x(G1ConcRefine_mon);
+int regions_visited = 0;
-while (_cg1r->enabled()) {
-MutexUnlocker ux(G1ConcRefine_mon);
+g1h->young_list_rs_length_sampling_init();
-ResourceMark rm;
+while (g1h->young_list_rs_length_sampling_more()) {
-HandleMark   hm;
+g1h->young_list_rs_length_sampling_next();
+++regions_visited;
-if (G1TraceConcurrentRefinement) {
-gclog_or_tty->print_cr("G1-Refine starting pass");
+// we try to yield every time we visit 10 regions
-}
+if (regions_visited == 10) {
+if (_sts.should_yield()) {
+_sts.yield("G1 refine");
+// we just abandon the iteration
+break;
+}
+regions_visited = 0;
+}
+}
+g1p->check_prediction_validity();
+}
+}
+void ConcurrentG1RefineThread::run() {
+initialize_in_thread();
+_vtime_start = os::elapsedVTime();
+wait_for_universe_init();
+_co_tracker.enable();
+_co_tracker.start();
+while (!_should_terminate) {
+DirtyCardQueueSet& dcqs = JavaThread::dirty_card_queue_set();
+// Wait for completed log buffers to exist.
+{
+MutexLockerEx x(DirtyCardQ_CBL_mon, Mutex::_no_safepoint_check_flag);
+while (((_worker_id == 0 && !dcqs.process_completed_buffers()) ||
+(_worker_id > 0 && !is_active())) &&
+!_should_terminate) {
+DirtyCardQ_CBL_mon->wait(Mutex::_no_safepoint_check_flag);
+}
+}
+if (_should_terminate) {
+return;
+}
+// Now we take them off (this doesn't hold locks while it applies
+// closures.)  (If we did a full collection, then we'll do a full
+// traversal.
 _sts.join();
-bool no_sleep = _cg1r->refine();
-_sts.leave();
-if (!no_sleep) {
-MutexLockerEx x(CGC_lock, Mutex::_no_safepoint_check_flag);
-// We do this only for the timeout; we don't expect this to be signalled.
-CGC_lock->wait(Mutex::_no_safepoint_check_flag, timeout);
-}
-}
-}
-void ConcurrentG1RefineThread::queueBasedRefinement() {
-DirtyCardQueueSet& dcqs = JavaThread::dirty_card_queue_set();
-// Wait for completed log buffers to exist.
-{
-MutexLockerEx x(DirtyCardQ_CBL_mon, Mutex::_no_safepoint_check_flag);
-while (!_do_traversal && !dcqs.process_completed_buffers() &&
-!_should_terminate) {
-DirtyCardQ_CBL_mon->wait(Mutex::_no_safepoint_check_flag);
-}
-}
-if (_should_terminate) {
-return;
-}
-// Now we take them off (this doesn't hold locks while it applies
-// closures.)  (If we did a full collection, then we'll do a full
-// traversal.
-_sts.join();
-if (_do_traversal) {
-(void)_cg1r->refine();
-switch (_cg1r->get_last_pya()) {
-case PYA_cancel: case PYA_continue:
-// Continue was caught and handled inside "refine".  If it's still
-// "continue" when we get here, we're done.
-_do_traversal = false;
-break;
-case PYA_restart:
-assert(_do_traversal, "Because of Full GC.");
-break;
-}
-} else {
 int n_logs = 0;
 int lower_limit = 0;
 double start_vtime_sec; // only used when G1SmoothConcRefine is on
 int prev_buffer_num; // only used when G1SmoothConcRefine is on
+// This thread activation threshold
+int threshold = DCQBarrierProcessCompletedThreshold * _worker_id;
+// Next thread activation threshold
+int next_threshold = threshold + DCQBarrierProcessCompletedThreshold;
+int deactivation_threshold = MAX2<int>(threshold - DCQBarrierProcessCompletedThreshold / 2, 0);
 if (G1SmoothConcRefine) {
 lower_limit = 0;
 start_vtime_sec = os::elapsedVTime();
 prev_buffer_num = (int) dcqs.completed_buffers_num();
 } else {
 lower_limit = DCQBarrierProcessCompletedThreshold / 4; // For now.
 }
-while (dcqs.apply_closure_to_completed_buffer(0, lower_limit)) {
+while (dcqs.apply_closure_to_completed_buffer(_worker_id, lower_limit)) {
 double end_vtime_sec;
 double elapsed_vtime_sec;
 int elapsed_vtime_ms;
-int curr_buffer_num;
+int curr_buffer_num = (int) dcqs.completed_buffers_num();
 if (G1SmoothConcRefine) {
 end_vtime_sec = os::elapsedVTime();
 elapsed_vtime_sec = end_vtime_sec - start_vtime_sec;
 elapsed_vtime_ms = (int) (elapsed_vtime_sec * 1000.0);
-curr_buffer_num = (int) dcqs.completed_buffers_num();
 if (curr_buffer_num > prev_buffer_num ||
-curr_buffer_num > DCQBarrierProcessCompletedThreshold) {
+curr_buffer_num > next_threshold) {
 decreaseInterval(elapsed_vtime_ms);
 } else if (curr_buffer_num < prev_buffer_num) {
 increaseInterval(elapsed_vtime_ms);
 }
 }
+if (_worker_id == 0) {
 sample_young_list_rs_lengths();
+} else if (curr_buffer_num < deactivation_threshold) {
+// If the number of the buffer has fallen below our threshold
+// we should deactivate. The predecessor will reactivate this
+// thread should the number of the buffers cross the threshold again.
+MutexLockerEx x(DirtyCardQ_CBL_mon, Mutex::_no_safepoint_check_flag);
+deactivate();
+if (G1TraceConcurrentRefinement) {
+gclog_or_tty->print_cr("G1-Refine-deactivated worker %d", _worker_id);
+}
+break;
+}
 _co_tracker.update(false);
+// Check if we need to activate the next thread.
+if (curr_buffer_num > next_threshold && _next != NULL && !_next->is_active()) {
+MutexLockerEx x(DirtyCardQ_CBL_mon, Mutex::_no_safepoint_check_flag);
+_next->activate();
+DirtyCardQ_CBL_mon->notify_all();
+if (G1TraceConcurrentRefinement) {
+gclog_or_tty->print_cr("G1-Refine-activated worker %d", _next->_worker_id);
+}
+}
 if (G1SmoothConcRefine) {
 prev_buffer_num = curr_buffer_num;
 _sts.leave();
 os::sleep(Thread::current(), (jlong) _interval_ms, false);
 _sts.join();
 start_vtime_sec = os::elapsedVTime();
 }
 n_logs++;
 }
-// Make sure we harvest the PYA, if any.
+_co_tracker.update(false);
-(void)_cg1r->get_pya();
-}
-_sts.leave();
-}
-void ConcurrentG1RefineThread::sample_young_list_rs_lengths() {
-G1CollectedHeap* g1h = G1CollectedHeap::heap();
-G1CollectorPolicy* g1p = g1h->g1_policy();
-if (g1p->adaptive_young_list_length()) {
-int regions_visited = 0;
-g1h->young_list_rs_length_sampling_init();
-while (g1h->young_list_rs_length_sampling_more()) {
-g1h->young_list_rs_length_sampling_next();
-++regions_visited;
-// we try to yield every time we visit 10 regions
-if (regions_visited == 10) {
-if (_sts.should_yield()) {
-_sts.yield("G1 refine");
-// we just abandon the iteration
-break;
-}
-regions_visited = 0;
-}
-}
-g1p->check_prediction_validity();
-}
-}
-void ConcurrentG1RefineThread::run() {
-initialize_in_thread();
-_vtime_start = os::elapsedVTime();
-wait_for_universe_init();
-_co_tracker.enable();
-_co_tracker.start();
-while (!_should_terminate) {
-// wait until started is set.
-if (G1RSBarrierUseQueue) {
-queueBasedRefinement();
-} else {
-traversalBasedRefinement();
-}
-_sts.join();
-_co_tracker.update();
 _sts.leave();
 if (os::supports_vtime()) {
 _vtime_accum = (os::elapsedVTime() - _vtime_start);
 } else {
 _vtime_accum = 0.0;
 }
 void ConcurrentG1RefineThread::print() {
 gclog_or_tty->print("\"Concurrent G1 Refinement Thread\" ");
 Thread::print();
 gclog_or_tty->cr();
 }
-void ConcurrentG1RefineThread::set_do_traversal(bool b) {
-_do_traversal = b;
-}

changeset 2881	74a1337e4acc
parent 2741	34e2a243d69a
child 2882	d508a8bac491