HackMD - Collaborative Markdown Knowledge Base

從 C++11 規格來看 data races

C++11 1.10/21

The execution of a program contains a data race if it contains two conflicting actions in different threads, at least one of which is not atomic, and neither happens before the other.

Reference
http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2012/n3376.pdf

其中一個 thread 的 operation 不是 atomic operation，而且也沒有 happens before 這種關係

synchronization operations
atomic operation
如何建立 happens before 這種關係？

A synchronization operation on one or more memory locations is either a consume operation, an acquire operation, a release operation, or both an acquire and release operation.

Reference
http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2012/n3376.pdf#section.1.10

synchronization operation 是要在不同的執行緒之間同步，等一下我們會在範例中看到這是如何運作的
在 wait-free multi-producer queue 會用到 memory_order_relaxed、memory_order_release 和 memory_order_consume

wait-free multi-producer queue 就是一開始提到的 Boost 的範例

特別要留意的地方是：
relaxed operations 雖然是 atomic，但不是 synchronization operations

In addition, there are relaxed atomic operations, which are not synchronization operations, and atomic read modify-write operations

Reference
C++11 1.10 Multi-threaded executions and data races

C++11, page 1115 說明了 memory_order_seq_cst 是一種 single total order

consistent with the “happens before” order and modification orders for all affected locations

因為 memory_order_seq_cst 會維持所有執行緒的同步，考慮到效能，所以需要再理解其他的 memor order，例如接下來要探討的 memory_order_relaxed 、memory_order_release 和 memory_order_consume。

// Thread 1:
r1 = y.load(memory_order_relaxed);
x.store(r1, memory_order_relaxed);
// Thread 2:
r2 = x.load(memory_order_relaxed);
y.store(42, memory_order_relaxed);

Reference:
C++11 規格, page 1116

有沒有可能最後的結果是 r1 = r2 = 42？

因為 memory_order_relaxed 只是 atomic operaion 不是 synchronization operations

所以執行順序有可能是這樣

y.store(42, memory_order_relaxed);
r1 = y.load(memory_order_relaxed);
x.store(r1, memory_order_relaxed);
r2 = x.load(memory_order_relaxed);

Reference:
C++11 規格, page 1116

Boost.Atomic

Example about atomic

   void push(const T &data)
  {
    node * n = new node;
    n->data = data;
    node * stale_head = head_.load(boost::memory_order_relaxed);
    do {
      n->next = stale_head;
    } while (!head_.compare_exchange_weak(stale_head, n, boost::memory_order_release));
  }
  ...
  node * pop_all_reverse(void)
  {
    return head_.exchange(0, boost::memory_order_consume);
  }
  private:
  boost::atomic<node *> head_;

第 5 、8 行的 load、compare_exchange_weak 就是 atomic operation，底下會再討論到這兩個 atomic operation，也會提到 3 個 memory order：memory_order_relaxed、memory_order_release 和 memory_order_consume。

Reference
Boost.Atomic, Usage examples

C++11, page 1124 對 compare_exchange_weak 是這麼說的
Implementations should ensure that weak compare-and-exchange operations do not consistently return false unless either the atomic object has value different from expected or there are concurrent modifications to the atomic object.

compare_exchange_weak 在 exchange 前會先作比較，比較結果不一樣才會 exchange，如果 exchange 就會 return true，否則 return false。
所以範例裡會有一個

while (!head_.compare_exchange_weak(stale_head, n, boost::memory_order_release));

在這個範例，我們用 memory_order_release 作為 atomic operation 的標記，底下將會探討 memory_order_release 還有與之成對的 memory_order_consume

memory_order_release v.s. memory_order_consume

Boost 是這麼說的

The use of memory_order_release after creating and initializing the object and memory_order_consume before dereferencing the object provides this guarantee.

再看看 C++11, page 1114 怎麼說

memory_order_release, memory_order_acq_rel, and memory_order_seq_cst:
a store operation performs a release operation on the affected memory location.
memory_order_consume:
a load operation performs a consume operation on the affected memorylocation

如果用 memory_order_acquire 來理解 memory_order_consume，會容易點，但是 memory_order_consume 不等於 memory_order_acquire

可以把 memory_order_consume 換成 memory_order_acquire，但不能把 memory_order_acquire 換成 memory_order_consume

透過 memory_order_release、memory_order_consume 建立了 happens-before 的關係

head_.compare_exchange_weak(stale_head, n, boost::memory_order_release));

head_.exchange(0, boost::memory_order_consume)

Agenda

Introduction

Why needs Template metaprogramming?

What is memory order?

reorder

out-of-order

in-order

out-of-order

How C++11 supports memory order？

從 C++11 規格來看 data races

Boost.Atomic

Example about atomic

Boost.Atomic

multi-producer and single consumer queue

multi-producer and single consumer queue

Reference

tags: `COSCUP 2019` `C++11` `memory order` `TMP` `Template Meta-Programming` `Boost` `atomic` `Boost.Atomic` `1.66`

	void push(const T &data)
	{
	node * n = new node;
	n->data = data;
	node * stale_head = head_.load(boost::memory_order_relaxed);
	do {
	n->next = stale_head;
	} while (!head_.compare_exchange_weak(stale_head, n, boost::memory_order_release));
	}
	...
	node * pop_all_reverse(void)
	{
	return head_.exchange(0, boost::memory_order_consume);
	}
	private:
	boost::atomic<node *> head_;