トランザクションメモリはマルチコアの救世主となるのか?

4プロセッサぐらいを境として、パフォーマンスが上がっていかない。理由は、共有メモリへのアクセスに伴うロック/排他制御が、実行の並列化を妨げているからであると考えられている。

トランザクションメモリの方が遅いパターンって無いのかね.