目次: C言語とlibc
誰も興味ないglibcの話シリーズ、スレッドのスタックはどうやって確保するのか?を追います。
ソースコードはglibc-2.35を見ています。pthread_create()の実体はいくつかありますが、2.34以降ならば関数__pthread_create_2_1()が実体です。
// glibc/nptl/pthread_create.c
versioned_symbol (libc, __pthread_create_2_1, pthread_create, GLIBC_2_34);
libc_hidden_ver (__pthread_create_2_1, __pthread_create)
#ifndef SHARED
strong_alias (__pthread_create_2_1, __pthread_create)
#endif
主要な関数としては、スタックを確保するallocate_stack()とclone()を呼ぶcreate_thread()です。スレッド属性も見てますが、今回は特に使わないので無視します。
__pthread_create_2_1 allocate_stack get_cached_stack create_thread
スレッドのスタックは2通りの確保方法があります。1つはキャッシュ、もう1つはmmap()です。
// glibc/nptl/pthread_create.c
static int
allocate_stack (const struct pthread_attr *attr, struct pthread **pdp,
void **stack, size_t *stacksize)
{
//...
/* Try to get a stack from the cache. */
reqsize = size;
pd = get_cached_stack (&size, &mem);
if (pd == NULL) //★★キャッシュがなければこのif文が成立してmmapでメモリ確保★★
{
/* If a guard page is required, avoid committing memory by first
allocate with PROT_NONE and then reserve with required permission
excluding the guard page. */
mem = __mmap (NULL, size, (guardsize == 0) ? prot : PROT_NONE,
MAP_PRIVATE | MAP_ANONYMOUS | MAP_STACK, -1, 0);
//...
retval = create_thread (pd, iattr, &stopped_start, stackaddr,
stacksize, &thread_ran);
//...
このget_cached_stack()がNULLを返す=失敗=キャッシュからスタックを確保できなかった、を意味します。確保できない場合はmmap()を呼んでカーネルから匿名ページを確保し、スタック領域として使います。
キャッシュからスタックを確保できるのは、既に終了したスレッドのスタック領域がキャッシュにある場合です。スレッドが終了して資源の回収pthread_join()が終わった後は、スレッドのスタックにアクセスしてはいけません。つまり誰もアクセスしない領域です。
スタック領域をカーネルに返しても良いですが、カーネルからメモリを確保したり解放するのは一般的に遅い処理のため、別のスレッドのスタックとして再利用してカーネルからのメモリ確保&解放の回数を減らし、効率を上げる仕組みと思われます。
まずは読み出す側であるget_cached_stack()関数のコードから見ます。ちなみにコード内に頻出するtcbはThread Controll Blockの略だそうです。
// glibc/nptl/allocatestack.c
static struct pthread *
get_cached_stack (size_t *sizep, void **memp)
{
size_t size = *sizep;
struct pthread *result = NULL;
list_t *entry;
lll_lock (GL (dl_stack_cache_lock), LLL_PRIVATE);
/* Search the cache for a matching entry. We search for the
smallest stack which has at least the required size. Note that
in normal situations the size of all allocated stacks is the
same. As the very least there are only a few different sizes.
Therefore this loop will exit early most of the time with an
exact match. */
list_for_each (entry, &GL (dl_stack_cache)) //★★キャッシュのリストを全部調べる★★
{
struct pthread *curr;
curr = list_entry (entry, struct pthread, list);
if (__nptl_stack_in_use (curr) && curr->stackblock_size >= size)
{
if (curr->stackblock_size == size) //★★一致するサイズのスタックがあれば使う★★
{
result = curr;
break;
}
if (result == NULL
|| result->stackblock_size > curr->stackblock_size)
result = curr;
}
}
//...
カギを握るのはスタック領域をキャッシュするリストdl_stack_cacheのようです。先程も言いましたが、このリストに要素が追加されるタイミングの1つはpthread_join()です。pthread_join()からコードを追います。
// glibc/nptl/pthread_join.c
int
___pthread_join (pthread_t threadid, void **thread_return) //★★pthread_join()の実体★★
{
return __pthread_clockjoin_ex (threadid, thread_return, 0 /* Ignored */,
NULL, true);
}
versioned_symbol (libc, ___pthread_join, pthread_join, GLIBC_2_34);
// glibc/nptl/pthread_join_common.c
int
__pthread_clockjoin_ex (pthread_t threadid, void **thread_return,
clockid_t clockid,
const struct __timespec64 *abstime, bool block)
{
struct pthread *pd = (struct pthread *) threadid;
//...
void *pd_result = pd->result;
if (__glibc_likely (result == 0))
{
/* We mark the thread as terminated and as joined. */
pd->tid = -1;
/* Store the return value if the caller is interested. */
if (thread_return != NULL)
*thread_return = pd_result;
/* Free the TCB. */
__nptl_free_tcb (pd); //★★これ★★
}
else
pd->joinid = NULL;
//...
// glibc/nptl/nptl_free_tcb.c
void
__nptl_free_tcb (struct pthread *pd)
{
/* The thread is exiting now. */
if (atomic_bit_test_set (&pd->cancelhandling, TERMINATED_BIT) == 0)
{
/* Free TPP data. */
if (pd->tpp != NULL) //★余談TPP = Thread Priority Protectだそうです★
{
struct priority_protection_data *tpp = pd->tpp;
pd->tpp = NULL;
free (tpp);
}
/* Queue the stack memory block for reuse and exit the process. The
kernel will signal via writing to the address returned by
QUEUE-STACK when the stack is available. */
__nptl_deallocate_stack (pd); //★★これ★★
}
}
libc_hidden_def (__nptl_free_tcb)
// glibc/nptl/nptl-stack.c
void
__nptl_deallocate_stack (struct pthread *pd)
{
lll_lock (GL (dl_stack_cache_lock), LLL_PRIVATE);
/* Remove the thread from the list of threads with user defined
stacks. */
__nptl_stack_list_del (&pd->list);
/* Not much to do. Just free the mmap()ed memory. Note that we do
not reset the 'used' flag in the 'tid' field. This is done by
the kernel. If no thread has been created yet this field is
still zero. */
if (__glibc_likely (! pd->user_stack))
(void) queue_stack (pd); //★★これ★★
else
/* Free the memory associated with the ELF TLS. */
_dl_deallocate_tls (TLS_TPADJ (pd), false);
lll_unlock (GL (dl_stack_cache_lock), LLL_PRIVATE);
}
libc_hidden_def (__nptl_deallocate_stack)
/* Add a stack frame which is not used anymore to the stack. Must be
called with the cache lock held. */
static inline void
__attribute ((always_inline))
queue_stack (struct pthread *stack)
{
/* We unconditionally add the stack to the list. The memory may
still be in use but it will not be reused until the kernel marks
the stack as not used anymore. */
__nptl_stack_list_add (&stack->list, &GL (dl_stack_cache)); //★★キャッシュのリストに追加★★
GL (dl_stack_cache_actsize) += stack->stackblock_size;
if (__glibc_unlikely (GL (dl_stack_cache_actsize)
> __nptl_stack_cache_maxsize))
__nptl_free_stacks (__nptl_stack_cache_maxsize);
}
やっとリストdl_stack_cacheにスタック領域を追加している場所まで来ました。もっとあっさりかと思いましたが、意外と呼び出しが深かったです……。
目次: ALSA
遠くの部屋にあるPCで再生した音声を手元のスピーカーで聞きたい場合、スピーカーの線を延々と伸ばすよりリモート再生したほうが楽です。
リモート再生の方法はいくつかありますが、最近のLinuxディストリビューションであれば大抵はPulseAudioがインストールされていると思うので、PulseAudioのTCP送信機能を使うのが楽でしょう。
クライアントとサーバーが同じ内容のCookie(~/.config/pulse/cookieにある)を持っていないと、下記のようにAccess deniedといわれて接続できません。
$ PULSE_SERVER=192.168.1.10 speaker-test -D pulse speaker-test 1.2.9 Playback device is pulse Stream parameters are 48000Hz, S16_LE, 1 channels Using 16 octaves of pink noise ALSA lib pulse.c:242:(pulse_connect) PulseAudio: Unable to connect: Access denied Playback open error: -111,Connection refused
クライアントにCookieファイルをコピーできない場合は、module-native-protocol-tcpにauth-anonymous=1を渡すと良いそうです。
サーバー側は音声を受け取ってスピーカーなどに送る役目を果たします。私はスピーカーの横にRaspberry Piを置いてサーバーにしています。PulseAudioの設定は簡単で、
# vi /etc/pulse/default.pa load-module module-native-protocol-tcp
既にPulseAudioが起動している場合があるので、一度終了させます。
$ pacmd Welcome to PulseAudio 12.2! Use "help" for usage information. >>> exit # PulseAudioの再起動をします。 $ pulseaudio -D
PulseAudioの設定テストを行う場合は-Dなし(フォアグラウンド実行)すると良いです。Crtl-Cで終了できますので、起動&終了が素早くできて楽です。
クライアント側はMP3などをデコードし、音声をサーバーに送る役目を果たします。使い方は環境変数PULSE_SERVERを指定して再生するだけです。
$ export PULSE_SERVER=192.168.1.10 # ★★PulseAudioサーバー側のIPアドレス★★ $ mplayer --no-video test.mp3
本当はmodule-zeroconf-discoverを正しく設定すれば環境変数をいちいち設定する必要はなく、PulseAudioの設定GUIから出力先の一つとして選択できるようになるはずです。が、どうも私の環境だとうまく動いてくれなくて挫折しました……。
< | 2022 | > | ||||
<< | < | 05 | > | >> | ||
日 | 月 | 火 | 水 | 木 | 金 | 土 |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 | - | - | - | - |
合計:
本日: