لوكاس فيرمير يتحدث في مهرجان التسويق 2016

JADS @ Booking.com

الفلاسفة والتلسكوبات

حتى بدون امتلاك أي أماكن إقامة ، بالكاد يحتاج Booking.com إلى مقدمة باعتبارها واحدة من أكبر شركات السفر في العالم. من خلال الجمع الفعال بين علم البيانات والتركيز على العملاء ، أصبحت Booking.com شركة رائدة في السوق. العلم ، بشكل عام ، هو محرك رئيسي لنجاحها وقيمة عالية داخل الشركة. أحد اللاعبين الأساسيين في هذه البيئة العلمية هو Lukas Vermeer. مع خلفية أكاديمية في علوم الحوسبة والتعلم الآلي ، Lukas هو كبير علماء البيانات في Booking.com ومسؤول عن التجارب التي يتم التحكم فيها. بموقع مثالي في قناة في أمستردام ، قابلت أنا وجاسبر لانترزه في مقرهما. يخبرنا بحماس عن التجارب في Booking.com ومستقبل علم البيانات: الفلاسفة وبناة التلسكوب.

الغرض والمزالق من اختبار A / B

كشركة تقدر العلوم بشكل كبير ، كيف تجري تجارب؟

نحن نستخدم تجارب في تطوير المنتجات لتحسين تجربة العملاء بطريقتين: من ناحية ، نستخدمها لمنع تجربة العملاء من التدهور بشكل غير متوقع ونستخدمها أيضًا لمعرفة ما يريده العملاء بالمعنى الإيجابي. منع التدهور هو التحدي الأسهل. هناك بعض شرائح العملاء الصغيرة والضعيفة نسبيًا ، ويمكن التغاضي عنها بسهولة أثناء تطوير ميزات جديدة لعملائنا. على سبيل المثال البلدان التي يقرؤون فيها من اليمين إلى اليسار ، أو الأشخاص الذين يستخدمون برنامج قارئ الشاشة. قد يكون الأمر جيدًا أن ميزة جديدة على الموقع لا تعمل بشكل صحيح مع هذه المجموعات. هذه هي "الحالات حافة" نموذجية. كلما طرحنا التغيير ، نستخدم اختبار A / B لاكتشاف آثاره. العثور على تأثيرات سلبية كبيرة أسهل ويتطلب أحجام عينات أصغر مقارنة بالتحسينات الطفيفة في تجربة العميل ، لذلك أقضي معظم وقتي في الأخير.

"عندما يتم حل المشكلات بفعالية ، سيأتي العملاء إليك وسترتفع مؤشرات الأداء الرئيسية. ليس العكس."

بالطبع نحن لا نعتمد فقط على التجارب التي تسيطر عليها. نحن نستخدم كل من الأساليب الكمية والنوعية. يحتوي الحجز على مختبر خاص به حيث يتم إجراء البحوث النوعية. هناك ندعو الناس لتناول القهوة ونطلب منهم حجز مكان للإقامة. نلاحظ ما يفعلونه ، والاستماع إليهم ، وطرح الأسئلة. الأفكار التي نحصل عليها من هذه الدراسات النوعية ، على سبيل المثال قد يقول الناس أنهم يقدرون وجبة فطور جيدة ، تتحول إلى ميزات على موقعنا على الويب والتي نقوم بالتحقق منها من خلال اختبار A / B. هذا بالنسبة لنا هو الهدف الثاني لاختبار A / B: التحقق من الصحة إذا كان الحل يساعد المستخدمين على حل مشكلة معينة أم لا. هذا التحقق من الصحة والحل التركيز مهم جدا وغالبا ما ينسى. عندما تنظر إلى الشركات التي تقوم بالكثير من اختبارات A / B ، فإن التهديد المستمر هو أن ينتهي بهم الأمر إلى محاولة تحسين KPI ، بدلاً من حل المشاكل الفعلية للمستخدمين. في رأيي ، الهدف من اختبار A / B هو التحقق من صحة ما إذا كانت المشكلة المفترضة قد تم حلها بشكل فعال. وهذا كل شيء! عندما يتم حل المشكلات بفعالية ، سيأتي العملاء إليك وسترتفع مؤشرات الأداء الرئيسية. ليس العكس.

كيف يرتبط علم البيانات بهذا؟

فهي تساعد في فهم ما يريده الناس ، وفي إنشاء ميزات وإيجاد توصيات تساعدهم في العثور على ما يحتاجون إليه. كثير من الناس لا يعرفون بالضبط ما يبحثون عنه. يحتوي Booking.com على خيارات إقامة أكثر من أي شركة أخرى ، لذلك من الناحية النظرية ، يجب أن يكون هناك شيء للجميع. يكمن التحدي في مساعدة الناس في العثور على المكان المناسب لهم في كل مرة.

عندما يتعلق الأمر بالتوصيات ، نوصي في بعض الأحيان بخيارات قد تبدو غير ذات صلة باستعلام المستخدم المحدد ، على سبيل المثال التواريخ البديلة لإقامة معينة. يجب أن يُمنح الأشخاص الذين لا يعرفون ما يريدون نافذة استكشاف ، حتى يتم منحهم الفرصة لتوسيع نطاق بحثهم ، وليس تضييقه أكثر من اللازم.

علاوة على ذلك ، بعض الناس مرنون ، والبعض الآخر لا. يمكن أن تساعد علوم البيانات أيضًا في التنبؤ بما يتمتع به الأشخاص من مرونة ومن لا يتمتعون بالمرونة. هل يمكن أن نتوقع التواريخ التي هي مثيرة للاهتمام؟ لأي الناس؟ هذا مهم للغاية ، لأن أكثر ما يزعجك أن ترى عندما تبحث عن أسبوع محدد فقط ، هو خصم 50 ٪ للأسبوع التالي.

ما نوع البيانات التي تستخدمها كمدخلات نموذجية؟

بالكاد لدينا أي بيانات ملف تعريف المستخدم المتاحة ، والتي أعتقد أنها واحدة من المفاهيم الخاطئة الكبيرة. عندما تهبط على موقعنا ، نحصل فقط على ملف تعريف الارتباط وعنوان IP الخاص بك ونعرف المتصفح الذي تستخدمه. هذا عن ذلك. نحن نعرف ولكن ماذا تفعل. هذا هو أحد الأسباب التي تجعلنا نظهر لك الكثير من الأشياء غير ذات الصلة ، خاصة في البداية. عندما لا نعرف شيئًا عن أي عميل ، يجب أن نفترض أنه يمكن أن يناسب جميع الملفات الشخصية. نظهر إشارات من أنواع مختلفة وتفسير ردود أفعالهم. هذا صعب للغاية ، لأن الحقيقة الأساسية يصعب الحصول عليها. هل هذا العميل مرن حقًا؟ أم أنه يتفاعل فقط بشكل عشوائي؟ كل هذا يعتمد إلى حد كبير على التعلم بدون إشراف.

"بالكاد لدينا أي بيانات ملف تعريف المستخدم المتاحة ، والتي أعتقد أنها واحدة من المفاهيم الخاطئة الكبيرة."

الحياة في Booking.com

والآن لشيء مختلف تمامًا: هل تسافر كثيرًا بنفسك؟

اعتدت على قبل كان لي أطفال هاها! لدي الآن ثلاث فتيات صغيرات واستكشاف العالم أصعب بكثير. أحد الأشياء اللطيفة حول Booking.com هو أن لدينا أكثر من 100 جنسية هنا في المكتب ، لذلك لا زلت أقابل أشخاصًا من جميع أنحاء العالم دون الحاجة إلى السفر بنفسي! هذا التنوع الثقافي هو في الواقع مهم جدا بالنسبة لنا. بالنسبة لشركة السفر التي تخدم الأشخاص من جميع أنحاء العالم ، من المهم محاولة فهم منتجاتنا من أكبر عدد ممكن من وجهات النظر. التنوع يعطينا القوة.

كيف تبدو مؤسستك؟

تم تنظيم Booking.com بشكل مختلف قليلاً عن معظم الشركات وكان ذلك في البداية أحد الأسباب التي دفعتني للعمل في Booking.com. في سنوات استشاري ، رأيت العديد من الشركات ذات الأقسام المعزولة تمامًا والمُحكمة حول المسؤوليات الداخلية: تكنولوجيا المعلومات ، التسويق ، المبيعات ، إلخ. نحن نعمل مع فرق متعددة التخصصات مسؤولة عن جزء معين من منتجاتنا وجعلنا أكثر قدرة على تحقيق الاكتفاء الذاتي. على سبيل المثال ، قد يكون فريق من 8 أشخاص ، بما في ذلك المطورين والمصممين وكتاب النسخ ومالك المنتج ، مسؤولين عن أداة تساعد المستخدمين على إدارة حجوزاتهم. يقومون بأبحاثهم الخاصة ، وبناء ميزاتهم الخاصة ، واتخاذ القرارات الخاصة بهم حول منتجاتهم دون تدخل كبير من القيادة.

كيف يتم تقاسم المعرفة عبر الشركة؟

على الرغم من أن لدينا شبكات اجتماعية داخلية ، إلا أن أفضل طريقة لتبادل المعرفة لا تزال وجهاً لوجه ، للحصول على فنجان من القهوة والتحدث عن الأشياء. نظرًا لأن الأشخاص دائمًا ما يكونون قريبين من الأشخاص الذين يحتاجون إليها ، يمكن أن يتدفق التواصل بشكل طبيعي. نقوم أيضًا بتناوب الأشخاص وتغيير الفرق كثيرًا استجابة لما يحتاجه المستخدمون ، حتى يتعرف الناس على الكثير من الزملاء والأجزاء المختلفة من منظمتنا بسرعة كبيرة.

إذا كنت ترغب أيضًا في تناول القهوة وترغب في الحصول على نظرة أكثر حميمية للحياة في Booking.com ، يمكنك إلقاء نظرة!

الفلاسفة والتلسكوبات ومستقبل علوم البيانات

كيف يتغير علم البيانات في المستقبل؟

أعتقد ، وهذا ليس على الأرجح ما يريد الناس سماعه ، أن الجزء المرموق من التحليلات ؛ النمذجة ، تنفيذ الشبكات العصبية ، الانحدار اللوجستي أو أي شيء لديك ، هو الأسهل في الأتمتة ، وبالتالي سيتم أتمتة أولاً. من الصعب أتمتة الطبقات الموجودة خارج الصندوق الأسود مباشرةً ، لذلك فإن المهارات مثل جمع البيانات وهندسة الميزات ونمذجة المخرجات وصنع القرار والاستدلال السببي هي المهارات التي ستظل مهمة. يمكن أن يكون كل طراز جيدًا تمامًا مثل أي شيء تضعه فيه والطريقة التي يعرضها لك شيئًا ما. كثيرا ما أشير إلى الأشخاص الذين يعملون على هذه الطبقات الخارجية باسم "الفلاسفة" و "بناة التلسكوب". يفكر الفلاسفة في النظام بأكمله والعالم الذي يعمل من خلاله ، بينما يركز واضعو التلسكوب على الجوانب الفنية الأكثر لقياس العالم بدقة من حولهم. في النهاية ، أعتقد أن هذه الوظائف ستبقى.

"أعتقد أن الجزء المرموق من التحليلات ؛ النمذجة ، وتنفيذ الشبكات العصبية ، أو أي شيء ، هو الأسهل في الأتمتة ، وبالتالي سيتم أتمتة أولاً ".

هل أنت فيلسوف أو منشئ تلسكوب؟

أعتقد أنني على حد سواء ، لكنني أحب تفلسف أكثر. التفكير في المفاهيم النظام. لقد بدأت بالفعل دراسة علوم الحوسبة لأنني كنت جيدًا في علم الأحياء. في امتحان المدرسة الثانوية كان هناك هذا السؤال: المريض لديه بروتينات في بوله ، ما الخطأ الذي يمكن أن يكون؟ أحببت حل هذه الأنواع من المشاكل وأعتقد أن هذا يشبه إلى حد كبير رمز تصحيح الأخطاء. البرنامج ينتج خطأ ، ما سبب ذلك؟ يوجد هذا النظام المعقد الضخم مثل جسم الإنسان ، حيث تتواصل أجزاء كثيرة مع بعضها البعض وبطريقة أو بأخرى لا نحصل على المخرجات المطلوبة. حل هذه الألغاز هو ما أحب حقًا.

في الحديث الملهم أدناه ، يوضح لوكاس هاتين الظاهرتين ، مخلل الملفوف وأكثر من ذلك بكثير.

دراسة علوم البيانات والتوت والقطط

ما رأيك في دراسات علوم البيانات التي ينبغي التركيز عليها؟

لقد قلت ذلك بالفعل: على تربية الفلاسفة وبناة التلسكوب. من الخارج أرى أن التركيز ينصب غالبًا على تطبيق نماذج أو تقنيات معينة ، أو عدد الأرقام ، أو التنبؤ ، أو Hadoop ، إلخ. أود أن أرى تركيزًا أكبر على تقييم موثوقية القياسات والاستدلالات في المقام الأول. طرح أسئلة مثل: كيف يمكنني هندسة ميزاتي بطريقة تجعلها مدخلات مثالية للجهاز؟ كيف يمكنني استخدام الإخراج لاتخاذ أفضل القرارات؟ ما هي التهديدات الداخلية والخارجية على الصلاحية؟ لا تركز فقط على التحليل نفسه ، بل تتضمن أيضًا ما يأتي قبله وبعده. لا يتعلق علم البيانات بالتحليل أو النموذج فحسب ، بل يتعلق أيضًا بالسياق الذي يتم استخدامه فيه.

القط

يمكنك ممارسة هذا بنفسك! فقط قم بشراء جهاز قياس درجة الحرارة Raspberry Pi ومقياس USB وانتقل إلى قياس درجة الحرارة في منزلك. اكتب نصًا بسيطًا يسجل قياسًا كل دقيقة وستكون لديك قريبًا مجموعة بيانات. لنفترض أنك تريد التنبؤ بدرجة الحرارة في منزلك استنادًا إلى درجة الحرارة الخارجية باستخدام نموذج تنبؤي بسيط. هل يمكنك التوصل إلى طرق يمكن أن يحدث بها هذا الخطأ؟ ما هي التهديدات التي يتعرض لها النموذج والبيانات التي تستخدمها؟ قد يكون هناك انقطاع في الطاقة ، جلس قطك على مقياس الحرارة ، وجاءت والدتك في القانون ورفع التدفئة. يمكن أن يحدث الكثير من الأشياء غير المتوقعة. مثل هذا التحدي البسيط يمكن أن يساعدك في التدرب على توقع العيوب المحتملة في بياناتك ، ومعرفة كيف يمكنك إدارتها حتى لا تزال تقوم بتنبؤات دقيقة ، أو على الأقل معرفة متى لا يمكنك ذلك.

أعتقد أنه عندما تتعامل مع مشكلة كهذه ، فإن الجزء الأقل إثارة للاهتمام هو النموذج المحدد الذي ستستخدمه للتنبؤ. سواء كانت شبكة عصبية أو انحدار خطي أو أيًا كان. هذا هو الجزء الأسهل! الجزء الصعب: قطتي تجلس على مقياس الحرارة ولا أعرف متى بالضبط! كيف سأقوم بتنظيف بياناتي بحيث تكون مناسبة للتنبؤات الدقيقة؟ ربما ستجد نمطًا ويظهر أن القطة تجلس هناك كل صباح في الساعة 7 صباحًا ، ثم يمكنك تضمين قطتك في النموذج ، هاها! ولكن لا نكت ، يا شباب ، هذا هو ما يدور حوله علم البيانات. هذه في النهاية مشاكل ستواجهها في العالم الواقعي أيضًا.

ما تحتاج إليه هو عالم بيانات قادر على التحقق من التعقل. شخص يرى البيانات من عام 2024 ويعتقد: "لكنها ليست 2024 بعد!"

القط مثال ساذج بالطبع ، ولكن هناك العديد من أوجه التشابه مع الأشياء التي نكافح معها في الممارسة. هل تعرف هذه الألعاب المحمولة حيث من المفترض أن ينتظر اللاعب يومًا آخر للحصول على المزيد من العملات المعدنية؟ هل تعرف ماذا يفعل الناس في كثير من الأحيان؟ إنهم ببساطة يحددون تاريخ هواتفهم في اليوم للأمام ، لأنهم لن يضطروا إلى الانتظار ليوم كامل! ويفعلون ذلك مرة أخرى. ثم يقومون بفتح تطبيق الحجز. لذلك عندما نسترجع البيانات ، يقول التطبيق: تهانينا ، لقد نقر هذا الشخص على رابطك ، غدًا. حسنًا ، إلى أي مدى تعتقد أن نموذجي سيكون دقيقًا إذا استخدمت هذه البيانات؟ حتى النماذج الأكثر ذكاءً لن تجد هذا النوع من الأشياء! ما تحتاجه هو عالم بيانات قادر على التحقق من التعقل. شخص يعرف عدم تقديم نموذج دون التحقق من البيانات أولاً. شخص يرى البيانات من عام 2024 ويعتقد: "لكنها ليست بعد 2024!" هؤلاء الناس هم الناس الذين نحتاجهم.

بعد دعوتي لتناول الغداء ومناقشة طموح Lukas السابق لمشاهدة أفضل 250 برنامج IMDb ، تركنا أنا وجاسبر على الرغم من إلهامي. في حين أن إعادة تعيين هاتفي بالخجل إلى التاريخ الفعلي ، سألنا أنفسنا ما إذا كنا نريد أن نكون فلاسفة أو بناة التلسكوب. على الرغم من أنني أعرف طبيعتي ، قد يكون هناك فقط مجموعات قيمة بين الملفين. واحد منهم بالتأكيد ، هو لوكاس فيرمير.