Con el profundo desarrollo de Internet e Internet móvil, brindar a los usuarios servicios personalizados de alta calidad se ha convertido en un elemento clave para que varias aplicaciones mejoren la experiencia del usuario y aumenten los ingresos. En los últimos años, con el desarrollo de la potencia informática del hardware y la generación de datos a gran escala, el aprendizaje profundo ha progresado rápidamente en los campos del procesamiento de imágenes y el procesamiento del lenguaje natural. A diferencia de los datos continuos y densos, como imágenes, textos y voces, en las aplicaciones básicas de Internet, como la publicidad, la recomendación y la búsqueda, los datos tienen características únicas, como la dispersión y la estructura de alta dimensión. Además, la escala de los datos a nivel industrial en sí misma es enorme, y cómo aplicar de manera eficiente el aprendizaje profundo para resolver las necesidades comerciales también enfrenta grandes desafíos.
El 19 de marzo, la "Conferencia de intercambio de tecnología de aplicaciones centrales de Internet" organizada por NVIDIA y CECport invitará a invitados de NVIDIA, Kuaishou, Ali y CLP para compartir algoritmos y experiencia práctica de ingeniería en escenarios de aplicaciones centrales de Internet.
(Identifica el código QR y participa de inmediato)
Noticia importante
-
Los diversos componentes de HugeCTR y cómo aceleran y optimizan el entrenamiento y la inferencia.
-
Cómo construir tareas de aprendizaje contrastivas en escenarios de clasificación
-
Cómo construir un sistema de funciones para ordenar tareas
-
Exploración en profundidad del procesamiento del lenguaje natural, flujo del algoritmo del modelo de detección industrial
Actividades
Hora del evento: 19 de marzo (sábado) 09: 00-11 : 30
Lugar: Sala en vivo de DataFunTalk
Organizador: NVIDIA, CECport
Organizador: DataFun
Agenda detallada
Introducción detallada
-
Shi Ji Ingeniero de sistemas de recomendación de NVIDIA
Tema del discurso: marco del sistema de recomendación NVIDIA Merlin HugeCTR
Introducción del tema: NVIDIA Merlin HugeCTR es un marco de sistema de recomendación acelerado por GPU diseñado para distribuir capacitación y estimar tasas de aciertos entre múltiples GPU y nodos. Esta charla presentará principalmente los diversos componentes de HugeCTR y cómo aceleran y optimizan el entrenamiento y la inferencia.
Lo más destacado del contenido:
1. Cómo la capa de incrustación de HugeCTR está diseñada para superar las limitaciones de memoria y comunicación para realizar el entrenamiento de incrustaciones extragrandes.
2. Cómo el servidor de parámetros jerárquicos de HugeCTR acelera la inferencia.
3. Complemento HugeCTR SOK, para que las funciones y optimizaciones relacionadas con HugeCTR se puedan usar en Tensorflow.
Perfil personal: Graduado de la Universidad de California, Berkeley con una licenciatura y un posgrado de la Universidad de Cornell. Ahora es miembro del equipo de Nvidia Merlin HugeCTR, principalmente responsable del diseño y desarrollo del marco del sistema de recomendación.
-
Liu Jingwei Experto en algoritmos Kuaishou
Tema del discurso: Aplicación del aprendizaje contrastivo en el reordenamiento de recomendaciones de Kuaishou
Introducción al tema: Los logros del aprendizaje comparativo en CV y NLP demuestran que el aprendizaje autosupervisado puede mejorar la calidad de los datos y mejorar el efecto de los modelos. Este intercambio se centra principalmente en el aumento de datos y la construcción de tareas. Aprendizaje contrastivo aplicado a escenarios de clasificación para recomendar sistemas
Puntos destacados del contenido: Cómo construir tareas de aprendizaje contrastivas en escenarios de clasificación
Perfil personal: Graduado de la Universidad Jiaotong de Shanghai con una maestría. Se unió a Kuaishou en 2019, participó en la optimización de enlaces completos de los escenarios de recomendaciones ascendentes y descendentes de Kuaishou, y tiene una gran experiencia en recuperación y clasificación.
-
Ingeniero de algoritmos Wang Ziyi Alibaba
Tema del discurso: Optimización de CVR en escenarios de pedidos de clientes escasos y altos
Introducción del tema: A diferencia de otras plataformas de comercio electrónico, los viajes son una demanda de baja frecuencia y el precio unitario de los productos de viaje suele ser alto. Cómo estimar con precisión la demanda de compra del usuario es un gran desafío para el equipo de algoritmos inteligentes de la industria. Este informe cubra todos los aspectos para compartir parte de nuestro trabajo en la estimación de CVR desde características hasta modelos.
Lo más destacado del contenido:
1. Cómo construir un sistema de funciones para clasificar tareas
2. Diseño y optimización del modelo CVR bajo desequilibrio extremo
3. Optimización de la clasificación de pérdidas bajo un modelo profundo
Perfil personal: Graduado del Departamento de Ciencias de la Computación y Tecnología de la Universidad de Nanjing con una maestría en 2019. Después de graduarse, se unió al Equipo de Algoritmos Inteligentes de la Industria de Alibaba Fliggy y participó en la recomendación de la página de inicio, la optimización del algoritmo de clasificación de la principal de Fliggy. búsqueda y búsqueda pequeña de hotel.
-
Zou Mingyang Ingeniero Técnico de CLP Port
Tema del discurso: Aprendizaje profundo - Optimización del modelo de escena
Introducción al tema: presente el proceso de aprendizaje profundo y aplíquelo en la función de excitación y la mejora de datos. Exploración en profundidad del procesamiento del lenguaje natural, flujo del algoritmo del modelo de detección industrial.
1. Introducción al aprendizaje profundo
A. Neuronas
B. Construcción de la red
C. Función de excitación
2. Implementación del modelo
A. Aumento de datos
B. Implementación del modelo
3. Procesamiento del lenguaje natural
4. Inspección industrial
Perfil personal: Zou Mingyang Vinson.Zou, Máster de la Universidad Politécnica de Hong Kong. Principales áreas de ataque: inteligencia computacional, big data, aplicaciones IoT, seguridad en la comunicación de datos. En el trabajo de soporte técnico del departamento de NVIDIA de CLP Port, apoya principalmente las soluciones de arquitectura de operación y mantenimiento del centro de datos, y tiene una investigación profunda sobre sistemas de procesamiento de lenguaje natural, pruebas industriales y pruebas médicas.
¡ Haga clic para leer el texto original para registrarse y participar!