Marcel Tilly (Microsoft) gab in seiner Session „How Deep Learning pushes Computer Vision to the next Level“ einen Einblick in den Bereich der Computer Vision. Deep Learning spielt dabei inzwischen eine große Rolle, um bessere Ergebnisse zu erzielen. Die Technologie hat aber auch Nachteile. So lassen sich mithilfe von Algorithmen nicht nur Karzen in Videos finden, sondern auch Bilder manipulieren. Im Interview haben wir mit dem Speaker über aktuelle Trends, Tools, Möglichkeiten und Risiken gesprochen, die das Deep Learning im Bereich der Computer Vision bietet.
Im Interview: Marcel Tilly
Marcel arbeitet für Microsoft AI & Research in Deutschland. Früher hat er sich beruflich auf Data und High-Scale Systems konzentriert, heute liegt sein Schwerpunkt aber auf der Arbeit mit Natural User Interfaces sowie auf der Bild- und Spracherkennung. Neben Talks schreibt er gerne Paper und mag die Programmierung in Python, Elixir und Julia.
Die Session: How Deep Learning pushes Computer Vision to the next Level
Computer Vision enables computers to obtain a high-level understanding from images and videos by automatically extracting, analysing and understanding useful information. With autonomous driving, visual failure detection or scene understanding, computer vision is becoming one of the focus areas in artificial intelligence (AI) to enable computers to see and perceive like humans. This talk will help you understand the state of the art in computer vision using deep learning approaches. We will explain the differences and challenges in image classification, object recognition and image segmentation. Enriched with some sample code and explanations of algorithms we will go through the evolution of Computer vision thanks to deep learning. Why is scene description so much easier than segmentation? Is GPU always required? And finally – why is seeing not equal to understanding?