4 분 소요

안녕하세요! 11기 SAFFYCIAL 김주현 기자입니다! 오늘의 포스팅은 SSAFY에서 한 달에 한번 진행되는, 삼성의 현업 개발자 분들과 질의 응답을 할 수 있는 ‘멘토링 프로그램’에 대해 다루고자 합니다. 이번 멘토링 프로그램은 ‘데이터’ 분야에 종사하시는 ‘키보드’ 멘토님을 모시고 진행하게 되었습니다! ‘데이터’ 분야에 관심을 가지는 학우분들께 많은 인사이트를 주는 시간이 되기를 바라며 포스팅을 시작하겠습니다!!


멘토 소개

우선 멘토님을 소개하겠습니다!!

키보드 멘토님

안녕하세요 멘토 ‘키보드’입니다. 학부 시절 전공은 ‘천문 우주학’이었지만, 현재는 삼성에서 2년차 개발자로 재직중이며, 하고있는 업무는 산업체에서 사용하는 AI 모델링과 기술을 전파하고 있습니다. 주로 사용하는 언어는 C, C++, 그리고 Python입니다. 저의 특기라고 말씀드릴 수 있는 건, 여러 사람과 생각을 공유하는 것, 그리고 다른 영역에서 사용되는 수치해석과 데이터 해석 기법을 가장 적합한 곳에 적용시키는 것이라고 할 수 있겠네요. 이번 멘토링 프로그램을 통해 제가 멘티님들께 목적지를 알려드릴 수는 없겠지만, 목적지를 같이 찾는 역할을 잘 수행하고 싶습니다.


질의 응답

다음의 내용은 질의 응답의 내용입니다!


QnA.1

김xx 멘티

Q. 같은 데이터 분야라 해도 다양한 직종이 있는 것으로 알고 있는데요. 어떤 것들이 있을까요?

키보드 멘토님

A. 데이터 엔지니어, 데이터 분석가, 그리고 데이터 사이언티스트 이렇게 3가지를 말씀드릴 수 있을 것 같습니다. 첫 번째, ‘데이터 엔지니어’의 경우, 데이터의 수집, 가공, 적재에 대한 업무를 수행하고, 이를 통해 ‘파이프 라인’을 구축해 데이터들을 정제해서 보내는 일을 한다고 설명드릴 수 있습니다. 그렇기 때문에 이러한 업무를 수행하기 위해서는 IT 전공 지식에 대한 내공이 상당히 필요하다고 말씀드릴 수 있을 것 같습니다.

두 번째로, ‘데이터 분석가’의 경우에는, 비즈니스에 대한 결정을 내릴 때, 데이터를 이용해 결정을 내리는 일을 수행하기 때문에, 데이터의 가공이나 IT쪽 보다는 PM같이 보고서를 만든다거나, 관련 부서와 협의하는 등의 업무를 수행한다고 말씀드릴 수 있을 것 같습니다.

마지막으로 ‘데이터 사이언티스트’의 경우, 머신러닝과 딥러닝을 활용하는 직종이기 때문에, ‘확률과 통계’, ‘선형대수’ 등 수학적인 지식이 많이 요구되는 직종입니다. ‘머신러닝’의 경우에는 숫자 데이터를 많이 다루어 ‘산업체’쪽에서 많이 사용되고, ‘딥러닝’은 이미지 쪽에 최적화된 기술이라고 볼 수 있습니다.


QnA.2

임xx

Q. 저는 데이터 엔지니어 쪽에 관심을 가지고 있는데요. 이를 위한 공부 방향에 대한 조언을 구하고 싶습니다.

키보드 멘토님

A. 데이터 엔지니어를 꿈꾸는 신입 분들이라면 분명 마주했을 문제여서 아시겠지만, 해당 분야에 입문하기에는 환경 자체가 잘 마련되지 않았기 때문에, 활용가능한 데이터가 적어 빅데이터나 클러스터링 에 관한 경험을 만들기에는 어려운 것이 현실입니다. 그렇기 때문에 차라리 CS지식을 많이 요구하는 데이터 엔지니어이기 때문에 CS에 대한 탄탄한 기본기를 닦고 응용하는 것을 추천합니다. 만약 해당 분야에 대한 경험을 만들고 싶다면, Apache Airflow나 Apche Kafka같은 기술을 활용하거나 『The Data Engineering Cookbook』을 읽으며 데이터에 대한 개괄을 공부하는 것을 추천합니다.


QnA.3

강xx 멘티

Q. 멘토님께서는 신입들의 포트폴리오를 많이 보셨을텐데, 인상깊었던 포트폴리오 내용으로는 무엇이 있었나요?

키보드 멘토님

A. 이 질문에 대해 확실한 답변은 어려울 것 같습니다. 그 이유는 신입 분들마다 포트폴리오 내용이 너무 달랐기 때문인데요. 예를 들자면, A라는 지원자는 대학에서 데이터를 다루었고, B는 실제 공장에서 쓰는 데이터는 데이터를 다루었다고 가정해봅시다. 그런데 문제는 대학과 공장에서 쓰는 데이터가 너무 다른 것도 그 이유 중 하나라고 할 수 있겠습니다. 오히려 저는 신입분들의 역량을 평가할 때, 신입 분들이 수집한 ‘모집단의 분포’에 크게 관심을 가집니다. 그 이유는 데이터란 수집한 사람의 마음 먹기에 따라 본인이 원하는 데이터만 뽑을 수 있기 때문에, 그 신뢰성에 의심을 가질 수 밖에 없습니다. 그래서 샘플링된 데이터의 ‘신뢰성’과 ‘확률 분포’ 등 데이터가 얼마나 잘 추출되었는지 ‘데이터의 습득성’을 확인하고, 기본기에 관한 질문에 대해 응답을 잘 하는 분에게 많은 점수를 주고 싶습니다. 또한 여러 기술적인 부분을 활용한 분들은 그 과정에서 기본적인 부분을 놓치는 부분이 많다고 느꼈지만, 기본기에 충실한 분들이 배움이 느리더라도 결국 성과가 좋았던 걸로 기억합니다.


QnA.4

강xx 멘티

Q. 데이터 분야에 대해서는 석사 혹은 박사 학위가 필요하다고 많이들 말씀하시는데, 정말 그런가요?

키보드 멘토님

A. 결론부터 말씀드리자면, ‘실제 산업체에서 쓰이는 데이터’와 ‘학문을 위한 데이터’ 중 무엇을 다루고 싶은지 본인이 지향하는 선택을 하면 될 것 같다고 말씀드리고 싶습니다. 그 이유는 회사와 대학이 각자 강조하며 공부하는 내용과 바라보는 방향이 다르기 때문입니다. 최근에는, 회사에서도 공부할 수 있게 지원을 많이 해주고 있으니, 참고하셔서 앞선 기준에 따라 본인이 판단을 따르면 될 것 같습니다.


QnA.5

유xx 멘티

Q. 실제 업무를 하실 때는 어떤 기술을 이용해서 데이터 분석을 하는지 궁금합니다.

키보드 멘토님

A. 데이터의 종류에 따라 사용되는 기술이 다릅니다. 예를 들어, 영상은 인간의 뇌를 흉내내어 시스템이 인간의 개입 없이 더 정확하게 객체를 식별하고 복잡한 작업을 수행하는 ‘딥러닝’, 숫자는 많은 데이터를 시각화하는 툴인 ‘Tableau’를 많이 사용합니다. 예를 들어, 현업에서 Tableau를 쓴다고 가정하면, 이번 분기에는 A와 B제품 중에 어느 것을 더 만드는게 좋은지 요구가 들어왔을 때, Tableau를 활용해 분석한 결과 A를 택하는 것이 더 나을 것 같다고 의견을 피력할 수 있겠습니다. 또한 데이터를 시각화하는 툴 중에는 ‘spotfire’도 있는데요. 경험상 제조업은 spotfire, 데이터 분석가는 Tableau를 많이 사용하는 것 같습니다. 만약 멘티 분께서 추가로 공부하고 싶으시다면, 같은 데이터 시각화 툴인 ‘minitap’과 데이터의 품질을 올리는데 도움을 줄 수 있는 툴인 6σ(six sigma)를 따로 공부하는 다양한 DI(Data Intelligence) 툴을 공부해보시는 것도 좋을 것 같습니다.


QnA.6

장xx 멘티

Q. 데이터 분석에 대한 최신 트렌드 파악은 어떻게 하시나요?

키보드 멘토님

A. 데이터 분야의 경우에는 워낙 트렌드 변화가 빨라서, 제가 추천드리고 싶은 방법은 영어로 된 블로그를 참고해서 공부하는 것이라고 말씀드리고 싶습니다. 추가로 어느 기술이든 간에 각자가 장단점을 가지고 있습니다. 그렇기 때문에 자신만의 주관적인 시각, 즉 안목을 길러서 기술을 택하고 공부하는 것이 좋을 것 같습니다.


마치며…

이 멘토링 이전까지 저는 ‘데이터’라는 분야에 대해 문외한이었지만, 언젠가는 공부해야겠다는 계획이 있었는데요. 이번 멘토링을 통해, 실제 데이터 분야 현업자 분의 조언을 들으며, 데이터 분야에 대한 개괄을 알 수 있었던 유익한 시간이었습니다. 이번 포스팅처럼 학우 분들께서 다양한 분야의 현업자 분의 조언을 들을 수 있는 멘토링 프로그램에 많은 관심을 가지고 참여하기를 바라며, 이번 포스팅 마치겠습니다!

11기_구미_김주현

댓글남기기