파이썬을 통한 자연언어처리과목 프로젝트

Document URL : http://blog.acuros.pe.kr/index.php?document_srl=33955
잡담 | Posted on May 12th, 2012 at 20:44 by Acuros | Modify

요즘 저는 카이스트에서 올해 처음 열린 "파이썬을 통한 자연언어처리"라는 과목을 듣고 있습니다.

수업 중 프로젝트가 있는데

저희 조는 다음과 같은 프로젝트를 하기로 했습니다.


드라마 대본을 넣으면 대본에서 주요 인물들을 보여주고 그 인물들 중 두 명을 고르면

경어체의 사용(어떤 체의 경어체를 사용하는가, 누구에게는 높이고 누구에게는 낮추는가, 어떤 빈도로 높이는가)을 분석하여 

시간에 따른 두 인물의 상하관계를 보여주는 그래프를 그리는 것입니다 !


꽤 흥미로운 주제이고 한글로 된 corpus를 처리한다는 점에서 나중에 꽤 자주 써먹을 수 있는 기술들을 익히고 있습니다.

으 근데 대본들에 오타도 있고 잘못된 문법의 사용이나 맞춤법이 틀려서 인식이 안되는 경우도 많네요.

형태소분석기가 잘못돼서 "하다" 가 명사로 인식될 확률도 높고 해서 이리저리 고생하고 있습니다.

나중에 프로젝트가 완료되면 관련 자료를 올리도록 하겠습니다.


Trackbacks : 0

Trackback URL : http://blog.acuros.pe.kr/index.php?document_srl=33955&key=0e8&act=trackback

Comments : 0

제레미 리프킨의 KAIST 방문

Document URL : http://blog.acuros.pe.kr/index.php?document_srl=33876
잡담 | Posted on May 10th, 2012 at 16:13 by Acuros | Modify

아래는 학내게시판의 글의 댓글을 글쓴이의 허락하에 가져온 것입니다.



"현재 겪고 있는 위기는 단순한 위기가 아닌 종의 위기"라는 말에서 출발했습니다. 
자연이 쌓아둔 자원의 31%를 사용하는 인간이 동시간대에 1%밖에 생산해내지 못한다고 하면서, 이대로라면 큰 위기가 닥친다는 이야기였죠. 
그렇게 새로운 economic vision의 필요성을 이야기했습니다. 


communication은 비약적인 발전을 몇 번 거쳤는데, 
1. 활자의 개발 
2. 매스미디어 
3. 컴퓨터 및 인터넷 
이라 이야기했습니다. 

3번의 특성에 의거해, 우리는 화석 에너지에서 새로운 에너지 패러다임인 Distributed Energy(이하 DER로 표기합니다)로의 전환을 이루어야 한다, 이것이 새로운 economic vision이라고 합니다. 
과거 큰 힘에 의해 움직이던 중앙에서 나누어 주는 식의 화석연료 체제가 아닌, 주변에 있는 풍부한 에너지원(태양열, 바람, 등등 신재생에너지)을 이용해 각자 필요한 동력(주로 전기)을 생산하는 구조가 되어야 한다고 하지요. 
인터넷의 큰 특성은 Top-down이 아닌 Side-by-side 구조라는 점을 이야기했습니다. 


이를 위해 구축한 EU의 5 pillars system이 예시로 등장합니다. 

pillar 1. 2020년까지 총 에너지 중 20%의 신재생 에너지 비율 달성 
pillar 2. DER을 모으는 시스템 구축(ex: 태양열만으로 동력을 해결하는 빌딩). 이게 완성되면, 건물이나 컴퓨터 자체가 하나의 발전소로 기능할 수 있다고 합니다. 
pillar 3. 수소를 주 매체로 하는 저장 시스템의 구축. [DER에 의해 발전-수소 저축-DER이 없을 때 수소 사용] 사이클을 이야기했습니다. 
pillar 4. 인터넷을 통한 nervous system과 같은 기능 구축. 
pillar 5. 사용자가 에너지 소비만이 아니라 판매의 주체도 될 수 있는(남는 에너지를 판매할 수 있는) 시스템의 구축 

로 이루어집니다. 


소프트웨어를 통한 음악 산업을 비웃던 음악계는 한방을 먹었고, 
블로그를 무시하던 신문사는 블로그를 하나씩 갖게 되었습니다. 
인터넷에 의한 DER의 분배 역시 얼마든지 힘을 가질 수 있는 것입니다. 
이를 통해 에너지의 "democratize"를 이루어 낼 수 있다고 했지요. 

(3D printing을 이야기했는데, 메모가 부정확해서 맥락을 모르겠습니다;) 


인터넷의 side-by-side 특성이 다시 나오면서, ETSY라는 홈페이지 이야기가 나왔습니다. 
어느 학생이 자작 가구 판매를 중개하는 사이트를 만든 것인데, 사무실 하나 없이 인터넷만으로 500만 달러를 벌어들이는 사이트가 되었죠. 
이처럼 3차 산업 혁명에서는 국경이 없어질 것입니다. Wi-fi는 아주 좋은 예로, 중심에서 점차 Node가 확장되어 모두가 연결되는 큰 시스템을 구축한다는 것이죠. 
이런 환경에서는 슈퍼컴퓨터로도 분석하기 힘든 우주 현상을 전지구상의 컴퓨터 자원을 조금씩 모아 큰 분석할 수 있게 될 것입니다. 
EU는 주변 대륙으로 DER System을 전파하는 주체가 될 것이라는 이야기를 했습니다. 어떤 상품을 파는 게 아니라요. 


이처럼 시대는 변화하고 있고, 아시아, 그리고 한국도 변화해야 합니다. 
한국의 에너지 의존도(66% 화석, 33% 원자력)와 유럽(독일의 예시를 들었습니다)의 비교가 나왔고요. 
한국의 Green Energy potential은 높으며, 이를 이용하지 않는 것이 아쉽다고 했습니다. 
수출이 소득의 20%라고 하나, 내수를 살펴야 한다는 이야기도 했고요. 


앞으로의 시대는 empathy가 주가 되는 시대가 올 것이며, 이것을 확장해 나가야 된다고 했습니다. 
우리가 그 주축이 되어야 하며, 그를 위해 'start conversation'해야 한다는 것이지요. 

---------- 

뒷부분으로 갈수록 메모가 허술해서 내용이 부족합니다. 혹여 제가 잘못 적었거나 틀린 부분이 있으면 지적 환영합니다. 

Trackbacks : 0

Trackback URL : http://blog.acuros.pe.kr/index.php?document_srl=33876&key=72f&act=trackback

Comments : 0

항상 마감을 지키는 조직

Document URL : http://blog.acuros.pe.kr/index.php?document_srl=31778
잡담 | Posted on March 31st, 2012 at 11:52 by Acuros | Modify

일간 신문이 있는 도시라면 어디나 매일 새로운 제품(신문) 개발하는 숙련된 조직이 있다. 그들은 마감을 넘기는 일이 절대 없다. 마감 직전에 뉴스가 변경되거나, 컴퓨터가 다운 되는 상황, 심지어는 해당 지역에 재해가 발생한 경우에도 거의 예외없이 마감 기한은 지켜진다. , 절대 마감기한을 놓치지 않는 개발 프로세스를 보고 싶은 여러분이라면 지역 신문사를 찾아가 벤치마킹 하라

Implementing Lean Software Development 인용


Trackbacks : 0

Trackback URL : http://blog.acuros.pe.kr/index.php?document_srl=31778&key=d33&act=trackback

Comments : 0

Kent Beck

Document URL : http://blog.acuros.pe.kr/index.php?document_srl=31759
잡담 | Posted on March 31st, 2012 at 10:32 by Acuros | Modify

저는 2년 전 부터 Kent Beck과 facebook 친구였습니다.

애자일을 좋아하고 공부하는 한 학생으로서, 그리고 개발자로서 Kent Beck은 존경하지 않을 수 없는 인물이죠.

http://agile.egloos.com/5084979를 인용하여 Kent에 대해서 잠시 설명하자면


켄트 벡은 현재 TRI(Three Rivers Institute)의 설립자이자 소장이다. 그가 지금껏 일생을 통해 소프트웨어 개발에 한 기여는 매우 다양하다.
 

그 중 잘 알려지지 않은 것으로는 소프트웨어 패턴이 있다. 그는 1987년 워드 커닝햄(Ward Cunningham)과 함께, 건축계의 패턴 개념을 소프트웨어 개발에 적용한 선구자였다. 그의 작업들은 향후 디자인 패턴 등 패턴 운동 전반에 큰 영향을 미치게 된다. 그리고 개발자들의 테스팅 도구 xUnit의 개발도 중요한 기여이다. xUnit은 단위 테스팅 프레임워크로 개발자들 간에 현재 전세계적으로 사실상의 표준으로 자리잡고 있으며 수 백 가지 프로그래밍 언어로 번역되었고, xUnit의 전파를 통해 개발자 단위 테스팅이 널리 확산되었다. 또한 xUnit과 함께 테스트를 먼저 실시하는 테스트 주도 개발(Test Driven Development)을 재발견하고, 널리 퍼뜨린 바 있다. 무엇보다도 켄트 벡은 애자일 방법론의 핵심 선구자 중 한 사람으로 그가 탄생시킨 익스트림 프로그래밍(Extreme Programming)은 개발자 사회에서 새로운 문화를 만드는 중요한 역할을 했다.

그가 만든 익스트림 프로그래밍 및 애자일 방법론은 현존하는 소프트웨어 개발 방법론 중 가장 빠르게 성장하고 있는 방법론 중 하나이며, 2006년도 포레스터 리서치 보고에 따르면 북미 유럽 IT 기업 중 17%가 애자일 방법론을 사용 중이다.


뭐 이런 분입니다.

오늘은 현재 제가 참가하고 있는 팀의 상황을 설명하고 조언을 구하느라 시간을 꽤 잡아먹었는데도 친절히 답변을 해주셨어요.

하ㅏㅏㅏ핳 좋다.

아무튼 저는 Kent Beck이 쓴 책들을 많이 읽었고 읽을 때 마다 많은 감명을 받아요.

Kent가 쓴 책들은 다 읽어보세요 !


그냥 오늘은 정말 주제 없는 잡담 ..

Tagged :
   

Trackbacks : 0

Trackback URL : http://blog.acuros.pe.kr/index.php?document_srl=31759&key=2f5&act=trackback

Comments : 0

MBTI의 가치

Document URL : http://blog.acuros.pe.kr/index.php?document_srl=31536
잡담 | Posted on March 23rd, 2012 at 19:36 by Acuros | Modify

이 글은 MBTI에 대해 대략적으로 알고 있다는 전제하에 작성하였습니다.

MBTI에 대해서는 http://agile.egloos.com/5265969에 매우 잘 설명되어있습니다.


자신의 MBTI를 아는 것은 중요합니다.
하지만 그것이 자신이 어떠한 성향을 가지고 있다는 것을 나타내는 문자가 의미를 가지는 것은 아닙니다. 예를 들어 "나는 ENTP야!" 라고 하는 것은 그냥 나의 성격을 MBTI를 이용하여 함축적으로 표현하는 것 뿐입니다. MBTI의 실제 가치는 MBTI를 통해 자신의 약점을 파악할 때 생깁니다. 다시 말하면 "ENTP"인 사람은 자신에게 반대 타입인 "ISFJ"가 부족하다는 사실을 인지할 때 가치가 있습니다. 따라서 자신의 MBTI를 알 때에 의식적으로 자신의 약점을 생각할 필요가 있습니다.

나는 어떤 생각이 부족할까?


예를 들면
I타입인 사람들은 "브레인스토밍 등의 회의시간에 내 의견을 혼자만 생각하고 말하지 않고 있는지는 않은가"
E타입인 사람들은 "자신의 강력한 주장과 많은 말로 회의를 점유하고 있기 때문에 다른 사람들이 말을 못하고 있지는 않은가" 등을 생각해봐야합니다.

저는 주기적으로 MBTI검사를 하는 편인데(MBTI는 자주 바뀝니다) 매번 MBTI를 검사를 할 때 마다 "항상" E가 100%를 차지합니다. 실제로 저는 회의시간에 제 생각을 많이 말하는 편이고 제가 말을 하는데 있어서 "공격을 당하지는 않을까?" 하는 생각을 남들보다 덜 하는 편입니다. 또한 그렇기 때문에 회의분위기가 저에 의해 좌우되고 제가 회의를 이끌어가게 되는 경우가 많습니다. 하지만 이것이 항상 좋은 결과를 낳지만은 않습니다. 먼저 보이지 않는 압박에 의해 저와 대립되는 아이디어들이 입밖으로 나오기가 어렵습니다. 또한 집단지성으로 가야할 회의가 저를 중심으로 한 "집단사고"로 가는 경우가 되기도 합니다. 결과적으로 다른 사람들이 생각을 할 기회를 잃게만들고 팀의 잠재적 사고능력을 저하시킬 수도 있습니다. 따라서 저는 "말하지 않고 따로 생각한 후 생각한 것 그대로 말하기", "나는 가장 나중에 말하기" 등과 같은 방법을 회의에 사용하기도 합니다.


S타입인 사람들은 "내가 숲을 보지는 못하고 나무에만 집착하고 있지는 않은가"등을 생각해야하고
N타입인 사람들은 "내가 너무 추상적인 것만 생각하고 디테일에 신경쓰지 못하고 있지는 않은가" 와 같은 생각을 해봐야합니다.

저는 N타입입니다. 가끔 S가 나오기도 하는데 전체적으로 N타입이고 부분적으로 S타입이어서 N타입 성향이 나오는 경우가 많습니다. N들끼리 모인 회의에서는 서로 생각도 잘 맞고 회의도 잘 됐다고 기쁘게 회의를 끝내도 실제로는 서로 다른 생각을 했다가 실제 일을 할 때에 충돌이 날 확률이 높습니다. N들은 추상적인 단어를 주로 활용하기 때문에 각 단어에 대한 이해가 서로 다를 수 있기 때문입니다. 예를 들어서 "고객을 만족시켜야한다." 라는 것이 누구에게는 "고객이 요구하는 것들을 모두 들어줘야한다." 로 해석될 수 있고 누구에게는 "고객이 요구하는 것들을 들어주는 것보다는 진정으로 고객이 원하는 것을 파악해서 만족시키자."로 해석될 수도 있습니다. 각자의 기준에서 고객을 만족시키는 행위는 다를 수 있으니까요.
반면 S타입들의 회의는 소모적인 회의가 될 수도 있습니다.너무 디테일한 레벨에서 얘기하고 조정하느라 시간을 낭비할 수 있습니다. 결국에는 한단계만 추상화시켜도 같은 얘기를 하고 있는데말이죠.


T/F, J/P는 굳이 적지 않겠습니다. 어쨌든 중요한건 자신의 약점을 파악하고 의식적으로 보완할 생각을 하는 것이기 때문에 T/F, J/P는 직접 생각해보세요.


개인에서 팀으로


이걸 조금만 더 응용하면 개인에서 팀으로 넘어갈 수 있습니다. 팀 전체의 성향이 파악이 되면 상대적으로 적은 성향을 가진 사람들이 나타납니다. 그럼 그런 사람들은 팀내에서 꽤 압박을 받을 것입니다. 나는 조금 더 구체적이었으면 좋겠는데 팀 사람들은 왜이렇게 답답하냐고 하고 .. 나는 혼자 더 생각해봤으면 좋겠는데 팀 사람들은 어서 지금 얘기해보라고 하고 ..
따라서 팀의 성향을 파악하는 것도 중요합니다. 팀의 성향을 파악하고 소수성향의 사람들의 의견이 중요하다는 것을 인식해야합니다. 왜냐하면 대부분이 하지 못하는 생각을 그들이 가지고 있기 때문이죠. 또한 그들이 팀 내에서 억압받지 않도록 배려해줘야합니다. 그들은 나름대로 스트레스를 받고 있을 것이기 때문에 최대한 스트레스를 받지 않도록 도와줘야합니다. 그들이 있기에 팀이 한 방향으로만 치우치지 않고 밸런스를 유지할 수 있기 때문입니다. 그들마저 팀을 떠나면(혹은 팀 내에서 의견을 내기를 포기하면) 팀은 반대성향의 피드백을 받지 못하고 극단적인 팀이 되기 쉽습니다.


그리고 한가지 주의할 점이 있습니다. MBTI가 한 사람의 성격의 모든 것을 말해주지는 않는 다는 것입니다. MBTI는 성격 중 4개의 criteria만을 보고 그 성향을 나타내주는 지표인 만큼 그저 참고치 정도만 된다는 것입니다. 뿐만 아니라 내가 어떠한 성향이 나타난다고 해서 내가 그 반대의 성향을 아예 갖지 않는 것은 아닙니다. 상대적인 것이죠. 오히려 그렇기 때문에 MBTI를 맹신하면 안되고 그만큼 나의 성향을 나타내는 MBTI 자체가 가치를 가지지는 않는다는 것입니다. 따라서 MBTI를 통해 우리가 배울 수 있는 것은 "균형을 유지하고 있는가?" 의 질문을 끊임없이 해야하고 팀의 균형을 유지해야하는 것입니다. 여기서의 균형을 유지하기 위해 팀에는 4가지의 리더쉽이 존재해야합니다.

1. Motivation - 주로 MBTI유형 중 NF형이 Motivational Leadership을 가지고 있습니다. 사람들을 격려하고 팀의 분위기를 생각하는 등 "행복"을 추구하는 리더쉽입니다.
2. Organization - 주로 MBTI 유형 중 SJ형이 Organizational Leadership을 가지고 있습니다. 시간을 분배하거나 역할을 분배하는 등 조직의 "효율성"을 중시하는 리더쉽입니다.
3. Information, Idea, Innovation - 주로 MBTI유형 중 NT형이 I형 Leadership을 가지고 있습니다. 새로운 정보와 아이디어를 제시하고 "혁신"을 추구하는 리더쉽입니다.
4. Jiggle - 주로 MBTI유형 중 SP형이 Jiggle Leadership을 가지고 있습니다. 보통 팀의 Trouble shooter역할을 하고 흥미진진한 것을 좋아하며 "행동"을 중시합니다.


위 4가지 리더쉽이 균형을 이룰 때 팀은 잘 굴러갑니다. 그리고 팀 리더는 위 4가지 리더쉽이 이 팀에 발휘되고 있는가를 지속적으로 판단해야합니다. 혼자서 모든 것을 다할 수는 없을 것입니다. 각 리더쉽에 맞는 내부리더를 세워 위임을 하는 것도 매우 좋은 방법입니다. 팀을 이끌어가는 것과 위임과 관련된 것은 다음에 또 기회가 되면 블로깅을 해보겠습니다. 끝으로 저도 애자일 이야기 블로그의 마지막 인용구를 적어볼까 합니다. 저에겐 매우 인상적인 구절입니다.


 우리는 같음을 통해 연결되고 다름을 통해 성장합니다.


이제 3일 뒤 중간고사 공부를 해야하기 때문에 담고 싶은 내용을 모두 담지는 못했네요. 다음에 기회가 될 때 연장해서 적어보겠습니다.

P.S. 저는 팀 리딩과 팀 심리학과 관련된 것을 애자일 컨설팅 김창준 대표님께 가르침을 받았습니다. 감사합니다.

Tagged :
   

Trackbacks : 0

Trackback URL : http://blog.acuros.pe.kr/index.php?document_srl=31536&key=1e9&act=trackback

Comments : 1

Author bang
2012.04.28 at 19:11:21
댓글 | |

와~ 잘 읽었습니다~

« 첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지 »