티스토리 뷰

바트 파싱기 정규식 작성 할때 팁.

krfreedevlife 2017. 9. 9. 21:49
반응형


사진은 skins의 Kaya Rose Scodelario (effy 역으로 나왔죠)

집 탈출해서 친구랑 놀러가는 버스에서 맞은편 아저씨한테 끼부리는 씬이었죠

아! 인스타그램에서 임신했었던 사진도 올라왔었죠...

사진 올리려고 인터넷 보다가 갑자기 다른데로 새서; 

암튼 본론으로 들어갈게요;;;





바트파싱기


바트 파싱기는 갠적으로 편리하게 만들었단 생각이 드는 소스인데요


더 자세한건 바트 파싱기로 검색하시면 바로 찾으실수 있구요


파싱기를 사용하실때는 주로 정규식 부분이 관건이죠. 




1. 정규식 옵션 i, is, isx 


정규식을 작성할때 뒤에 옵션을 사용하게 되는데


보통 약간 프리한 느낌의 is와 빈칸에 엄격한 isx가 있죠


어느게 더 좋은 것인가는 사용하는 스타일마다 다르긴 한데요


정확하게 되어있는데도 결과값을 반환해주지 않는다면 


뒤에 옵션을 변경하면서 해보시는게 좋습니다.



* x옵션을 넣을때는 빈칸을 \s로 체크해주는 것 주의하시구요


정규식 검사 사이트 같은데를 이용해보면 

분명 추출하고 있는데 

막상 파싱기에서는 작동이 안될때도 있거든요





2. 게시물의 제목은 언제 수집한 데이타인가.


그리고 제일 많이 헷갈려 하시는게


목록수집에서 링크와 제목을 가져오지만 실제로 게시물의 제목이 저장되는 것은


목록을 가져올때가 아닌 게시물 등록을 할때 각 게시물의 제목입니다. 


목록수집의 제목은 그냥 목록에서 노출되기 위한 것이지 저장되는 것이 아니에요.





3. 날짜는 적어도 월 일 이상이 표시된 것이어야 합니다.


가령 몇시간전, 몇일전 이런 형태로 보여지는 날짜는 저장하면 오류가 나게 됩니다.


만약 25일이라면 3일전이면 22일이겠구나 하고 사람은 생각하지만 


파싱기에서는 기준 되는 날짜가 없기 때문에 오류가 발생됩니다.


즉, 2시간 전이라는 것을 어느 시간의 기준으로 2시간 전인가를 계산하지 않는한 

2시간 전이라는 것은 시간을 표시해주지 않습니다.


파싱기에서 따로 날짜를 계산하는 코드를 추가해주던가 


아니면 날짜를 신경쓰지 않는 것이 좋습니다. 


저장 후 스킨에서 날짜를 표시 하지 않는 경우도 있을 거고  


혹은 날짜 표시가 되는 적당한 위치(페이지를 뒤쪽에서) 할 수 있지만


내용에도 날짜 등이 포함되거나 섞일 수 있기 때문에 정신건강에 별로 안좋습니다.





4. 중복검사에서 체크 되는 것은 and ? or?


중복검사에서 제목, 내용, 글쓴이 등을 선택할 수 있는데요.


결론은 and 입니다.



중복검사를 하는 방식이  체크된 것들을 하나의 문자열로 만들어서

그것을 암호화 하는 방식이기 때문에 

or이 아닌 and로 이해하셔야 합니다.


즉, 제목, 내용을 체크한 경우는 제목과 내용이 같다면이란 뜻입니다.








반응형
댓글
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2025/01   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함