2011. november 29., kedd

7. MOLEKULÁK MEGJELENÍTÉSE

Hemoglobin (2DN2)
Különböző megjelenítési formák:





2. négy lánc eltérő színekkel való megjelenítése


3. hem-csoport eltérő módon való megjelenítése+5. molekulán belüli hidrogénkötések megjelenítése
 4. van der Waals sugár/felszín megjelenítése
 6. molekula szélességének-hosszának a meghatározása
Hosszúság: 67,7 A
Szélesség: 57,12 A


8. adott aminosav szelektív megjelenítése -  Ala129D – csak a D lánc alaninját jeleníti meg
9. jelenítsük meg szelektíven a tirozin aminosavakat
10. jelenítsük meg szelektíven a tirozin plusz alanin aminosavakat
tirozin-piros
alanin-pink
11. jelenítsük meg szelektíven a hidrofób aminosavakat
Alanin

Glicin

Leucin

Metionin

Fenilalanin

Prolin

Triptofan

Tirozin

Valin

2011. november 28., hétfő

6. FILOGENETIKAI ANALÍZIS

Cytochrome b fehérje

>gi|3659969|pdb|1BCC|C
---------------mapnirkshpllkminnslidlpapsnisawwnfgsllavclmtqiltglllamhytadtslafs
svahtcrnvqygwlirnlhangasffficiflhigrglyygsylyketwntgvillltlmatafvgyvlpwgqmsfwgat
vitnlfsaipyightlvewawggfsvdnptltrffalhfllpfaiagitiihltflhesgsnNPLGISSDSDKIPFHPYY
SFKDILGLTLMLTPFLTLALFSPnllgDPENFTPANPLVTPPHIKPEWYFLFAYAILRSIPNKLGGVLALAASVLILFLI
PFLHKSKQrtmtFRPLSQTLFWLLVANLLILTWIGSQPVe-hPFIIIGQMAslsyftillilfptigtlenkmlny----
-----------------
>gi|4139394|pdb|1BGY|C
----------------mtnirkshplmkivnnafidlpapsnisswwnfgsllgiclilqiltglflamhytsdtttafs
svthicrdvnygwiirymhangasmfficlymhvgrglyygsytfletwnigvillltvmatafmgyvlpwgqmsfwgat
vitnllsaipyigtnlvewiwggfsvdkatltrffafhfilpfiimaiamvhllflhetgsnNPTGISSDVDKIPFHPYY
TIKDILGALLLILALMLLVLFAPdllgDPDNYTPANPLNTPPHIKPEWYFLFAYAILRSIPNKLGGVLALAFSILILALI
PLLHTSKQrsmmFRPLSQCLFWALVADLLTLTWIGGQPVe-hPYITIGQLAsvlyfllilvlmptagtienkllkw----
-----------------
>gi|3660378|pdb|3BCC|C
---------------mapnirkshpllkminnslidlpapsnisawwnfgsllavclmtqiltglllamhytadtslafs
svahtcrnvqygwlirnlhangasffficiflhigrglyygsylyketwntgvillltlmatafvgyvlpwgqmsfwgat
vitnlfsaipyightlvewawggfsvdnptltrffalhfllpfaiagitiihltflhesgsnNPLGISSDSDKIPFHPYY
SFKDILGLTLMLTPFLTLALFSPnllgDPENFTPANPLVTPPHIKPEWYFLFAYAILRSIPNKLGGVLALAASVLILFLI
PFLHKSKQrtmtFRPLSQTLFWLLVANLLILTWIGSQPVe-hPFIIIGQMAslsyftillilfptigtlenkmlny----
-----------------
>gi|14277714|pdb|1EZV|C
---------------mafrksnvylslvnsyiidspqpssinywwnmgsllglclviqivtgifmamhyssnielafssv
ehimrdvhngyilrylhangasfffmvmfmhmakglyygsyrsprvtlwnvgviiftltiataflgyccvygqmshwgat
vitnlfsaipfvgndivswlwggfsvsnptiqrffalhylvpfiiaamvimhlmalhihgssNPLGITGNLDRIPMHSYF
IFKDLVTVFLFMLILALFVFYSPntlgHPDNYIPGNPLVTPASIVPEWYLLPFYAILRSIPDKLLGVITMFAAILVLLVL
PFTDRSVVrgntFKVLSKFFFFIFVFNFVLLGQIGACHVe-vPYVLMGQIAtfiyfayfliivpvistienvlfyigrvn
k----------------
>gi|461886
------------marrlsilkqpifstfnnhlidyptpsnisywwgfgslaglclviqiltgvflamhytphvdlaflsv
ehimrdvkggwllrymhangasmffivvylhffrglyygsyasprelvwclgvvilllmivtafigyvlpwgqmsfwgat
vitslasaipvvgdtivtwlwggfsvdnatlnrffslhyllpfiiagasilhlaalhqygsnNPLGINSSVDKIAFYPYI
YVKDLVGWVAFAIFFSIFVFYAPnvlgHPDNYIPANPMSTPAHIVPEWYFLPVYAILRSIPNKLGGVAAIGLVFVSLLAL
PFINTSYVrsssFRPIHQKFFWLLVADCLLLGWIGCQPVe-aPYVTIGQIAsvgfffyfaitpilgkcearliknsnace
arsvlasfltsigllww
>gi|15604141|ref|NP_220656.1|
mnkeiihkksngiiewidyrlpifsflkhfsyyqtpknlnylwnlgsiagialviqiitgvilamhytphvdhafesver
imrnvnygwllrythavgasmffaaiylhiarglyygsyktprellwhigiiiflimmatafmgyvlpwgqmsywgatvi
tnlfsaiplvgepiviwlwggfsvdnptlnrffalhylfpfiivvlvilhlvalhqhgsnnpKGIDVKSTKDTIPFHPYY
TVKDFVGFGVYFIIFAYFIFYAPnylgHPDNYIPANPLVTPAHIVPEWYFLPFYAILRAVPSKLGGVFLMFGSIVVLFLL
PWLDTSKIrsgnYRPIYRIAFWIFMADCLFLGYLGSKPVs-ePYITISRFAvcyyfchfllvlpligkyekplplpkvl-
-----------------
>gi|117849|sp|P23663|CYB_CHLSM
---------------mrmhnkiqllsvlnthlvayptpmnlnyswnggslagmmlasqmltgillamhyvghvdyafasv
qhlmtdvpsgmilryahangaslffivvylhvlrgmyygsgaqpreivwisgvvillvmiitafigyvlpwgqmsfwgat
vitslataipvvgkhimywlwggfsvdnptlnrfysfhytlpfilaglsvfhiaalhqygstNPLGVNSQSSLISFGSYF
GAKDLVGALFLALVFSILVFFYPdllgHPDNLIPANPYSTPQHIVPEWYFLWVYAILRSIPNKAMGVLAIGLVFASLFAM
PFIGLGGGk---FRTITEWLYWTFLADVLLLTWLGGNEIt-pITSFVGQCCtaylffyllvcqplvgyletqfahgtqtn
-----------------
>gi|18860342|ref|NP_569659.1|
--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
-------------------------------------------------mgvtkkpdlndpvSRAKLAKGMGHNYYGEPA
WPNDLLYIFPIVILGTIACIAGLavlePSMIGEPANPFATPLEILPEWYFYPVFQILRTVPNKLLGVLLMASVPAGLLTV
PFLENVNKf--qNPFRRPVATTVFLIGTVVAIWLGIGAAlpiDRSLTLGLF-----------------------------
-----------------
>gi|129859
--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
-------------------------------------------------matqkkpdlsdpqLRAKLAKGMGHNYYGEPA
WPNDLLYVFPIVIMGSFAAIVALavldPAMTGEPANPFATPLEILPEWYLYPVFQILRSLPNKLLGVLAMASVPLGLILV
PFIENVNKf--qNPFRRPVATTVFLFGTLVTLWLGIGAAlplDKSLTLGLF-----------------------------
-----------------
>gi|11467222|ref|NP_043054.1|
--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
-------------------------------------------------mgvtkkpdlndpvLRAKLAKGMGHNYYGEPA
WPNDLLYIFPVVILGTIACNVGLavlePSMIGEPADPFATPLEILPEWYFFPVFQILRTVPNKLLGVLLMVSVPTGLLTV
PFLENVNKf--qNPFRRPVATTVFLIGTAVALWLGIGATlpiDKSLTLGLF-----------------------------
-----------------
>gi|461876
--------------mkkfmnffssneflkmimstiylptpvninymwnfgsilgiflmiqiisgfilsmhycpnidiafw
sitnimkdmnsgwlfrlihmngasfyflmmyihisrnlfycsyklnnvwgigimillmsmaaafmgyvlpwgqmsywgat
vitnllsaipyigdtivlwiwggfsinnatlnrffslhfilpllilfmvilhlfalhltgssNPLGSNFNNYKISFHPYF
SIKDLLGFYIILFIFMFINFQFPyhlgDPDNFKIANPMNTPTHIKPEWYFLFAYSILRAIPNKLGGVIGLVMSILILYIM
IFYNNKMMnn-kFNMLNKIYYWMFINNFILLTWLGKQLIe-yPFTNINMLFtttyflyfflnfylsklwdnliwnspln-
-----------------
>gi|129865
--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
-------------------------------------------------msimkkpdlsdpkLRAKLAQNMGHNYYGEPA
WPNDILFTFPICIAGTIGLITGLaildPAMIGEPGNPFATPLEILPEWYLYPVFQILRVLPNKLLGIACQGAIPLGLMMV
PFIESVNKf--qNPFRRPVAMAVFLFGTAVTLWLGAGACfpiDESLTLGLF-----------------------------
-----------------
>gi|129853
--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
-------------------------------------------------msvtkkpdlndpvLRAKLAKGFGHNTYGEPA
WPNDLLYIFPVVIFGTFACCIGLavldPAAMGEPANPFATPLEILPEWYFYPVFQILRTVPNKLLGVLAMAAVPVGLLTV
PFIESINKf--qNPYRRPIATILFLVGTLVAVWLGIGATfpiDISLTLGLF-----------------------------
-----------------
>gi|117895
---------------------mlyksgekrkgllmsgclyriygvgfslgffialqiicgvclawlffscficsnwyfvl
flwdfdlgfvirsvhicftsllylllyihifksitliilfdthilvwfigfilfvfiiiiafigyvlpctmmsywgltvf
sniiatvpilgiwlcywiwgsefindftllklhvlhvllpfilliililhlfclhyfmssdaFCDRFAFYCERLSFCMWF
YLRDMFLAFSILLCMMYVIFINWyfvfHEESWVIVDTLKTSDKILPEWFFLYLFGFLKAIPDKFMGLFLMVILLFSLFLF
ILNCILWFvycrSSLLWLTYSLILFYSIWMSGFLALYVVlayPIWMELQYWvlllfllivcrld----------------
-----------------
>gi|1345901
------------------------mkldfvnsmvvslpsskvltygwnfgsmlgmvlgfqiltgtflafyysndgalafl
svqyimyevnfgwifrvlhfngaslffiflylhlfkglffmsyrlkkvwvsgivilllvmmeafmgyvlvwaqmsfwasv
vitsllsvipvwgfaivtwiwsgftvssatlkfffvlhflvpwgllllvllhlvflhetgstSKLYCHGDYDKVCFYPEY
WVKDFLNVVVWFVFIFFSLGYPFll-gDPEMFIESDPMMSPVHIVPEWYFLFAYAILRAIPNKVLGVVSLFASILVLVVF
VLVNNYVSv---MSKLNKFLVFVFIFVLVVLSWLGQCLVe-dPFVFLSMVFsflyffvifllflvyyfagrvfm------
-----------------
0. Neighbor Joining, Poisson correction, uniform distribution, Bootstrap a default értékekkel
1. Neighbor Joining, Poisson correction, Different (Gamma distribution-t) 0.25, Bootstrap a default értékekkel
2. Neighbor Joining, Poisson correction, Different (Gamma distribution-t) 1, Bootstrap a default értékekkel
3. Neighbor Joining, Poisson correction, Different (Gamma distribution-t) 5, Bootstrap a default értékekkel
4. Neighbor Joining, p-distance, Bootstrap a default értékekkel
5. UPMGA, Poisson correction, gamma distribution 1, Bootstrap a default értékekkel
6. Maximum Parsimony, Bootstrap a default értékekkel

2011. november 13., vasárnap

5. Többszörös szekvenciaanalízis és fehérje megzenesítés

 1. Mn kataláz enzim többszörös szekvenciaanalízise
Manganese catalase, ferritin-like diiron-binding domain
I. fehérjeszekvenciasorozatok kinyerése
CDD: conserved protein domain database-ben (10 FASTA formátumú szekvencia):

>gi|22218847|pdb|1JKV|A
MFKHTRKLQYNAK-PDRSDPIMARRLQESLGGQWGETTGMMSYLSQGWas-----tgAEKYKDLLLDTGTEEMAHVEMIS
TMIGYLLEdapfgpedlkrdpslattm----agmdpehslvhglnaslnNPNGAAWNAGYVTSSGNLVADMRFNVVRESE
ARLQVSRLYSMTEDEGVRDMLKFLLARETQHQLQFMKAQEELEekygiivpgdmkeiehsefshvlmnfsdgdgskafeg
qvakdgekftyqenpeamggiphikpgdprlhnhqg---------------------------------
>gi|85544434|pdb|2CWL|A
MFLRIDRLQIELPmPKEQDPNAAAAVQALLGGRFGEMSTLMNYMYQSFnfrg--kkaLKPYYDLIANIATEELGHIELVA
ATINSLLAknpgkdleegvdpesaplgf-akdvrnaahfiagganslvmGAMGEHWNGEYVFTSGNLILDLLHNFFLEVA
ARTHKLRVYEMTDNPVAREMIGYLLVRGGVHAAAYGKALESLTgvemtkmlpipkidnskipeakkymdlgfhrnlyrfs
pedyrdlgliwkgaspedgtevvvvdgpptggpvfdaghdaaefapefhpgelyeiakklyekak----
>gi|15613632|ref|NP_241935.1|
MFKRIDKLLIDLPkPDHPDANAAAAVQELLGGRFGEMSTLNNYMYQSFnfrq--khkLRPFYELVASITAEEFGHVELVS
NTINLMIEgttfpgdpditpmqdakd------krntyhfistaqtsypmDSMGASWRGDYVVNSGNLIFDLLHNYFLEIG
ARTHKMRVYEMTDHPVAREMIGYLLVRGGVHIIAYAKALEIATgvdltkmlpvpnlsnrqfdyarkfedqgvhrklytws
dmdyrtisqiwkgehpteggplevvkgtpegapipdleelpeefapgisrddfleiakrlkrnagl---
>gi|21321250|dbj|BAB97198.1|
MYLRIDRLQIQLPaPKEPDPNAAAAVSELLGGRFGEMNTLMTYTYQSFnfrmhknpaIKPFRDLVSNIATEELGHIELVS
AVVNALYVgstkpappdqaplkplkd------vrntyhaintglgafpmDSHGTPWRGDYIFVSGNLVLDFLYNFFLEVG
ARLAKIRVYEMTDNPVAREMIGYLLVRGGVHAMAYGKALEALTgvevwrmlpipkiedskfpeaakymkmgvhrtlyrfs
psdykdiekiwkgahpadgqplqvhdgppeggeylelpevpeefapglykddferiakrlginl-----
>gi|30263079|ref|NP_845456.1|
MFYYKEELINMIK-PDKPDPAAAKVLQEILGGHYGEMRTMMQYFFQSSnfr----gkEKQYRDLLRGVFLEEISHVELVQ
HTINQLLTgsgeptpgnagidtapldea--vkhanphhfivgaqsslpvDAAGNPWNGSWVYSHGNLISDLLDNVVLEST
GVLQKTRIYEMSSNQTFRETLAFLIVRDNAHQNAFAKALETLGvewgklfpvpnydinkypecrkyvdmgfhnaqfnfsl
dptrmgeifkgespsrnkgtltvtdppkgfpvpelpempnehspglkdmdl------------------
>gi|34556035|emb|CAE09059.1|
MFLRIDRLQIELPmPKEQDPNAAAAVQALLGGRFGEMSTLMNYMYQSFnfrg--kkaLKPYYDLIANIATEELGHIELVA
ATINSLLAknpgkdleegvdpastplgf-akdvrnaahfiagganslvmGAVGEHWNGEYVFTSGNLILDLLHNFFLEVA
ARTHKLRVYEMTDNPVAREMIGYLLVRGGVHAAAYGKALESLTgvemtkmlpipkidnskipeakkymdlgfhrnlyrfs
pedyrdlgliwkgaspedgtevvvvdgpptggpvfdaghdaaefapefhpgelygiakklyekak----
>gi|18313524|ref|NP_560191.1|
MYLRIDRLQIELPaPKEPDPNAAAAVQELLGGRFGEMNTLMTYTYQSFnfrlhknpaLKPFRDLVANIATEELGHIELVS
AVVNALYVgatkpgppesaplkplkd------arntyhatmtgltafpfDSHGAPWKGEYIFVSGNLVLDFLYNFFLEVG
ARLVKIRVYEMTDNPVAREMIGYLLVRGGVHALAYGKALEALTgvevwrmlpipnipnskfpeaakyekmgihrtlyrfs
psdykdiekiwrgthpedgqplqvydgpppggeyfelpevpeefapglsaddfrriakrlgiel-----
>gi|157889444|dbj|BAF81110.1|
MFLRIDRLQIELPmPKEQDPNAAAAVQALLGGRFGEMSTLMNYMYQSFnfrg--kkaLKPYYDLIANIATEELGHIELVA
ATINSLLAknpgkdleegadpaatplgf-aknarnaahfiagganslvmGAMGEHWHGEYVFSSGNLILDLLHNFFLEVA
ARTHKLRVYEMTDNPVAREMIGYLLVRGGVHAAAYGKALESLTgvemtkmlpipridnskipeakkymdlgfhrnlyrfs
psdyqdlgliwsgpspedgsevrvvdgppeggpvfdaghdaaefapefhpgelyeiakklyekak----
>gi|163853621|ref|YP_001641664.1|
MFMRVDKLQAELPaPKRKDPNAAAALQELLGGKYGEMSTLGNYMFQSFnfrs--kdkLKPFYSLVSSITAEELGHVELVS
NGVAMLNNgpdndgdetdggdisgapfedmkdirlaaaflsngggsapiNSNGASWNNDFITSSGNVVVDLLHNFHLECG
ARLHKLRVYETLSDPTGREVCGYLLVRGSVHAHAYALALKQITgvdldkflptpninldkipecqkylqegshrrlytws
pndyrdiagiwnssehalpgdppgeleivegmpdggkihqltgipsafapdyapeemfeiaqkltkkar
>gi|222479868|ref|YP_002566105.1|
MFYHDDQLQFEVE-VENPDPHFAKMLQQAIGGAEGEIRVALQYMFQAFavp----aeKQEIRQFLMETATEELGHIEMLA
TAVAKNLEgasedaresaredpiidem---mrtgqprqalsaglhampvDSNGVPFTGNYVVASGNLAADLYANVMAEST
GRVLATRLYEFTDDPGMKEMLEYLIARDTMHQNQWHAALEDLGehrpvpasfdqeqenqeynysfmsttreerddpkqpw
tqgeapdgkgefsytprqpgggapdlkavidemynevq-------------------------------



II.- III. többszörös illesztés és a különböző többszörös szekvencia illesztési módszerekkel kapott eredmények összehasonlítása, annak eldöntése érdekében, h. a különbözö illesztések közül melyik a legjobb:


http://tcoffee.vital-it.ch/



Clustal W2 - itt
SCORE=100


T-Coffee - itt 
SCORE=100

Muscle - itt
SCORE=100

MAFFT - itt
SCORE=100

Mind a négy illesztési módszer egyformán 100-as értéket kapott.




2. Fehérjék “megzenésítése” 


>gi|332004753|gb|AED92136.1| cell division protease ftsH-6 [Arabidopsis thaliana]
MKMASSSSALSFPLSNIPTCSKKSQQFQKPASLSKSSHTHKPSLKTQILHHKFTKRNLLSLTTALGFTSA
LGTVLAHPAKAEPEAPIEATSNRMSYSRFLQHLKENEVKKVDLIENGTVAIVEISNPVVGKIQRVRVNLP
GLPVDLVREMKEKNVDFAAHPMNVNWGAFLLNFLGNLGFPLILLVSLLLTSSSRRNPAGPNLPFGLGRSK
AKFQMEPNTGITFEDVAGVDEAKQDFEEIVEFLKTPEKFSALGAKIPKGVLLTGPPGTGKTLLAKAIAGE
AGVPFFSLSGSEFIEMFVGVGASRARDLFNKAKANSPCIVFIDEIDAVGRMRGTGIGGGNDEREQTLNQI
LTEMDGFAGNTGVIVIAATNRPEILDSALLRPGRFDRQVSVGLPDIRGREEILKVHSRSKKLDKDVSLSV
IAMRTPGFSGADLANLMNEAAILAGRRGKDKITLTEIDDSIDRIVAGMEGTKMIDGKSKAIVAYHEVGHA
ICATLTEGHDPVQKVTLVPRGQARGLTWFLPGEDPTLVSKQQLFARIVGGLGGRAAEDVIFGEPEITTGA
AGDLQQVTEIARQMVTMFGMSEIGPWALTDPAVKQNDVVLRMLARNSMSEKLAEDIDSCVKKIIGDAYEV
AKKHVRNNREAIDKLVDVLLEKETLTGDEFRAILSEYTDQPLNTDGDVRIRINDLISV

Az AtFtsH6 metalloproteázt az Arabidopsis thalinana-ban mutatták ki. A kettes fotokémiai rendszer (LHC II) degradációjáért felelős, igy fontos szerepet játszik ősszel a levelek sárgulásában és lehullásában.

Zelisko A, García-Lorenzo M, Jackowski G, Jansson S, Funk C. (2005) AtFtsH6 is involved in the degradation of the light-harvesting complex II during high-light acclimation and senescence. Proc Natl Acad Sci, 102(38):13699-704

2011. november 7., hétfő

4. MEGABLAST, BLASTP és PSI-BLAST keresés, illetve le nem irt, új gének találása

I. MEGABLAST-os keresés



Globingének ebben a szakaszban
Max. ident értékek
beta-globin
96%
delta-globin
90%
gamma-1 és gamma-2 globin
83%



II. BLASTP vs PSI-BLAST
BLASTP keresés
Nincs mioglobin!


PSI-BLAST keresés
6. iteráció után került a listára mioglobin:


III. PSI-BLAST keresés
Gombák globinjai
Első iteráció 106 szekvencia.
Második iteráció 152 új szekvencia.
Harmadik iteráció  54 új szekvencia.
Negyedik iteráció 106   új szekvencia.
Ötödik iteráció 50 új szekvencia.



Egyéb, globindoménekkel rendelkező fehérjék: hemoglobin, flavohemoglobin, globin


IV. le nem írt, új gének megtalálása BLAST-tal

A kiválaztott fehérje-humán beta-globin:
>gi|455997|gb|AAA16334.1| beta-globin [Homo sapiens]
MVHLTPEEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGNPKVKAHGKKVLG
AFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVAN
ALAHKYH

A keresést a növényekre szűkítettem.
>gi|298180592|gb|HO025679.1|HO025679 ocpsga0_0220_E12.ab1 Soybean immature seed full-length-enriched cDNA library Glycine max cDNA, mRNA sequence
GGGGAAAAAGGTTTGTGATCAGAGATTTTTTTTTTGAAAAAAAGATCGAGGAAACCTTAACGTCGTCATC
ATGGTGAAATGGACAGATGCTGAGCGCTGCGCCATCACTACCCTGTGGGGAAAGATTGATGTGGGTGAAA
TTGGACCCCAGGCTCTGGCCAGGCTTCTGATTGTGTACCCGTGGACCCAGAGACACTTCTCCTCATTTGG
AGACCTGTCCACCCCCGCTGCCATCCTCGGAAACGCTAAGGTGGCCGCTCACGGAAAGACAGTGATGGCT
GGGCTGGAAAATGCCGTGAAGAACATGGACGACATCAAGAATGCTTACTCCCTGCTGAGCACGATGCACT
CTGAGAAGCTGCATGTGGATCCCGACAACTTCAGGCTTCTGGCTGAATGCATCAGTGTGTGCGTGGCTGC
CAAGTTTGGACGTCAGACCTTCAACGCTGATGTCCAGGAGGCCTGGCAGAAGTTCCTGGCT
Blastx-el leellenőrizve a legnagyobb egyezés: 87%

2011. október 28., péntek

BLAST-keresés multidoménes fehérjével

A emberi zsírsav szintáz (fatty acid synthase) enzim nukleotid sorrendje:

>gi|41872631|ref|NP_004095.4| fatty acid synthase [Homo sapiens]
MEEVVIAGMSGKLPESENLQEFWDNLIGGVDMVTDDDRRWKAGLYGLPRRSGKLKDLSRFDASFFGVHPK
QAHTMDPQLRLLLEVTYEAIVDGGINPDSLRGTHTGVWVGVSGSETSEALSRDPETLVGYSMVGCQRAMM
ANRLSFFFDFRGPSIALDTACSSSLMALQNAYQAIHSGQCPAAIVGGINVLLKPNTSVQFLRLGMLSPEG
TCKAFDTAGNGYCRSEGVVAVLLTKKSLARRVYATILNAGTNTDGFKEQGVTFPSGDIQEQLIRSLYQSA
GVAPESFEYIEAHGTGTKVGDPQELNGITRALCATRQEPLLIGSTKSNMGHPEPASGLAALAKVLLSLEH
GLWAPNLHFHSPNPEIPALLDGRLQVVDQPLPVRGGNVGINSFGFGGSNVHIILRPNTQPPPAPAPHATL
PRLLRASGRTPEAVQKLLEQGLRHSQDLAFLSMLNDIAAVPATAMPFRGYAVLGGERGGPEVQQVPAGER
PLWFICSGMGTQWRGMGLSLMRLDRFRDSILRSDEAVKPFGLKVSQLLLSTDESTFDDIVHSFVSLTAIQ
IGLIDLLSCMGLRPDGIVGHSLGEVACGYADGCLSQEEAVLAAYWRGQCIKEAHLPPGAMAAVGLSWEEC
KQRCPPGVVPACHNSKDTVTISGPQAPVFEFVEQLRKEGVFAKEVRTGGMAFHSYFMEAIAPPLLQELKK
VIREPKPRSARWLSTSIPEAQWHSSLARTSSAEYNVNNLVSPVLFQEALWHVPEHAVVLEIAPHALLQAV
LKRGLKPSCTIIPLMKKDHRDNLEFFLAGIGRLHLSGIDANPNALFPPVEFPAPRGTPLISPLIKWDHSL
AWDVPAAEDFPNGSGSPSAAIYNIDTSSESPDHYLVDHTLDGRVLFPATGYLSIVWKTLARALGLGVEQL
PVVFEDVVLHQATILPKTGTVSLEVRLLEASRAFEVSENGNLVVSGKVYQWDDPDPRLFDHPESPTPNPT
EPLFLAQAEVYKELRLRGYDYGPHFQGILEASLEGDSGRLLWKDNWVSFMDTMLQMSILGSAKHGLYLPT
RVTAIHIDPATHRQKLYTLQDKAQVADVVVSRWLRVTVAGGVHISGLHTESAPRRQQEQQVPILEKFCFT
PHTEEGCLSERAALQEELQLCKGLVQALQTKVTQQGLKMVVPGLDGAQIPRDPSQQELPRLLSAACRLQL
NGNLQLELAQVLAQERPKLPEDPLLSGLLDSPALKACLDTAVENMPSLKMKVVEVLAGHGHLYSRIPGLL
SPHPLLQLSYTATDRHPQALEAAQAELQQHDVAQGQWDPADPAPSALGSADLLVCNCAVAALGDPASALS
NMVAALREGGFLLLHTLLRGHPLGDIVAFLTSTEPQYGQGILSQDAWESLFSRVSLRLVGLKKSFYGSTL
FLCRRPTPQDSPIFLPVDDTSFRWVESLKGILADEDSSRPVWLKAINCATSGVVGLVNCLRREPGGNRLR
CVLLSNLSSTSHVPEVDPGSAELQKVLQGDLVMNVYRDGAWGAFRHFLLEEDKPEEPTAHAFVSTLTRGD
LSSIRWVCSSLRHAQPTCPGAQLCTVYYASLNFRDIMLATGKLSPDAIPGKWTSQDSLLGMEFSGRDASG
KRVMGLVPAKGLATSVLLSPDFLWDVPSNWTLEEAASVPVVYSTAYYALVVRGRVRPGETLLIHSGSGGV
GQAAIAIALSLGCRVFTTVGSAEKRAYLQARFPQLDSTSFANSRDTSFEQHVLWHTGGKGVDLVLNSLAE
EKLQASVRCLATHGRFLEIGKFDLSQNHPLGMAIFLKNVTFHGVLLDAFFNESSADWREVWALVQAGIRD
GVVRPLKCTVFHGAQVEDAFRYMAQGKHIGKVVVQVLAEEPEAVLKGAKPKLMSAISKTFCPAHKSYIIA
GGLGGFGLELAQWLIQRGVQKLVLTSRSGIRTGYQAKQVRRWRRQGVQVQVSTSNISSLEGARGLIAEAA
QLGPVGGVFNLAVVLRDGLLENQTPEFFQDVCKPKYSGTLNLDRVTREACPELDYFVVFSSVSCGRGNAG
QSNYGFANSAMERICEKRRHEGLPGLAVQWGAIGDVGILVETMSTNDTIVSGTLPQRMASCLEVLDLFLN
QPHMVLSSFVLAEKAAAYRDRDSQRDLVEAVAHILGIRDLAAVNLDSSLADLGLDSLMSVEVRQTLEREL
NLVLSVREVRQLTLRKLQELSSKADEASELACPTPKEDGLAQQQTQLNLRSLLVNPEGPTLMRLNSVQSS
ERPLFLVHPIEGSTTVFHSLASRLSIPTYGLQCTRAAPLDSIHSLAAYYIDCIRQVQPEGPYRVAGYSYG
ACVAFEMCSQLQAQQSPAPTHNSLFLFDGSPTYVLAYTQSYRAKLTPGCEAEAETEAICFFVQQFTDMEH
NRVLEALLPLKGLEERVAAAVDLIIKSHQGLDRQELSFAARSFYYKLRAAEQYTPKAKYHGNVMLLRAKT
GGAYGEDLGADYNLSQVCDGKVSVHVIEGDHRTLLEGSGLESIISIIHSSLAEPRVSVREG 



Az enzim szekvenciáját vizsgáltam a Blast (Basic Local Alignment Search Tool) program segítségével, a következő kérdésekre keresve a választ:
a. milyen konzerválódott fehérjedoménekkel rendelkezik a zsírsav szintáz

Konzerválódott fehérjedomének: PKS, enoyl_red, KR_1_FAS_SDR

b. megismételve a keresést a RefSeq adatbázissal, mely révén kiszűrtem a sok identikus virális szekvenciát; a Taxonomy Reports segítségével meghatároztam, h. milyen fajokban találhatók a zsirsav szintázhoz hasonló szekvenciák:


Közönséges csimpánz (Pan troglodytes)
Rhesus majom (Macaca mulatta)
ló (Equus caballus)
házi egér (Mus musculus)
vándorpatkány (Rattus norvegicus)
tengerimalac (Cavia porcellus)
szarvasmarha (Bos taurus)
óriáspanda (Ailuropoda melanoleuca)
vaddisznó (Sus scrofa)
fehérarcú bóbitás gibbon (Nomascus leucogenys)

c. nézzük meg milyen bakteriális fehérjékkel mutat hasonlóságot a zsirsav szintáz: ismételjük meg a blastp keresést a Bacteria-ra (txid2[Organism]) szűkítve

I. típusú poliketid szintáz (Burkholderia pseudomallei)
I. típusú poliketid szintáz (Burkholderia mallei)

d. melyik két zsírsav szintáz doménnel mutatnak hasonlóságot a talált bakteriális szekvenciaegyezések? Milyen bakteriális enzimekről van szó?

A talált bakteriális szekvenciaegyezések a PKS és enoyl_red doménekkel mutatnak hasonlóságot.
Bakteriális enzimek: poliketid szintázzal és enoyl reduktáz.

e. milyen humán fehérjékkel feltételezhető homológia? (blastp Homo sapiens-re szűkítve). Az egyezések milyen zsírsav szintáz fehérjedoménnél figyelhetők meg? Funkcióját tekintve milyen típusú humán fehérjékről van szó?
A zsírsav szintáz leginkább a humán poliketid szintázzal mutat homológiát.

f. növényeknél találunk a zsírsav szintázzal egyezést, homológ szekvenciákat?
A zsírsav szintázzal homológ szekvenciákat találunk a toklászos kétsoros arpánál (Hordeum vulgare subsp. vulgare), a Medicago truncatula-nál, a kukoricánál (Zea mays), a burgonyánál (Solanum tuberosum).

g. milyen expresszált DNS-szekvenciákkal mutat hasonlóságot a zsírsav szintáz (tblastn-t használjunk és est adatbázist)