Gene CPF_1645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1645
Symbol	lonB
ID	4201241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1859334
End bp	1861046
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	33%
IMG OID	638082522
Product	ATP-dependent protease LonB
Protein accession	YP_696086
Protein GI	110798596
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1067] Predicted ATP-dependent protease
TIGRFAM ID	[TIGR02902] ATP-dependent protease LonB

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACTT ATACATTTAT AATGTTTCTA CAATTACTTA TGTCAATTTT ATTCTATATA 
TATATGAGCA AGTCCTTTGC GAGTAAGAAG AAAGATAATA GTGTTTTAGA AAAAGAAAAT 
GAAAAAGAAA TGGAAAAATT AAATAAATTA AGAATGATAA AACTGACAGA ACCTTTAACT 
GAAAAAAGTA GACCAAGTAA TTTAGAAGAA ATAATAGGAC AGGAAAAGGG AATAAAAGCT 
CTTAAAGCAG CACTTTGTGG GCCAAATCCA CAGCATGTAA TAATATATGG TCCGCCAGGG 
GTAGGAAAAA CTGCAGCTGC TAGAATAATT TTAGAAGAGG CTAAGAAAAT GGCAGCATCT 
CCTTTTAATA AGGACTCTAA ATTTGTTGAA ATAGATGCCA CAACTTTAAG ATTTGATGAG 
AGGGGGATAG CAGATCCACT AATAGGTTCC GTTCATGATC CAATATATCA AGGAGCAGGT 
TCCTTAGGGA TTGCAGGGGT TCCTCAACCT AAGCCAGGAG CTGTAACAAA GGCTCATGGA 
GGAATACTTT TTATAGATGA AATAGGAGAA CTCCATCCTA TTGAATTAAA TAAACTTCTT 
AAAGTTTTAG AGGATAGAAA AGTTTTTTTA GATTCAGCCT ATTATAGTTC AGAAGATCCC 
AATACTCCTA GATATATAAA AGAAATATTT GATAATGGAT TACCAGCAGA TTTTAGATTA 
ATTGGTGCAA CTACAAGAAG TCCAGAGGAA ATAGTGCCAG CTATAAGGTC AAGGTGCGTA 
GAAATATTTT TTAGGGGGCT AACTGTTGAA GAGATTAGAA AAATTGCTTT AAATGCCACA 
AATAAGGTTG GTTATAGAAT AAGTGATGAG GGATTAGACA TAGTATCTAG ATATTGTACT 
AATGGAAGAG AAGTTATAAA CTTAGTGCAA TTATGTTCTG GCCTTGCAAT AAATGAAAAT 
AGAGATTACA TAAAAGAGAG TGATATTTAT TGGGTTATTG AAAATGGTCA ATATAATCCT 
AGAATGGAAA GAATGATAAA TGATAAACCT GAAATTGGGT ATGTAAATGG CTTAGCTGTG 
TATGGAGCTA ACAATGGAGC TTTAATGGAA ATAGAAGCTA CAGCAAAGCT ATCAAGTAAT 
AGTATAGGTA GTATAAAAAT TACTGGAATA GTTGATGATG AGGAACTAGG CGGTGGAGAG 
AAGAAAATAA AGAGAAAAAG CACAGCATAT TGTTCTGTAC AGAATGTATT GACAGTATTA 
GATAATATAT TTAATTTAAA TTCAAAGGCA TATGATATAC ATGTTAACTT TCCAGGCGGA 
ATACCAGTAG ACGGTCCATC TGCTGGAATA AGTATAGCTA CAGCCATATA TAGTGCCATA 
AAAGGAGTGC CTGTAAATAA TAGAGTGGCT ATGACTGGTG AGATATCAAT AAAGGGAAAG 
GTAAAACCAA TAGGGGGAGT AAATGCAAAG ATATTAGCAG CAAAGAGAGC GGGAGTAGAA 
TTGGTAATTG TTCCAAAGGA AAATTTAAGT AGTATAACTA GAGATATTGA TGGAATAAAG 
ATAGTTGGTG TTAAGAAAAT TGAAGAGGTG TTAGATCTTG CACTTTATGA AGAAGAATGT 
ATAGAAAAAG AGAGTTTAAT AATTAAAGAT AATAGGGCAT TTTTTGGTGC TGGTGCCTTA 
AATGCAGAAT CTATAAAGAA AGCTAACACT TAA

Protein sequence

MNTYTFIMFL QLLMSILFYI YMSKSFASKK KDNSVLEKEN EKEMEKLNKL RMIKLTEPLT 
EKSRPSNLEE IIGQEKGIKA LKAALCGPNP QHVIIYGPPG VGKTAAARII LEEAKKMAAS 
PFNKDSKFVE IDATTLRFDE RGIADPLIGS VHDPIYQGAG SLGIAGVPQP KPGAVTKAHG 
GILFIDEIGE LHPIELNKLL KVLEDRKVFL DSAYYSSEDP NTPRYIKEIF DNGLPADFRL 
IGATTRSPEE IVPAIRSRCV EIFFRGLTVE EIRKIALNAT NKVGYRISDE GLDIVSRYCT 
NGREVINLVQ LCSGLAINEN RDYIKESDIY WVIENGQYNP RMERMINDKP EIGYVNGLAV 
YGANNGALME IEATAKLSSN SIGSIKITGI VDDEELGGGE KKIKRKSTAY CSVQNVLTVL 
DNIFNLNSKA YDIHVNFPGG IPVDGPSAGI SIATAIYSAI KGVPVNNRVA MTGEISIKGK 
VKPIGGVNAK ILAAKRAGVE LVIVPKENLS SITRDIDGIK IVGVKKIEEV LDLALYEEEC 
IEKESLIIKD NRAFFGAGAL NAESIKKANT