Gene EcSMS35_3474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3474
Symbol	hflB
ID	6146516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3551757
End bp	3553700
Gene Length	1944 bp
Protein Length	647 aa
Translation table	11
GC content	53%
IMG OID	641618303
Product	ATP-dependent metalloprotease
Protein accession	YP_001745450
Protein GI	170682536
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000879508
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGTGACA TGGCGAAAAA CCTAATACTC TGGCTGGTCA TTGCCGTTGT GCTGATGTCA 
GTATTCCAGA GCTTTGGGCC CAGCGAGTCT AATGGCCGTA AGGTGGATTA CTCTACCTTC 
CTACAAGAGG TCAATAACGA CCAGGTTCGT GAAGCGCGTA TCAACGGACG TGAAATCAAC 
GTTACCAAGA AAGATAGTAA CCGTTATACC ACTTACATTC CGGTTCAGGA TCCGAAATTA 
CTGGATAACC TGTTGACCAA GAACGTCAAG GTTGTCGGTG AACCGCCTGA AGAACCAAGC 
CTGCTGGCTT CTATCTTCAT CTCCTGGTTC CCGATGCTGT TGCTGATTGG TGTCTGGATC 
TTCTTCATGC GTCAAATGCA GGGCGGCGGT GGCAAAGGTG CCATGTCGTT TGGTAAGAGC 
AAAGCGCGCA TGCTGACGGA AGATCAGATC AAAACGACCT TTGCTGACGT TGCGGGCTGC 
GACGAAGCAA AAGAAGAAGT TGCTGAACTG GTTGAGTATC TGCGCGAGCC GAGCCGCTTC 
CAGAAACTCG GCGGTAAGAT CCCGAAAGGC GTCCTGATGG TCGGTCCTCC GGGTACCGGT 
AAAACGCTGC TGGCGAAAGC GATTGCAGGC GAAGCGAAAG TTCCGTTCTT TACTATCTCC 
GGTTCTGACT TCGTAGAAAT GTTCGTCGGT GTGGGTGCAT CCCGTGTTCG TGACATGTTC 
GAACAGGCGA AGAAAGCGGC ACCGTGCATC ATCTTTATCG ATGAAATCGA CGCCGTAGGC 
CGCCAGCGTG GCGCAGGTCT GGGCGGTGGT CACGATGAAC GTGAACAGAC TTTGAACCAG 
ATGCTGGTTG AGATGGATGG CTTCGAAGGT AACGAAGGTA TCATCGTTAT CGCCGCGACT 
AACCGTCCGG ACGTTCTTGA CCCGGCCCTG CTGCGTCCTG GCCGTTTCGA CCGTCAGGTT 
GTGGTTGGCT TGCCAGATGT TCGTGGTCGT GAGCAGATCC TGAAAGTTCA CATGCGTCGC 
GTACCATTGG CACCCGATAT CGACGCGGCA ATCATTGCCC GTGGTACTCC TGGTTTCTCC 
GGTGCTGACC TGGCGAACCT GGTGAACGAA GCGGCACTGT TCGCTGCTCG TGGCAACAAA 
CGCGTTGTGT CGATGGTTGA GTTCGAGAAA GCGAAAGACA AAATCATGAT GGGTGCGGAA 
CGTCGCTCCA TGGTGATGAC GGAAGCGCAG AAAGAATCGA CGGCTTACCA CGAAGCGGGT 
CACGCGATTA TCGGTCGCCT GGTGCCGGAA CACGATCCGG TGCACAAAGT AACGATTATC 
CCGCGCGGTC GTGCGCTGGG TGTGACCTTC TTCTTGCCTG AGGGCGACGC AATCAGCGCC 
AGCCGTCAGA AACTGGAAAG CCAGATTTCT ACGCTGTACG GTGGTCGTCT GGCAGAAGAG 
ATCATCTACG GGCCGGAACA TGTTTCTACC GGTGCGTCCA ACGATATTAA AGTTGCGACC 
AACCTGGCAC GTAACATGGT GACTCAGTGG GGTTTCTCTG AGAAACTCGG TCCGCTGCTG 
TATGCGGAAG AAGAAGGTGA AGTGTTCCTC GGCCGTAGCG TAGCGAAAGC GAAACATATG 
TCCGATGAAA CTGCACGTAT CATCGACCAG GAAGTGAAAG CACTGATTGA GCGTAACTAT 
AATCGTGCGC GTCAGCTTCT GACCGACAAT ATGGATATTC TGCATGCGAT GAAAGATGCT 
CTCATGAAAT ATGAGACTAT CGACGCACCG CAGATTGATG ACCTGATGGC ACGTCGCGAT 
GTACGTCCGC CAGCGGGCTG GGAAGAACCA GTCGCTTCTA ACAATTCTGG CGACAATGGT 
AGTCCAAAGG CTCCACGTCC GGTTGATGAA CCGCGTACGC CGAACCCGGG TAACACCATG 
TCAGAGCAGT TAGGCGACAA GTAA

Protein sequence

MSDMAKNLIL WLVIAVVLMS VFQSFGPSES NGRKVDYSTF LQEVNNDQVR EARINGREIN 
VTKKDSNRYT TYIPVQDPKL LDNLLTKNVK VVGEPPEEPS LLASIFISWF PMLLLIGVWI 
FFMRQMQGGG GKGAMSFGKS KARMLTEDQI KTTFADVAGC DEAKEEVAEL VEYLREPSRF 
QKLGGKIPKG VLMVGPPGTG KTLLAKAIAG EAKVPFFTIS GSDFVEMFVG VGASRVRDMF 
EQAKKAAPCI IFIDEIDAVG RQRGAGLGGG HDEREQTLNQ MLVEMDGFEG NEGIIVIAAT 
NRPDVLDPAL LRPGRFDRQV VVGLPDVRGR EQILKVHMRR VPLAPDIDAA IIARGTPGFS 
GADLANLVNE AALFAARGNK RVVSMVEFEK AKDKIMMGAE RRSMVMTEAQ KESTAYHEAG 
HAIIGRLVPE HDPVHKVTII PRGRALGVTF FLPEGDAISA SRQKLESQIS TLYGGRLAEE 
IIYGPEHVST GASNDIKVAT NLARNMVTQW GFSEKLGPLL YAEEEGEVFL GRSVAKAKHM 
SDETARIIDQ EVKALIERNY NRARQLLTDN MDILHAMKDA LMKYETIDAP QIDDLMARRD 
VRPPAGWEEP VASNNSGDNG SPKAPRPVDE PRTPNPGNTM SEQLGDK