Gene EcHS_A3433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3433
Symbol	tldD
ID	5595241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3434171
End bp	3435616
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	55%
IMG OID	640922552
Product	protease TldD
Protein accession	YP_001460040
Protein GI	157162722
COG category	[R] General function prediction only
COG ID	[COG0312] Predicted Zn-dependent proteases and their inactivated homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCTTA ACCTGGTAAG TGAACAATTG CTAGCGGCGA ACGGCCTGAA ACATCAGGAC 
TTGTTCGCGA TCCTCGGTCA ACTGGCCGAA CGTCGCCTTG ATTATGGCGA TCTCTATTTT 
CAGTCGAGCT ATCACGAATC CTGGGTTTTA GAAGACCGCA TTATTAAAGA TGGTTCTTAC 
AACATCGATC AGGGCGTTGG TGTGCGTGCA ATCAGCGGTG AAAAAACCGG ATTTGCTTAC 
GCTGACCAAA TCAGCCTGCT GGCGCTGGAA CAGAGTGCGC AAGCGGCGCG CACCATCGTC 
CGTGATAGTG GTGATGGTAA AGTACAGACG CTGGGCGCGG TAGAGCATAG CCCGTTGTAT 
ACCTCGGTAG ATCCGCTGCA AAGCATGAGC CGTGAAGAGA AGCTGGATAT CCTGCGTCGC 
GTCGATAAGG TTGCCCGCGA AGCGGACAAG CGCGTACAGG AAGTGACTGC CAGCCTCAGT 
GGTGTCTATG AATTAATTTT GGTTGCGGCC ACCGACGGCA CGCTAGCGGC GGATGTCCGT 
CCGCTGGTGC GTCTTTCCGT GAGCGTTCTC GTCGAAGAAG ATGGCAAACG CGAACGCGGT 
GCCAGTGGCG GCGGCGGTCG TTTTGGTTAT GAATTCTTCC TTGCCGATCT CGACGGCGAA 
GTCCGTGCGG ATGCATGGGC AAAAGAAGCA GTGCGTATGG CGCTGGTCAA TCTTTCTGCC 
GTTGCTGCAC CAGCGGGCAC CATGCCGGTA GTACTTGGCG CAGGTTGGCC GGGCGTGCTG 
TTGCATGAAG CGGTTGGTCA CGGTCTGGAA GGCGACTTCA ACCGCCGTGG CACTTCAGTA 
TTTAGTGGAC AGGTCGGGGA GCTGGTGGCT TCAGAACTGT GTACCGTGGT TGATGATGGC 
ACGATGGTCG ATCGCCGAGG TTCGGTGGCG ATTGATGACG AAGGTACGCC AGGCCAGTAC 
AACGTGCTGA TTGAGAACGG CATTCTGAAA GGCTACATGC AGGATAAACT CAACGCGCGT 
TTGATGGGGA TGACGCCGAC TGGCAACGGT CGCCGTGAAT CCTACGCCCA TCTGCCCATG 
CCGCGTATGA CCAACACCTA TATGCTGCCG GGTAAATCGA CCCCGCAGGA AATTATTGAA 
TCCGTTGAGT ACGGTATCTA TGCACCGAAC TTTGGTGGCG GTCAGGTGGA TATCACCTCC 
GGCAAATTCG TTTTCTCCAC TTCAGAAGCA TATCTGATTG AAAACGGTAA AGTAACGAAG 
CCGGTGAAAG GCGCAACGTT GATTGGTTCC GGTATCGAAA CCATGCAGCA GATTTCGATG 
GTTGGCAACG ACCTGAAACT GGATAACGGC GTGGGTGTCT GCGGTAAAGA AGGGCAAAGT 
TTGCCGGTTG GCGTGGGCCA GCCAACGTTG AAAGTCGATA ACCTGACTGT TGGCGGTACT 
GCGTAA

Protein sequence

MSLNLVSEQL LAANGLKHQD LFAILGQLAE RRLDYGDLYF QSSYHESWVL EDRIIKDGSY 
NIDQGVGVRA ISGEKTGFAY ADQISLLALE QSAQAARTIV RDSGDGKVQT LGAVEHSPLY 
TSVDPLQSMS REEKLDILRR VDKVAREADK RVQEVTASLS GVYELILVAA TDGTLAADVR 
PLVRLSVSVL VEEDGKRERG ASGGGGRFGY EFFLADLDGE VRADAWAKEA VRMALVNLSA 
VAAPAGTMPV VLGAGWPGVL LHEAVGHGLE GDFNRRGTSV FSGQVGELVA SELCTVVDDG 
TMVDRRGSVA IDDEGTPGQY NVLIENGILK GYMQDKLNAR LMGMTPTGNG RRESYAHLPM 
PRMTNTYMLP GKSTPQEIIE SVEYGIYAPN FGGGQVDITS GKFVFSTSEA YLIENGKVTK 
PVKGATLIGS GIETMQQISM VGNDLKLDNG VGVCGKEGQS LPVGVGQPTL KVDNLTVGGT 
A