Gene EcDH1_3370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3370
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	3615662
End bp	3617119
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	51%
IMG OID
Product	aminoacyl-histidine dipeptidase
Protein accession	ACX40990
Protein GI	260450568
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCTGAAC TGTCTCAATT ATCTCCACAG CCGCTGTGGG ATATTTTTGC CAAAATCTGT 
TCTATTCCTC ACCCGTCCTA TCATGAAGAG CAACTCGCTG AATACATTGT TGGTTGGGCA 
AAAGAGAAAG GTTTCCATGT CGAACGCGAT CAGGTAGGTA ATATCCTGAT TCGTAAACCT 
GCTACCGCAG GTATGGAAAA TCGTAAACCG GTCGTCTTAC AGGCCCACCT CGATATGGTG 
CCGCAGAAAA ATAACGACAC CGTGCATGAC TTCACGAAAG ATCCTATCCA GCCTTATATT 
GATGGCGAAT GGGTTAAAGC GCGCGGCACC ACGCTGGGTG CGGATAACGG CATTGGTATG 
GCCTCTGCGC TGGCGGTTCT GGCTGACGAA AACGTGGTTC ACGGCCCGCT GGAAGTGCTG 
CTGACCATGA CCGAAGAAGC CGGTATGGAC GGTGCGTTCG GCTTACAGGG CAACTGGTTG 
CAGGCTGATA TTCTGATTAA CACCGACTCC GAAGAAGAAG GTGAAATCTA CATGGGTTGT 
GCGGGGGGTA TCGACTTCAC CTCCAACCTG CATTTAGATC GTGAAGCGGT TCCAGCTGGT 
TTTGAAACCT TCAAGTTAAC CTTAAAAGGT CTGAAAGGCG GTCACTCCGG CGGGGAAATC 
CACGTTGGGC TGGGTAATGC CAACAAACTG CTGGTGCGCT TCCTGGCGGG TCATGCGGAA 
GAACTGGATC TGCGCCTTAT CGATTTCAAC GGCGGCACAC TGCGTAACGC CATCCCGCGT 
GAAGCCTTTG CGACCATTGC TGTCGCAGCT GATAAAGTCG ACGTCCTGAA ATCTCTGGTG 
AATACCTATC AGGAGATCCT GAAAAACGAG CTGGCAGAAA AAGAGAAAAA TCTGGCCTTG 
TTGCTGGACT CTGTAGCGAA CGATAAAGCT GCCCTGATTG CGAAATCTCG CGATACCTTT 
ATTCGTCTGC TGAACGCCAC CCCGAACGGT GTGATTCGTA ACTCCGATGT AGCCAAAGGT 
GTGGTTGAAA CCTCCCTGAA CGTCGGTGTG GTGACCATGA CTGACAATAA CGTAGAAATT 
CACTGCCTGA TCCGTTCACT GATCGACAGC GGTAAAGACT ACGTGGTGAG CATGCTGGAT 
TCGCTGGGTA AACTGGCTGG CGCGAAAACC GAAGCGAAAG GCGCATATCC TGGCTGGCAG 
CCGGACGCTA ATTCTCCGGT GATGCATCTG GTACGTGAAA CCTATCAGCG CCTGTTCAAC 
AAGACGCCGA ACATCCAGAT TATCCACGCG GGCCTGGAAT GTGGTCTGTT CAAAAAACCG 
TATCCGGAAA TGGACATGGT TTCTATCGGG CCAACTATCA CCGGTCCACA CTCTCCGGAT 
GAGCAAGTTC ACATCGAAAG CGTAGGTCAT TACTGGACAC TGCTGACTGA ACTGCTGAAA 
GAAATTCCGG CGAAGTAA

Protein sequence

MSELSQLSPQ PLWDIFAKIC SIPHPSYHEE QLAEYIVGWA KEKGFHVERD QVGNILIRKP 
ATAGMENRKP VVLQAHLDMV PQKNNDTVHD FTKDPIQPYI DGEWVKARGT TLGADNGIGM 
ASALAVLADE NVVHGPLEVL LTMTEEAGMD GAFGLQGNWL QADILINTDS EEEGEIYMGC 
AGGIDFTSNL HLDREAVPAG FETFKLTLKG LKGGHSGGEI HVGLGNANKL LVRFLAGHAE 
ELDLRLIDFN GGTLRNAIPR EAFATIAVAA DKVDVLKSLV NTYQEILKNE LAEKEKNLAL 
LLDSVANDKA ALIAKSRDTF IRLLNATPNG VIRNSDVAKG VVETSLNVGV VTMTDNNVEI 
HCLIRSLIDS GKDYVVSMLD SLGKLAGAKT EAKGAYPGWQ PDANSPVMHL VRETYQRLFN 
KTPNIQIIHA GLECGLFKKP YPEMDMVSIG PTITGPHSPD EQVHIESVGH YWTLLTELLK 
EIPAK