Gene EcDH1_3754 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3754
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	4047625
End bp	4049046
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	54%
IMG OID
Product	PTS system, trehalose-specific IIBC subunit
Protein accession	ACX41359
Protein GI	260450937
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAGCA AAATAAACCA AACGGATATC GATCGGTTGA TTGAACTGGT CGGCGGGCGC 
GGCAATATTG CGACGGTGAG CCACTGTATT ACTCGCCTAC GCTTTGTCCT CAACCAACCG 
GCCAATGCCA GACCGAAAGA AATTGAGCAA CTCCCTATGG TGAAAGGCTG TTTCACCAAT 
GCCGGGCAAT TTCAGGTGGT GATTGGCACC AACGTGGGTG ATTACTATCA AGCACTGATT 
GCGTCAACCG GACAGGCGCA GGTTGATAAA GAGCAGGTAA AAAAAGCCGC CCGGCATAAT 
ATGAAATGGC ATGAGCAGTT GATCTCTCAT TTCGCGGTGA TCTTCTTCCC GTTGCTGCCC 
GCGTTGATTA GCGGCGGTTT GATCCTCGGT TTTCGCAATG TGATCGGCGA TTTGCCCATG 
AGCAACGGTC AGACGCTGGC GCAAATGTAC CCTTCCCTGC AAACGATCTA CGATTTTCTG 
TGGTTGATCG GTGAAGCGAT CTTCTTCTAC CTGCCGGTCG GTATTTGCTG GTCAGCGGTG 
AAAAAAATGG GCGGCACGCC GATCCTTGGT ATCGTGCTTG GCGTGACACT GGTTTCTCCA 
CAGCTGATGA ACGCTTATCT GCTCGGGCAG CAGCTGCCGG AAGTGTGGGA CTTTGGCATG 
TTCAGCATCG CCAAAGTAGG CTATCAGGCG CAGGTGATCC CGGCACTGTT AGCCGGACTG 
GCGCTGGGCG TTATTGAAAC TCGCCTTAAA CGCATCGTGC CGGATTACCT CTATCTGGTG 
GTGGTACCCG TCTGTTCGCT GATCCTCGCG GTGTTCCTCG CCCATGCGCT GATTGGTCCG 
TTTGGTCGCA TGATTGGCGA TGGCGTTGCC TTTGCGGTAC GTCACCTGAT GACCGGCAGC 
TTTGCTCCGA TTGGCGCAGC ATTGTTTGGC TTCCTGTACG CCCCGCTGGT GATCACCGGT 
GTACACCAGA CCACGCTTGC TATTGATTTG CAGATGATTC AAAGCATGGG TGGTACGCCA 
GTGTGGCCGC TGATTGCGCT GTCGAATATC GCTCAGGGCT CCGCCGTGAT AGGCATTATC 
ATTTCCAGCC GCAAGCACAA TGAACGCGAG ATCTCCGTGC CTGCCGCTAT CTCCGCCTGG 
CTTGGGGTCA CTGAGCCTGC AATGTACGGC ATCAACCTGA AATATCGCTT CCCGATGCTG 
TGCGCGATGA TTGGTTCTGG TCTGGCAGGA TTGCTATGCG GCCTGAACGG CGTTATGGCG 
AATGGCATCG GCGTAGGCGG CCTGCCGGGA ATTCTCTCGA TTCAACCGAG CTACTGGCAG 
GTGTTTGCGC TGGCAATGGC TATCGCCATC ATCATCCCGA TTGTACTCAC CTCGTTTATC 
TATCAGCGGA AATACCGCCT GGGCACGCTG GACATTGTTT AA

Protein sequence

MMSKINQTDI DRLIELVGGR GNIATVSHCI TRLRFVLNQP ANARPKEIEQ LPMVKGCFTN 
AGQFQVVIGT NVGDYYQALI ASTGQAQVDK EQVKKAARHN MKWHEQLISH FAVIFFPLLP 
ALISGGLILG FRNVIGDLPM SNGQTLAQMY PSLQTIYDFL WLIGEAIFFY LPVGICWSAV 
KKMGGTPILG IVLGVTLVSP QLMNAYLLGQ QLPEVWDFGM FSIAKVGYQA QVIPALLAGL 
ALGVIETRLK RIVPDYLYLV VVPVCSLILA VFLAHALIGP FGRMIGDGVA FAVRHLMTGS 
FAPIGAALFG FLYAPLVITG VHQTTLAIDL QMIQSMGGTP VWPLIALSNI AQGSAVIGII 
ISSRKHNERE ISVPAAISAW LGVTEPAMYG INLKYRFPML CAMIGSGLAG LLCGLNGVMA 
NGIGVGGLPG ILSIQPSYWQ VFALAMAIAI IIPIVLTSFI YQRKYRLGTL DIV