Gene EcDH1_3965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3965
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	4272216
End bp	4273691
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	50%
IMG OID
Product	sugar transporter
Protein accession	ACX41565
Protein GI	260451143
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACCC AGTATAATTC CAGTTATATA TTTTCGATTA CCTTAGTCGC TACATTAGGT 
GGTTTATTAT TTGGCTACGA CACCGCCGTT ATTTCCGGTA CTGTTGAGTC ACTCAATACC 
GTCTTTGTTG CTCCACAAAA CTTAAGTGAA TCCGCTGCCA ACTCCCTGTT AGGGTTTTGC 
GTGGCCAGCG CTCTGATTGG TTGCATCATC GGCGGTGCCC TCGGTGGTTA TTGCAGTAAC 
CGCTTCGGTC GTCGTGATTC ACTTAAGATT GCTGCTGTCC TGTTTTTTAT TTCTGGTGTA 
GGTTCTGCCT GGCCAGAACT TGGTTTTACC TCTATAAACC CGGACAACAC TGTGCCTGTT 
TATCTGGCAG GTTATGTCCC GGAATTTGTT ATTTATCGCA TTATTGGCGG TATTGGCGTT 
GGTTTAGCCT CAATGCTCTC GCCAATGTAT ATTGCGGAAC TGGCTCCAGC TCATATTCGC 
GGGAAACTGG TCTCTTTTAA CCAGTTTGCG ATTATTTTCG GGCAACTTTT AGTTTACTGC 
GTAAACTATT TTATTGCCCG TTCCGGTGAT GCCAGCTGGC TGAATACTGA CGGCTGGCGT 
TATATGTTTG CCTCGGAATG TATCCCTGCA CTGCTGTTCT TAATGCTGCT GTATACCGTG 
CCAGAAAGTC CTCGCTGGCT GATGTCGCGC GGCAAGCAAG AACAGGCGGA AGGTATCCTG 
CGCAAAATTA TGGGCAACAC GCTTGCAACT CAGGCAGTAC AGGAAATTAA ACACTCCCTG 
GATCATGGCC GCAAAACCGG TGGTCGTCTG CTGATGTTTG GCGTGGGCGT GATTGTAATC 
GGCGTAATGC TCTCCATCTT CCAGCAATTT GTCGGCATCA ATGTGGTGCT GTACTACGCG 
CCGGAAGTGT TCAAAACGCT GGGGGCCAGC ACGGATATCG CGCTGTTGCA GACCATTATT 
GTCGGAGTTA TCAACCTCAC CTTCACCGTT CTGGCAATTA TGACGGTGGA TAAATTTGGT 
CGTAAGCCAC TGCAAATTAT CGGCGCACTC GGAATGGCAA TCGGTATGTT TAGCCTCGGT 
ACCGCGTTTT ACACTCAGGC ACCGGGTATT GTGGCGCTAC TGTCGATGCT GTTCTATGTT 
GCCGCCTTTG CCATGTCCTG GGGTCCGGTA TGCTGGGTAC TGCTGTCGGA AATCTTCCCG 
AATGCTATTC GTGGTAAAGC GCTGGCAATC GCGGTGGCGG CCCAGTGGCT GGCGAACTAC 
TTCGTCTCCT GGACCTTCCC GATGATGGAC AAAAACTCCT GGCTGGTGGC CCATTTCCAC 
AACGGTTTCT CCTACTGGAT TTACGGTTGT ATGGGCGTTC TGGCAGCACT GTTTATGTGG 
AAATTTGTCC CGGAAACCAA AGGTAAAACC CTTGAGGAGC TGGAAGCGCT CTGGGAACCG 
GAAACGAAGA AAACACAACA AACTGCTACG CTGTAA

Protein sequence

MNTQYNSSYI FSITLVATLG GLLFGYDTAV ISGTVESLNT VFVAPQNLSE SAANSLLGFC 
VASALIGCII GGALGGYCSN RFGRRDSLKI AAVLFFISGV GSAWPELGFT SINPDNTVPV 
YLAGYVPEFV IYRIIGGIGV GLASMLSPMY IAELAPAHIR GKLVSFNQFA IIFGQLLVYC 
VNYFIARSGD ASWLNTDGWR YMFASECIPA LLFLMLLYTV PESPRWLMSR GKQEQAEGIL 
RKIMGNTLAT QAVQEIKHSL DHGRKTGGRL LMFGVGVIVI GVMLSIFQQF VGINVVLYYA 
PEVFKTLGAS TDIALLQTII VGVINLTFTV LAIMTVDKFG RKPLQIIGAL GMAIGMFSLG 
TAFYTQAPGI VALLSMLFYV AAFAMSWGPV CWVLLSEIFP NAIRGKALAI AVAAQWLANY 
FVSWTFPMMD KNSWLVAHFH NGFSYWIYGC MGVLAALFMW KFVPETKGKT LEELEALWEP 
ETKKTQQTAT L