Gene EcDH1_3800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3800
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4093204
End bp	4094601
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	53%
IMG OID
Product	putative sugar-specific permease SgaT/UlaA
Protein accession	ACX41402
Protein GI	260450980
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGATCC TCTACAACAT CTTTACCGTG TTTTTTAACC AGGTCATGAC CAATGCCCCG 
TTGTTGCTGG GTATTGTGAC CTGTCTGGGC TACATCCTAC TGCGCAAAAG TGTCAGCGTT 
ATTATTAAAG GCACGATTAA AACCATAATT GGTTTCATGT TGTTGCAGGC AGGGTCCGGC 
ATCCTCACCA GCACCTTCAA ACCGGTGGTG GCGAAAATGT CCGAAGTCTA CGGCATTAAC 
GGCGCAATTT CCGATACCTA CGCTTCAATG ATGGCAACCA TCGACCGCAT GGGCGATGCC 
TATAGCTGGG TGGGTTACGC CGTATTGTTA GCGCTGGCGC TGAACATCTG TTACGTGCTG 
TTGCGTCGCA TTACCGGCAT TCGCACAATC ATGTTGACCG GCCACATCAT GTTCCAGCAG 
GCCGGGTTGA TTGCCGTTAC GCTGTTTATC TTCGGCTACT CCATGTGGAC CACCATTATC 
TGTACCGCGA TTCTGGTTTC GCTCTACTGG GGCATCACTT CCAACATGAT GTACAAGCCG 
ACTCAGGAAG TGACGGATGG CTGTGGTTTC TCCATCGGTC ACCAGCAGCA GTTTGCATCA 
TGGATTGCCT ATAAAGTCGC GCCGTTCCTC GGCAAAAAAG AGGAGAGCGT TGAAGACCTC 
AAATTGCCGG GCTGGCTGAA CATTTTCCAC GACAACATCG TCTCCACGGC GATTGTGATG 
ACCATCTTCT TTGGTGCCAT TCTGCTCTCC TTCGGTATCG ACACCGTGCA GGCGATGGCA 
GGCAAAGTGC ACTGGACGGT GTACATCCTG CAAACTGGTT TCTCCTTTGC GGTGGCGATC 
TTCATCATCA CGCAGGGTGT GCGCATGTTT GTGGCGGAAC TCTCTGAAGC ATTTAACGGC 
ATTTCCCAGC GCCTGATCCC AGGTGCGGTT CTGGCGATTG ACTGTGCAGC TATCTATAGC 
TTCGCGCCGA ACGCCGTGGT CTGGGGCTTT ATGTGGGGCA CCATCGGTCA GCTGATTGCG 
GTTGGCATCC TGGTCGCCTG CGGCTCCTCG ATCCTGATTA TTCCTGGCTT TATCCCGATG 
TTCTTCTCTA ACGCCACCAT CGGCGTGTTC GCTAACCACT TCGGCGGCTG GCGTGCGGCG 
CTGAAGATTT GTCTGGTGAT GGGGATGATC GAAATCTTTG GTTGCGTCTG GGCGGTGAAA 
CTCACCGGTA TGAGTGCCTG GATGGGCATG GCGGACTGGT CGATTCTGGC ACCGCCGATG 
ATGCAAGGCT TCTTCTCCAT CGGTATCGCC TTTATGGCCG TCATCATTGT AATTGCACTG 
GCTTATATGT TCTTCGCTGG CCGCGCGCTG CGCGCAGAAG AAGATGCAGA AAAACAACTG 
GCAGAACAGT CTGCTTAA

Protein sequence

MEILYNIFTV FFNQVMTNAP LLLGIVTCLG YILLRKSVSV IIKGTIKTII GFMLLQAGSG 
ILTSTFKPVV AKMSEVYGIN GAISDTYASM MATIDRMGDA YSWVGYAVLL ALALNICYVL 
LRRITGIRTI MLTGHIMFQQ AGLIAVTLFI FGYSMWTTII CTAILVSLYW GITSNMMYKP 
TQEVTDGCGF SIGHQQQFAS WIAYKVAPFL GKKEESVEDL KLPGWLNIFH DNIVSTAIVM 
TIFFGAILLS FGIDTVQAMA GKVHWTVYIL QTGFSFAVAI FIITQGVRMF VAELSEAFNG 
ISQRLIPGAV LAIDCAAIYS FAPNAVVWGF MWGTIGQLIA VGILVACGSS ILIIPGFIPM 
FFSNATIGVF ANHFGGWRAA LKICLVMGMI EIFGCVWAVK LTGMSAWMGM ADWSILAPPM 
MQGFFSIGIA FMAVIIVIAL AYMFFAGRAL RAEEDAEKQL AEQSA