Gene EcHS_A1772 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1772
Symbol
ID	5595049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1794530
End bp	1795801
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	45%
IMG OID	640920922
Product	major facilitator transporter
Protein accession	YP_001458474
Protein GI	157161156
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	49
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAATGT CTCAAAATAA GGCTTTCAGC ACGCCATTTA TCCTGGCTGT TCTTTGTATT 
TACTTCAGCT ACTTCCTGCA CGGCATTAGT GTTATTACGC TTGCCCAAAA TATGTCATCT 
CTGGCGGAAA AGTTTTCCAC TGACAACGCG GGCATTGCCT ACTTAATTTC CGGTATCGGT 
TTGGGGCGAT TGATCAGTAT TTTATTCTTC GGTGTGATCT CCGATAAGTT TGGTCGTCGG 
GCGGTGATAT TAATGGCAGT AATAATGTAT CTGCTATTCT TCTTTGGTAT TCCCGCTTGC 
CCGAATTTAA CTCTCGCCTA CGGTCTGGCA GTGTGCGTAG GTATCGCTAA CTCAGCGCTG 
GATACGGGTG GCTACCCCGC GCTCATGGAA TGCTTTCCGA AAGCCTCTGG TTCGGCGGTC 
ATACTGGTTA AAGCGATGGT GTCATTTGGG CAAATGTTCT ACCCAATGCT GGTGAGCTAT 
ATGTTGCTCA ATAATATCTG GTACGGCTAT GGGCTGATTA TTCCGGGTAT TCTATTTGTA 
CTGATCACGC TGATGCTGTT GAAAAGCAAA TTCCCCAGCC AGTTGGTGGA CGCCAGCGTA 
ACTAATGAAT TACCGCAAAT GAACAGCAAA CCGTTAGTCT GGCTGGAAGG TGTTTCATCG 
GTACTGTTCG GTGTAGCCGC ATTCTCGACC TTTTATGTGA TTGTGGTGTG GATGCCCAAA 
TATGCGATGG CTTTTGCTGG TATGTCAGAA GCTGAGGCAT TAAAAACCAT CTCTTATTAC 
AGTATGGGCT CGTTGGTCTG TGTCTTTATT TTTGCCGCAC TACTGAAAAA AATGGTCCGG 
CCCATCTGGG CTAATGTATT TAACTCTGCA CTGGCAACAA TAACAGCAGC CATTATCTAC 
CTGTACCCTT CTCCACTGGT GTGTAATGCC GGCGCCTTTG TTATCGGTTT CTCAGCAGCT 
GGCGGCATTT TACAGCTCGG TGTTTCGGTC ATGTCAGAGT TTTTCCCAAA AAGCAAAGCC 
AAAGTCACCA GTATTTATAT GATGATGGGT GGACTGGCTA ACTTTGTTAT TCCGCTGATT 
ACCGGTTATC TGTCGAACAT CGGCCTGCAA TATATCATTG TTCTCGATTT TACTTTCGCG 
CTGCTGGCCC TGATTACCGC AATTATTGTT TTTATCCGCT ATTACCGCGT TTTTATTATT 
CCTGAGAATG ATGTGCGGTT TGGCGAGCGC AAATTTAGCA CCCGGTTAAA CACAATTAAG 
CATAGAGGTT AA

Protein sequence

MKMSQNKAFS TPFILAVLCI YFSYFLHGIS VITLAQNMSS LAEKFSTDNA GIAYLISGIG 
LGRLISILFF GVISDKFGRR AVILMAVIMY LLFFFGIPAC PNLTLAYGLA VCVGIANSAL 
DTGGYPALME CFPKASGSAV ILVKAMVSFG QMFYPMLVSY MLLNNIWYGY GLIIPGILFV 
LITLMLLKSK FPSQLVDASV TNELPQMNSK PLVWLEGVSS VLFGVAAFST FYVIVVWMPK 
YAMAFAGMSE AEALKTISYY SMGSLVCVFI FAALLKKMVR PIWANVFNSA LATITAAIIY 
LYPSPLVCNA GAFVIGFSAA GGILQLGVSV MSEFFPKSKA KVTSIYMMMG GLANFVIPLI 
TGYLSNIGLQ YIIVLDFTFA LLALITAIIV FIRYYRVFII PENDVRFGER KFSTRLNTIK 
HRG