Gene EcHS_A0388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0388
Symbol
ID	5593107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	406862
End bp	407833
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	51%
IMG OID	640919573
Product	sugar ABC transporter, permease protein
Protein accession	YP_001457159
Protein GI	157159841
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGAAC TGAAAAAACG CCATGAATTC TGGCTGGCAT TACTGATTGT GGTGCTGTTT 
GTTGGCCTTG CCTGGCGCAG CGACGAGTTT CTGACATTCG GTAATTTGTA CGATCTCGCC 
AATAACTATG CCATGTTGAC TATTCTCGCC TGTGGTTTGT TTGTGGTGTT GATTTCCGGT 
GGAATTGATA TTTCGTTTCC AGCAATGACC ATCATTGCGC AATACGGCAT GGTGCTGTTG 
CTGCAAAAAA TTGGTGGCAA CTTCGCTGTC GCGTTTGCAC TGGCGGGCTG CATCGGCATT 
TTACTTGGCT TAATTAACGC CTTACTGGTT AATCGCCTAC GGGTGCCTTC TATCATCATC 
ACTATCTCGA CGCTGAATAT TTTCTATGGC CTGCTGTTAT GGTTGAGTAA AGGTGTGTGG 
CTGTACGACT TTCCGCCGTG GTTTGAGCAG GGGGTTATGT TGTTCAAGTA CACCGATGCT 
GATGGCTATG ACTATGGCCT TGGTCTGCCG CTGATCGCCA TGATTACGGT GGTGCTGCTA 
ACAGCGTTTA TCATGAATTT CACCAGTGTA GGGCGCAAAA TTTATGCCCT TGGCGGGAAC 
CGCGAATCAG CCAGTCGCAT CGGCTTTAGC GTGCTGAAAC TGCAACTTTT CGTCTATGGC 
TATATGGGAT TGATGTCTGG CGCTGCGGGT GTAGTGCAGT CGTGGACGGT GATGACTGTC 
GCCCCCGATT CTCTTCTGGG TTATGAGCTG ACAGTACTGG CTGCGGTGGT GCTTGGCGGC 
ACTAGTTTGC TCGGCGGGCG CGGCACGTTA ACCGGTACTT TGCTCGGCGT GGTGTTGTTG 
GCAGTGATGC AAAACGGGCT AAATTTATTG GGAGTCTCGT CTTACTGGCA AACATTGATC 
ACCGGCATCA TCATCGTTGC CAGCATTAGT GCCACGGCGT GGAGTCAGCA TCAGAACCGG 
AGTCTGCTAT GA

Protein sequence

MAELKKRHEF WLALLIVVLF VGLAWRSDEF LTFGNLYDLA NNYAMLTILA CGLFVVLISG 
GIDISFPAMT IIAQYGMVLL LQKIGGNFAV AFALAGCIGI LLGLINALLV NRLRVPSIII 
TISTLNIFYG LLLWLSKGVW LYDFPPWFEQ GVMLFKYTDA DGYDYGLGLP LIAMITVVLL 
TAFIMNFTSV GRKIYALGGN RESASRIGFS VLKLQLFVYG YMGLMSGAAG VVQSWTVMTV 
APDSLLGYEL TVLAAVVLGG TSLLGGRGTL TGTLLGVVLL AVMQNGLNLL GVSSYWQTLI 
TGIIIVASIS ATAWSQHQNR SLL