Gene EcHS_A4483 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4483
Symbol
ID	5595161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4487766
End bp	4488791
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	58%
IMG OID	640923581
Product	putative sugar ABC transporter, permease protein
Protein accession	YP_001461022
Protein GI	157163704
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	64
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATGCCTC AATCTCTCCC GGACACTACG CCGCCGAAAA GGCGCTTTCG CTGGCCAACG 
GGAATGCCGC AGCTGGCGGC GCTATTGCTG GTGCTGCTGG TCGATAGCCT GGTAGCCCCG 
CATTTCTGGC AGGTGGTGCT TCAGGATGGG CGTTTGTTCG GTAGCCCTAT CGACATTCTT 
AACCGTGCAG CTCCCGTTGC GTTACTGGCG ATTGGTATGA CGCTGGTGAT CGCCACCGGT 
GGGATTGATC TCTCCGTAGG GGCGGTGATG GCTATCGCCG GAGCCACAAC GGCTGCGATG 
ACGGTCGCGG GATTCAGCCT GCCGATTGTT TTGTTAAGCG CCCTGGGCAC CGGCATCCTG 
GCGGGATTGT GGAACGGCAT ACTGGTAGCG ATCCTCAAAA TTCAGCCGTT TGTCGCCACC 
CTGATCCTGA TGGTCGCCGG GCGCGGCGTG GCGCAACTGA TCACCGCCGG GCAGATCGTC 
ACGTTTAACT CGCCGGATCT CTCATGGTTT GGCAGCGGAT CGCTGTTGTT CCTGCCAACG 
CCGGTCATTA TCGCGGTGCT GACGCTTCTC CTGTTCTGGC TGTTGACCCG CAAAACGGCG 
CTGGGGATGT TTATCGAAGC CGTTGGTATC AACATTCGGG CGGCAAAAAA TGCCGGGGTA 
AACACGCGGA TCATCGTCAT GCTCACCTAC GTGTTGAGCG GGCTGTGTGC GGCGATTGCG 
GGCATTATCG TGGCGGCGGA TATTCGCGGT GCCGATGCCA ATAACGCCGG GTTATGGCTG 
GAGCTGGACG CCATTCTTGC GGTGGTGATT GGCGGCGGAT CGCTGATGGG CGGGCGCTTT 
AACCTGCTGC TCTCAGTCGT GGGGGCGCTG ATTATTCAGG GGATGAACAC CGGAATTTTA 
CTTTCTGGCT TTCCGCCGGA GATGAACCAG GTCGTAAAAG CGGTGGTGGT GCTTTGTGTG 
CTGATTGTTC AGTCGCAACG CTTTATCAGT CTGATTAAAG GAGTACGTAG CCATGATAAA 
ACGTAA

Protein sequence

MMPQSLPDTT PPKRRFRWPT GMPQLAALLL VLLVDSLVAP HFWQVVLQDG RLFGSPIDIL 
NRAAPVALLA IGMTLVIATG GIDLSVGAVM AIAGATTAAM TVAGFSLPIV LLSALGTGIL 
AGLWNGILVA ILKIQPFVAT LILMVAGRGV AQLITAGQIV TFNSPDLSWF GSGSLLFLPT 
PVIIAVLTLL LFWLLTRKTA LGMFIEAVGI NIRAAKNAGV NTRIIVMLTY VLSGLCAAIA 
GIIVAADIRG ADANNAGLWL ELDAILAVVI GGGSLMGGRF NLLLSVVGAL IIQGMNTGIL 
LSGFPPEMNQ VVKAVVVLCV LIVQSQRFIS LIKGVRSHDK T