Gene EcHS_A2698 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2698
Symbol
ID	5595288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2713384
End bp	2714382
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	56%
IMG OID	640921815
Product	putative sugar ABC transporter, permease protein
Protein accession	YP_001459339
Protein GI	157162021
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGCTT CGTCATTACC ATTGCCGCAG GGCAAGAGCG TCTCGCTCAA ACAATTTGTC 
AGTCGCCATA TTAATGAGAT CGGTTTGCTG GTGGTGATTG CCATTCTTTA TCTGGTCTTC 
TCCCTGAACG CGCCTGGCTT TATCTCATTG AATAACCAGA TGAACGTGCT GCGCGATGCC 
GCCACCATTG GGATTGCCGC CTGGGCGATG ACGCTGATTA TTATCTCCGG TGAGATTGAT 
GTCAGCGTTG GGCCGATGGT GGCTTTTGTC TCGGTGTGCC TGGCATTTTT GCTGCAATTT 
GAAGTTCCGT TGGCGATTGC TTGTCTGCTG GTGTTGCTGT TAGGCGCGCT GATGGGAACG 
CTCGCCGGGG TGCTGCGCGG CGTGTTTAAC GTACCAAGTT TCGTTGCCAC ACTGGGGCTG 
TGGAGCGCCC TGCGCGGAAT GGGGCTGTTT ATGACGAACG CACTGCCAGT GCCGATTGAC 
GAAAACGAGG TGCTGGACTG GCTGGGCGGA CAATTTCTCG GTGTGCCGGT ATCCGCGCTG 
ATCATGATTG TGTTGTTTGC GCTGTTTGTG TTCATCAGCC GCAAAACCGC CTTCGGGCGC 
TCGGTTTTTG CCGTTGGCGG TAATGCTACG GCGGCGCAGT TGTGCGGCAT CAACGTTCGT 
CGGGTGCGCA TTCTTATCTT TACCCTTTCG GGATTATTAG CGGCGGTGAC CGGCATTTTG 
TTGGCGGCGC GCCTCGGTTC TGGTAACGCA GGTGCCGCAA ACGGTCTGGA GTTTGACGTC 
ATCGCCGCGG TCGTGGTCGG CGGTACGGCA CTTTCCGGCG GTCGCGGTTC CCTGTTCGGT 
ACATTGCTTG GTGTGCTGGT GATTACGCTA ATCGGTAACG GTCTGGTGCT GCTCGGTATT 
AACTCCTTTT TCCAGCAGGT GGTACGCGGC GTCATCATCG TGGTGGCGGT GCTGGCGAAT 
ATCTTGCTGA CCCAGCGAAG CAGTAAAGCG AAACGCTAA

Protein sequence

MSASSLPLPQ GKSVSLKQFV SRHINEIGLL VVIAILYLVF SLNAPGFISL NNQMNVLRDA 
ATIGIAAWAM TLIIISGEID VSVGPMVAFV SVCLAFLLQF EVPLAIACLL VLLLGALMGT 
LAGVLRGVFN VPSFVATLGL WSALRGMGLF MTNALPVPID ENEVLDWLGG QFLGVPVSAL 
IMIVLFALFV FISRKTAFGR SVFAVGGNAT AAQLCGINVR RVRILIFTLS GLLAAVTGIL 
LAARLGSGNA GAANGLEFDV IAAVVVGGTA LSGGRGSLFG TLLGVLVITL IGNGLVLLGI 
NSFFQQVVRG VIIVVAVLAN ILLTQRSSKA KR