Gene EcolC_1131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1131
Symbol
ID	6068023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1236098
End bp	1237096
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	56%
IMG OID	641600547
Product	monosaccharide-transporting ATPase
Protein accession	YP_001724125
Protein GI	170019171
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGCTT CGTCATTATC ATTGCCGCAG GGCAAGAGCG TCTCGCTCAA ACAATTTGTC 
AGTCGCCATA TTAATGAGAT CGGTTTGCTG GTGGTAATCG CCATTCTTTA TCTGGTCTTC 
TCCCTGAACG CGCCTGGCTT TATCTCATTG AATAACCAGA TGAACGTGCT GCGCGATGCC 
GCCACCATTG GGATTGCCGC CTGGGCGATG ACGCTGATTA TTATCTCCGG TGAAATTGAT 
GTCAGCGTTG GGCCGATGGT GGCTTTTGTC TCGGTGTGCC TGGCATTTTT GCTGCAATTT 
GAAGTTCCGT TGGCGATTGC TTGTCTGCTG GTGTTGCTGT TAGGCGCGCT GATGGGAACG 
CTCGCCGGGG TGCTGCGCGG CGTGTTTAAC GTACCAAGTT TCGTTGCCAC ACTGGGGCTG 
TGGAGCGCCC TGCGCGGAAT GGGGCTGTTT ATGACCAACG CACTGCCAGT GCCGATTGAC 
GAAAACGAGG TGCTGGACTG GCTGGGCGGA CAATTTCTCG GTGTGCCAGT ATCCGCGCTG 
ATCATGATGG TGTTGTTTGC GCTGTTTGTG TTCATTAGCC GAAAAACCGC CTTCGGGCGC 
TCGGTTTTTG CCGTTGGCGG TAATGCCACG GCGGCGCAGT TGTGCGGCAT CAACGTTCGT 
CGGGTACGCA TTCTTATCTT TACCCTTTCG GGATTATTAG CGGCGGTGAC CGGCATTTTG 
TTGGCGGCGC GCCTCGGTTC CGGTAACGCA GGTGCCGCAA ACGGTCTGGA GTTTGACGTC 
ATCGCCGCGG TCGTGGTCGG CGGTACGGCA CTTTCCGGCG GTCGCGGTTC CCTGTTCGGT 
ACATTGCTTG GTGTGCTGGT GATTACGCTA ATCGGTAACG GTCTGGTGCT GCTCGGTATT 
AACTCCTTTT TCCAGCAGGT GGTACGCGGC GTCATCATCG TGGTGGCGGT GCTGGCGAAT 
ATCTTGCTGA CCCAGCGAAG CAGTAAAGCG AAACGCTAA

Protein sequence

MSASSLSLPQ GKSVSLKQFV SRHINEIGLL VVIAILYLVF SLNAPGFISL NNQMNVLRDA 
ATIGIAAWAM TLIIISGEID VSVGPMVAFV SVCLAFLLQF EVPLAIACLL VLLLGALMGT 
LAGVLRGVFN VPSFVATLGL WSALRGMGLF MTNALPVPID ENEVLDWLGG QFLGVPVSAL 
IMMVLFALFV FISRKTAFGR SVFAVGGNAT AAQLCGINVR RVRILIFTLS GLLAAVTGIL 
LAARLGSGNA GAANGLEFDV IAAVVVGGTA LSGGRGSLFG TLLGVLVITL IGNGLVLLGI 
NSFFQQVVRG VIIVVAVLAN ILLTQRSSKA KR