Gene EcSMS35_2699 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2699
Symbol
ID	6145582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2771161
End bp	2772159
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	55%
IMG OID	641617570
Product	putative sugar ABC transporter, permease protein
Protein accession	YP_001744735
Protein GI	170680743
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGCTT CGTCATTACC ATTGCCGCAG GGCAAGAGCG TCTCGCTCAA ACAATTTGTC 
AGTCGCCATA TTAATGAGAT CGGTTTGCTG GTGGTGATTG CCATTTTGTA TCTGGTCTTC 
TCCCTGAACG CGCCGGGTTT TATCTCATTG AATAACCAGA TGAACGTGCT GCGTGATGCC 
GCCACCATTG GGATCGCCGC CTGGGCGATG ACGCTGATTA TTATCTCCGG TGAAATTGAT 
GTCAGCGTTG GGCCGATGGT GGCTTTTGTC TCGGTGTGCC TGGCATTTTT GCTGCAATTT 
GACGTTCCGC TGGCGATTGC TTGTCTGCTG GTGTTGCTGT TAGGTGCGCT GATGGGAACG 
CTCGCCGGGG TGCTGCGCGG CGTGTTTAAC GTGCCAAGTT TTGTTGCCAC GCTGGGTTTA 
TGGAGCGCCC TGCGCGGAAT GGGGCTGTTT ATGACGAACG CCTTGCCAGT GCCAATTAAC 
GAAAACGAAG TGCTGGACTG GCTGGGCGGA CAATTTCTCG GTGTGCCGGT ATCCGCGCTG 
ATCATGATGG TGTTATTTGC GCTGTTTGTG TTCATTAGCC GCAAAACCGC CTTCGGGCGC 
TCGGTTTTTG CTGTTGGCGG TAATGCCACT GCAGCGCAGT TGTGCGGTAT TAACGTTCGT 
CGGGTACGCA TTCTTATTTT TACCCTTTCG GGATTATTAG CGGCGGTGAC CGGCATTTTG 
TTGGCGGCGC GCCTCGGTTC CGGTAACGCA GGTGCCGCAA ACGGTCTGGA GTTTGACGTC 
ATCGCCGCGG TCGTCGTCGG CGGTACGGCG CTTTCCGGTG GTCGCGGCTC GTTGTTCGGT 
ACGCTGCTTG GCGTACTGGT GATTACGCTA ATCGGTAACG GTCTGGTGCT GCTCGGGATT 
AACTCCTTTT TCCAGCAGGT GGTGCGCGGC GTCATCATCG TGGTGGCGGT GCTGGCGAAT 
ATCTTGCTGA CCCAGCGTAG CAGTAAAGCG AAACGCTAA

Protein sequence

MSASSLPLPQ GKSVSLKQFV SRHINEIGLL VVIAILYLVF SLNAPGFISL NNQMNVLRDA 
ATIGIAAWAM TLIIISGEID VSVGPMVAFV SVCLAFLLQF DVPLAIACLL VLLLGALMGT 
LAGVLRGVFN VPSFVATLGL WSALRGMGLF MTNALPVPIN ENEVLDWLGG QFLGVPVSAL 
IMMVLFALFV FISRKTAFGR SVFAVGGNAT AAQLCGINVR RVRILIFTLS GLLAAVTGIL 
LAARLGSGNA GAANGLEFDV IAAVVVGGTA LSGGRGSLFG TLLGVLVITL IGNGLVLLGI 
NSFFQQVVRG VIIVVAVLAN ILLTQRSSKA KR