Gene EcSMS35_4664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4664
Symbol	ulaA
ID	6147065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4764762
End bp	4766159
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	53%
IMG OID	641619480
Product	PTS system ascorbate-specific transporter subunit IIC
Protein accession	YP_001746588
Protein GI	170680215
COG category	[S] Function unknown
COG ID	[COG3037] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGATCC TCTACAACAT CTTTACCGTG TTTTTTAACC AGGTCATGAC CAATGCCCCG 
TTGTTGCTGG GTATTGTGAC CTGTCTGGGC TACATCCTAC TGCGCAAAAG TGTCAGCGTT 
ATTATTAAAG GCACGATTAA AACCATAATT GGTTTCATGT TGTTGCAGGC AGGGTCCGGC 
ATCCTCACCA GCACCTTCAA ACCGGTGGTG GCGAAAATGT CCGAAGTCTA CGGCATTAAC 
GGCGCAATTT CCGATACTTA CGCGTCGATG ATGGCAACCA TCGACCGCAT GGGCGATGCC 
TATAGCTGGG TAGGTTACGC GGTGTTGTTA GCGCTGGCGC TGAACATCTG TTACGTGCTG 
CTGCGTCGCA TTACCGGTAT TCGTACCATC ATGCTGACTG GACACATCAT GTTCCAGCAG 
GCGGGACTGA TTGCCGTTAC GTTGTTTATT TTCGGCTATT CCATGTGGAC GACCATTATC 
TGCACGGCGA TTCTGGTTTC GCTCTACTGG GGCATAACCT CCAACATGAT GTACAAGCCG 
ACTCAGGAAG TGACGGACGG CTGCGGTTTC TCCATCGGTC ACCAGCAACA GTTTGCATCA 
TGGATTGCCT ATAAGGTTGC GCCGTTCCTT GGCAAAAAAG AGGAAAGCGT TGAAGACCTC 
AAACTGCCAG GCTGGCTGAA TATTTTCCAC GACAACATCG TCTCCACGGC GATTGTCATG 
ACCATCTTCT TTGGTGCCAT TCTGCTCTCC TTCGGTATCG ACACCGTGCA GGCGATGGCA 
GGCAAAGTGA ACTGGACGGT GTATATCCTG CAAACCGGTT TCTCCTTCGC GGTGGCGATC 
TTCATCATCA CTCAGGGTGT GCGCATGTTT GTAGCGGAAC TCTCTGAAGC GTTTAACGGT 
ATCTCTCAGC GCCTGATCCC TGGCGCGGTT CTGGCGATTG ACTGTGCGGC TATTTATAGC 
TTCGCGCCGA ACGCCGTGGT CTGGGGCTTT ATGTGGGGCA CCATCGGTCA GCTGATTGCG 
GTTGGCATCC TGGTCGCCTG CGGTTCCTCG ATCCTGATTA TCCCCGGCTT TATCCCGATG 
TTCTTCTCCA ACGCCACCAT CGGCGTGTTC GCTAACCACT TCGGCGGCTG GCGTGCGGCG 
CTGAAGATTT GTCTGGTGAT GGGGATGATC GAAATCTTTG GTTGCGTCTG GGCGGTGAAA 
CTTACCGGTA TGAGTGCCTG GATGGGTATG GCGGACTGGT CGATTCTGGC ACCGCCGATG 
ATGCAGGGCT TCTTCTCCAT CGGTATCGCC TTTATGGCTG TCATCATTGT AATTGCACTG 
GCTTATATGT TCTTCGCTGG CCGCGCACTG CGCGCAGAAG AAGATGCAGA AAAACAACTG 
GCAGAACAGT CTGCTTAA

Protein sequence

MEILYNIFTV FFNQVMTNAP LLLGIVTCLG YILLRKSVSV IIKGTIKTII GFMLLQAGSG 
ILTSTFKPVV AKMSEVYGIN GAISDTYASM MATIDRMGDA YSWVGYAVLL ALALNICYVL 
LRRITGIRTI MLTGHIMFQQ AGLIAVTLFI FGYSMWTTII CTAILVSLYW GITSNMMYKP 
TQEVTDGCGF SIGHQQQFAS WIAYKVAPFL GKKEESVEDL KLPGWLNIFH DNIVSTAIVM 
TIFFGAILLS FGIDTVQAMA GKVNWTVYIL QTGFSFAVAI FIITQGVRMF VAELSEAFNG 
ISQRLIPGAV LAIDCAAIYS FAPNAVVWGF MWGTIGQLIA VGILVACGSS ILIIPGFIPM 
FFSNATIGVF ANHFGGWRAA LKICLVMGMI EIFGCVWAVK LTGMSAWMGM ADWSILAPPM 
MQGFFSIGIA FMAVIIVIAL AYMFFAGRAL RAEEDAEKQL AEQSA