Gene EcSMS35_A0133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_A0133
Symbol	sat
ID	6106506
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010488
Strand	+
Start bp	102959
End bp	104038
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	49%
IMG OID	641614873
Product	streptothricin acetyltransferase Sat-1
Protein accession	YP_001740014
Protein GI	170650888
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCTCAC GCAACTGGTC CAGAACCTTG ACCGAACGCA GCGGTGGTAA CGGCGCAGTG 
GCGGTTTTCA TGGCTTGTTA TGACTGTTTT TTTGTACAGT CTATGCCTCG AGCATCCAAG 
CAGCAAGCGC GTTACGCCGT GGGTCGATGT TTGATGTTAT GGAGCAGCAA CGATGTTACG 
CAGCAGGGCA GTCGCCCTAA AACAAAGTTG TACGTAGAAC TCGAAGGCAA TTTAAGTATG 
AAAGAAAAGG TAGTTGTTGA TAAAGCGATT TCACTCTATA CCGAATCATT CGGCGACCCG 
GCCCATGAAC CCATTATTCT GATCATGGGG GCAATGTCGT CTGCGGTGTG GTGGCCTGAT 
GAGTTTTGTT CCCAACTTGC CAAAATGGGT CGCTATGTGA TCCGGTACGA CCACCGTGAT 
ACCGGGAAAT CAACAAGCTA TGAGCCAGGT CAGGCTCCAT ATTCCGTTGA AGAATTAGCA 
GATGATGTGG TTCGCGTCAT TGATGGTTAT GGTCTGGAAG CTGCTCATTT AGTCGGCATG 
TCTTTGGGGG GATTTCTTTC CCAGCTTGTA GCTCTCAAGT ATCCGAAACG TGTGAAGAGC 
TTGACGCTGA TTGCTTCAGA ACGGCTTGCA GATGCAGATC CGGATATGCC CGCTTTTGAT 
CCTGCCATCA TTGAGTATCA CCAACGGGCG GAATCGCTGG ATTGGTCTGA TAGAGATGCT 
GTCGTCGCGT ATCAGGTCGG AGCGTGGCGA ATCAACTCAG GTACTGCGCA TGCTTTTGAC 
GCTGAGAAGA TACAAAACAT CGCTGAGTTA AATTTTGATC GCACTCCGAA TATCCTGACA 
ACATTCAACC ACACTACTTT AGGTGGTGGC GAGAGATGGC TCGGGAGATT AAATGAGATA 
GCTGTACCAA CTTTGATCAT TCACGGCACG GAGGATCCTG TACTTCCTTA TGTGCATGGG 
TTGGCACTGA AAGATGCGAT TCGTGGTTCA AAAATGCTGA CACTCGAAGG CACGGGACAT 
GAGTTGCATC ATGAAGACTG GCCGAGGATT ATCCAGGCGA TTAAGGGGCA AACGTCATAG

Protein sequence

MRSRNWSRTL TERSGGNGAV AVFMACYDCF FVQSMPRASK QQARYAVGRC LMLWSSNDVT 
QQGSRPKTKL YVELEGNLSM KEKVVVDKAI SLYTESFGDP AHEPIILIMG AMSSAVWWPD 
EFCSQLAKMG RYVIRYDHRD TGKSTSYEPG QAPYSVEELA DDVVRVIDGY GLEAAHLVGM 
SLGGFLSQLV ALKYPKRVKS LTLIASERLA DADPDMPAFD PAIIEYHQRA ESLDWSDRDA 
VVAYQVGAWR INSGTAHAFD AEKIQNIAEL NFDRTPNILT TFNHTTLGGG ERWLGRLNEI 
AVPTLIIHGT EDPVLPYVHG LALKDAIRGS KMLTLEGTGH ELHHEDWPRI IQAIKGQTS