Gene EcSMS35_2011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2011
Symbol
ID	6143108
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2031344
End bp	2032417
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	49%
IMG OID	641616887
Product	putative acyltransferase
Protein accession	YP_001744063
Protein GI	170683490
COG category	[S] Function unknown
COG ID	[COG4763] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.020428
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACAAA AAGAGCTATG GATTAACCAG ATCAAAGGGT TATGTATTTG TCTGGTAGTG 
ATTTATCACT CGGTGATTAC CTTTTATCCG CATCTGAGCA CTTTTCAGCA TCCGTTATCG 
GAAGTCCTGA GCAAATGCTG GATCTATTTC AATCTTTACC TTGCCCCCTT TCGTATGCCG 
GTTTTTTTCT TTATCTCTGG CTATTTAATT CGCCGCTATA TCGACAGCGT GCCATGGGGA 
AATTGTCTTG ATAAACGCAT CTGGAGCATC TTCTGGGTGC TGGCACTTTG GGGCGTAGTG 
CAGTGGCTGG CGATAAGTGC ACTAAATCAG TGGCTGGCAC CTGAGCGCAA TTTAAGTAAT 
GCCTCCAATG CCGCTTATGC CGATTCTACC GGTGAGTTCC TGCACGGGAT GATCACCGCC 
AGCACCAGCT TGTGGTATCT GTATGCTTTA ATTGTCTATT TCGTGATATG TAAAATTTTT 
AACCGCCTGG CGCTGCCACT ATTCGCCTTG TTTGTACTGC TGAGTGTGGC GGTTAATTTC 
GTTCCCACGC CGTGGTGGGG AATGAACAGT GTGATCCGCA ATTTGCCTTA TTACAGCCTT 
GGCGCATGGT TTGGCGCAAC AATAATGACC TGTGTTAAAG AGGTGCCGTT GCGCCGCCAT 
CTGCTGATGG CTTCTTTGCT GACCGTTCTG GCGGTCGGTG CCTGGTTGTT TACTATCTCG 
CTGCTGTTGT CGCTGGTATC GATTGTGGTA ATCATGAAGC TGTTTTATCA GTACGAGCAG 
CGTTTCGGTA TGCGTTCCTC CAGCCTGCTG AATGTGATTG GTTCCAACAC CATTGCTATC 
TACACCACCC ATCGCATTCT GGTTGAAATA TTCAGCTTAA CTCTGCTTGC GCAAATGAAC 
GCAGCACGCT GGTCGCCGCA AGTCGAACTG ACACTCCTGC TGGTTTACCC CTTTGTTAGT 
TTGTTCATCT GTACTGTTGC GGGCTTGCTG GTAAGAAAAC TTTCACAGCG CGCATTCAGC 
GATCTGTTGT TCTCCCCGCC TTCTCTGCCC GCGGCCGTCA GTTACTCCCG CTAA

Protein sequence

MKQKELWINQ IKGLCICLVV IYHSVITFYP HLSTFQHPLS EVLSKCWIYF NLYLAPFRMP 
VFFFISGYLI RRYIDSVPWG NCLDKRIWSI FWVLALWGVV QWLAISALNQ WLAPERNLSN 
ASNAAYADST GEFLHGMITA STSLWYLYAL IVYFVICKIF NRLALPLFAL FVLLSVAVNF 
VPTPWWGMNS VIRNLPYYSL GAWFGATIMT CVKEVPLRRH LLMASLLTVL AVGAWLFTIS 
LLLSLVSIVV IMKLFYQYEQ RFGMRSSSLL NVIGSNTIAI YTTHRILVEI FSLTLLAQMN 
AARWSPQVEL TLLLVYPFVS LFICTVAGLL VRKLSQRAFS DLLFSPPSLP AAVSYSR