Gene EcSMS35_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2037
Symbol	plsX
ID	6144324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2057836
End bp	2058906
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	52%
IMG OID	641616913
Product	putative glycerol-3-phosphate acyltransferase PlsX
Protein accession	YP_001744089
Protein GI	170679989
COG category	[I] Lipid transport and metabolism
COG ID	[COG0416] Fatty acid/phospholipid biosynthesis enzyme
TIGRFAM ID	[TIGR00182] fatty acid/phospholipid synthesis protein PlsX

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000010879
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.000000225509
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

TTGACACGTC TAACCCTGGC GTTAGATGTC ATGGGAGGGG ATTTTGGCCC TTCCGTGACA 
GTGCCTGCAG CATTGCAGGC ACTGAATTCT AATTCGCAAC TCACTCTTCT TTTAGTCGGC 
AATCCCGACG CCATCACGCC ATTACTTGCT AAAGCTGACT TTGAACAACG TTCGCGTCTG 
CAGATTATTC CTGCGCAGTC AGTTATCGCC AGTGATGCCC GGCCTTCGCA AGCTATCCGC 
GCCAGTCGTG GGAGTTCAAT GCGCGTGGCC CTGGAGCTGG TGAAAGAGGG TCGAGCGCAA 
GCCTGTGTCA GTGCCGGTAA TACCGGGGCG CTGATGGGGC TGGCAAAATT ATTACTCAAG 
CCCCTGGAGG GGATTGAGCG TCCGGCGCTG GTGACGGTAT TACCGCATCA GCAAAAGGGC 
AAAACGGTGG TCCTCGATTT AGGGGCCAAC GTCGATTGTG ACAGTACAAT GTTGGTGCAA 
TTTGCCATTA TGGGCTCAGT TCTGGCTGAA GAGGTGGTGG AAATTCCTAA TCCTCGCGTG 
GCGTTGCTCA ATATTGGTGA AGAAGAAGTA AAGGGTCTCG ACAGTATTCG GGATGCCTCA 
GCGGTGCTTA AAACAATCCC TTCTATCAAT TATATCGGCT ATCTTGAAGC CAATGAGTTG 
TTAACTGGCA AGACAGATGT GCTGGTTTGT GATGGCTTTA CAGGAAATGT CACATTAAAG 
ACGATGGAAG GTGTTGTCAG GATGTTCCTT TCTCTGCTGA AATCTCAGGG TGAAGGGAAA 
AAACGGTCGT GGTGGCTACT GTTATTAAAG CGTTGGCTAC AAAAGAGCCT GACGAGGCGA 
TTCAGTCACC TCAACCCCGA CCAGTATAAC GGCGCCTGTC TGTTAGGATT GCGCGGCACG 
GTGATAAAAA GTCATGGTGC AGCCAATCAG CGAGCTTTTG CGGTCGCGAT TGAACAGGCA 
GTGCAGGCGG TGCAGCGACA AGTTCCTCAG CGAATTGCCG CTCGCCTGGA ATCTGTATAC 
CCAGCTGGTT TTGAGCTGCT GGACGGTGGC AAAAGCGGAA CTCTGCGGTA G

Protein sequence

MTRLTLALDV MGGDFGPSVT VPAALQALNS NSQLTLLLVG NPDAITPLLA KADFEQRSRL 
QIIPAQSVIA SDARPSQAIR ASRGSSMRVA LELVKEGRAQ ACVSAGNTGA LMGLAKLLLK 
PLEGIERPAL VTVLPHQQKG KTVVLDLGAN VDCDSTMLVQ FAIMGSVLAE EVVEIPNPRV 
ALLNIGEEEV KGLDSIRDAS AVLKTIPSIN YIGYLEANEL LTGKTDVLVC DGFTGNVTLK 
TMEGVVRMFL SLLKSQGEGK KRSWWLLLLK RWLQKSLTRR FSHLNPDQYN GACLLGLRGT 
VIKSHGAANQ RAFAVAIEQA VQAVQRQVPQ RIAARLESVY PAGFELLDGG KSGTLR