Gene ECH74115_1469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1469
Symbol	plsX
ID	6969004
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1450301
End bp	1451371
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	52%
IMG OID	643385440
Product	putative glycerol-3-phosphate acyltransferase PlsX
Protein accession	YP_002269934
Protein GI	209397257
COG category	[I] Lipid transport and metabolism
COG ID	[COG0416] Fatty acid/phospholipid biosynthesis enzyme
TIGRFAM ID	[TIGR00182] fatty acid/phospholipid synthesis protein PlsX

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000150327
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00000000000717792
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGACACGTC TAACCCTGGC GTTAGATGTC ATGGGAGGGG ATTTTGGCCC TTCCGTGACA 
GTGCCTGCAG CATTGCAGGC ACTGAATTCT AATTCGCAAC TCACTCTTCT TTTAGTCGGC 
AATCCCGACG CCATCACGCC ATTACTTGCT AAAGCTGACT TTGAACAACG TTCGCGTCTG 
CAGATTATTC CTGCGCAGTC AGTTATCGCC AGTGATGCCC GGCCTTCGCA AGCTATCCGC 
GCCAGTCGTG GGAGTTCAAT GCGCGTGGCC CTGGAGCTGG TGAAAGAAGG TCGAGCGCAA 
GCCTGTGTCA GTGCCGGTAA TACCGGGGCA CTGATGGGGC TGGCAAAATT ATTACTCAAG 
CCCCTGGAGG GGATTGAGCG TCCGGCGCTG GTGACGGTAT TACCACATCA GCAAAAGGGC 
AAAACGGTGG TCCTTGACTT AGGGGCCAAC GTCGATTGTG ACAGCACAAT GTTGGTGCAA 
TTTGCCATTA TGGGCTCAGT CCTGGCTGAA GAGGTGGTGG AAATTCCCAA TCCTCGCGTG 
GCGTTGCTCA ATATTGGTGA AGAAGAAGTA AAGGGTCTCG ATAGTATTCG GGATGCCTCA 
GCGGTGCTTA AAACAATCCC TTCTATCAAT TATATCGGCT ATCTTGAAGC CAATGAGTTG 
TTAACTGGCA AGACAGATGT GCTGGTTTGT GACGGCTTTA CAGGAAATGT CACATTAAAG 
ACGATGGAAG GTGTTGTCAG GATGTTCCTT TCTCTGCTGA AATCTCAGGG TGAAGGGAAA 
AAACGGTCGT GGTGGCTACT GTTATTAAAG CGTTGGCTAC AAAAGAGCCT GACGAGGCGA 
TTCAGTCACC TCAACCCCGA CCAGTATAAC GGCGCCTGTC TGTTAGGATT GCGCGGCACG 
GTGATAAAAA GTCATGGTGC AGCCAATCAG CGAGCTTTTG CGGTCGCGAT TGAACAGGCA 
GTGCAGGCGG TGCAGCGACA AGTTCCTCAG CGAATTGCCG CTCGCCTGGA ATCTGTATAC 
CCAGCTGGTT TTGAGCTGCT GGACGGTGGC AAAAGCGGAA CTCTGCGGTA G

Protein sequence

MTRLTLALDV MGGDFGPSVT VPAALQALNS NSQLTLLLVG NPDAITPLLA KADFEQRSRL 
QIIPAQSVIA SDARPSQAIR ASRGSSMRVA LELVKEGRAQ ACVSAGNTGA LMGLAKLLLK 
PLEGIERPAL VTVLPHQQKG KTVVLDLGAN VDCDSTMLVQ FAIMGSVLAE EVVEIPNPRV 
ALLNIGEEEV KGLDSIRDAS AVLKTIPSIN YIGYLEANEL LTGKTDVLVC DGFTGNVTLK 
TMEGVVRMFL SLLKSQGEGK KRSWWLLLLK RWLQKSLTRR FSHLNPDQYN GACLLGLRGT 
VIKSHGAANQ RAFAVAIEQA VQAVQRQVPQ RIAARLESVY PAGFELLDGG KSGTLR