Gene NATL1_02071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_02071
Symbol	plsX
ID	4780601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	193062
End bp	194387
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	39%
IMG OID	640083472
Product	putative glycerol-3-phosphate acyltransferase PlsX
Protein accession	YP_001014036
Protein GI	124024920
COG category	[I] Lipid transport and metabolism
COG ID	[COG0416] Fatty acid/phospholipid biosynthesis enzyme
TIGRFAM ID	[TIGR00182] fatty acid/phospholipid synthesis protein PlsX

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.564797
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAAAAA ATCACCTAAA TAATAAAACT AATCGCTCTA AAGCAATTAG AAGATTGGTC 
ATTTGGTATC GCCGAAACTC AGCTGTAACA AGTCTTGTTG ACACTGCAAC AAGCTCAGCC 
ACAGCAGCTA GTAATGTCGC AGGAACAGTT GTTTCTAACG CTGGTTCCGT TGTTACTAAT 
GCTGGATCAA TTGCTAGAAG TACTTTAGAG CCATTTGTGT TTGATCCCCT TAGAAGACTC 
CAAGGTGGAG AAAGTACGGG TGAAAAAAAT ACAATTGAAG ATTCTGACAG AATTTGGGTC 
GCTGTCGATG GAATGGGAGG AGATTATGCA CCTGGAGCAA TTCTTGATGG GTGTTTGAAA 
TCTTTGTCTC TACTTCCATT GAAAATTAAA TTTGTAGGTG AAGTTGAGAA AGTAGAAAAA 
GCAGCGATTG AATTTGGCTT AAAAGAATCT CTAGACAAAG CTATGGAAGA TGGAAAATTT 
CAATTAATTT CTAGTGGTCT TTCAGTTGGC ATGGATGAAG AAGCCACTGC AGTGCGTAAA 
AAAAAGGATG CGAGCATAAA TATTGCAATG AAATTGGTTA GAGAAGGAAA AGCTATGGGT 
GTCTATTCAG CTGGGAATTC TGGAGCAATG ATGGCCTCAG CCATTTTTAA ATTGGGACGT 
TTAAAAGGGA TTGATCGTCC AGCAATTGGA GCATTATTCC CAACTAAAGA CCCTGGGCAA 
CCTGTATTGG TTTTAGATGT TGGAGCGAAT ATGGATTGCA AACCAACCTA TTTGCATCAA 
TTTGCCCTCC TTGGAAACAT CTACAGTCGA GATGTTTTGC AGGTAGACAA GCCAAGAATA 
GGATTATTGA ATATTGGTGA AGAATCTTGT AAGGGTAATG ATCTTTCTCT AGCAACTTAC 
AAACTTTTAA ACGAGGAAGA ACGTTTTTGC TTTTCTGGCA ATTGTGAAGG GCGAGATGTA 
TTATCAGGCG ATTTCGATGT TGTGGTTTGT GATGGATTTA CAGGAAACGT TTTGCTTAAA 
TTTTTAGAAT CAGTAGGAAG CGTTCTTTTG GGAGTTTTGA GAGCTGAGTT GCCTAGAGGA 
AGAAGAGGCA AAGTTGGTTC TGCTTTTTTA AGAAATAATT TAAAACGAAT AAAGAAACGC 
TTAGATCATG CAGAACATGG TGGTGCTTTA CTTCTAGGAA TAAATGGAAT TTGTGTGATT 
GGTCACGGAG GAAGTAAAGC TCTATCTGTT TTAAGTGCTT TAAGAGTTAT GCATTCAGCT 
GCAAGCCACG GAGTAATGGA TGATTTAGCG GATTTAAATA AACCAGATGT CTTAAGGTCT 
GATTAG

Protein sequence

MEKNHLNNKT NRSKAIRRLV IWYRRNSAVT SLVDTATSSA TAASNVAGTV VSNAGSVVTN 
AGSIARSTLE PFVFDPLRRL QGGESTGEKN TIEDSDRIWV AVDGMGGDYA PGAILDGCLK 
SLSLLPLKIK FVGEVEKVEK AAIEFGLKES LDKAMEDGKF QLISSGLSVG MDEEATAVRK 
KKDASINIAM KLVREGKAMG VYSAGNSGAM MASAIFKLGR LKGIDRPAIG ALFPTKDPGQ 
PVLVLDVGAN MDCKPTYLHQ FALLGNIYSR DVLQVDKPRI GLLNIGEESC KGNDLSLATY 
KLLNEEERFC FSGNCEGRDV LSGDFDVVVC DGFTGNVLLK FLESVGSVLL GVLRAELPRG 
RRGKVGSAFL RNNLKRIKKR LDHAEHGGAL LLGINGICVI GHGGSKALSV LSALRVMHSA 
ASHGVMDDLA DLNKPDVLRS D