Gene NATL1_03421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_03421
Symbol	lytB
ID	4780362
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	317009
End bp	318214
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	36%
IMG OID	640083609
Product	4-hydroxy-3-methylbut-2-enyl diphosphate reductase
Protein accession	YP_001014171
Protein GI	124025055
COG category	[I] Lipid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0761] Penicillin tolerance protein
TIGRFAM ID	[TIGR00216] (E)-4-hydroxy-3-methyl-but-2-enyl pyrophosphate reductase (IPP and DMAPP forming)

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.929228
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATACTC AAGCCTTTAA GCAAACTCTT CATAAATCGG ATCGTTATAA CCGAAGAGGA 
TTTGGTTCAG CAAATAAGCG AGCTCAAGCA CTTGCTGAGG CTTATCAAAG TGGTTTAATT 
GGATCTATTA GAGAAAATGG AAATCTTTTA GAGCACGGAA GATTAAAAGT TAAACTTGCA 
GAAGCTTTTG GATTTTGTTG GGGAGTAGAA AGATCAGTAG CAATGGCTTA CGAGACTAGG 
AAGCATTATC CAAATGAAAG AATATGGATC ACTAATGAAA TCATTCATAA CCCCTCTGTG 
AATGATCATT TGAGGAAAAT GAATGTTCTT TTTATTTCTG AGGAAAAAGG GGTTAAAGAT 
TTTTCAGTAG TAAAAGATGG AGATGTAGTA ATTCTTCCTG CATTTGGAGC AACGGTTCAA 
GATATGAAGC TCTTACACGA TAGAGGTTGT CATATTATTG ATACCACTTG CCCATGGGTT 
TCAAAAGTTT GGCATACAGT CGAAAAGCAT AAAAAACATA CATTCACATC AATTATTCAT 
GGCAAATATA AACACGAAGA AACTCTAGCG ACTAGTTCTT TTGCAGGGAC TTACCTAGTC 
CTATTTGACC TTGAAGAGGC GAATTATGTT TCTGATTATA TTTTAGGCAA GGGAAATAGA 
GAAGATTTCT TAAAGCGTTT TTCAAAAGCT TCTTCAGCAG GGTTCGATCC CGATAAGGAT 
TTGCAAAAAG TTGGAGTTGC TAATCAGACC ACAATGTTAA AAAGCGAAAC TGAGGAAATA 
GGACGATTGT TTGAGAAAAC AATGTTGCAA AGATTTGGAC CTGCTCAATT GAATGAACAT 
TTTCTAGCTA TTAATACCAT TTGTGATGCT ACTGAAGAAA GACAAGGAGC AATGTTTTCG 
CTAGTTGATG AACCTCTTGA TCTTATGGTT GTAATTGGTG GATTCAATTC TTCTAACACA 
ACTCATCTTC AAGAAATCGC AATCAGTAGA GGGATTCGTT CATTTCATAT TGATACTCCA 
GAGAGAATTG GAGAAGAGAC TAATACCATT ACTCATATGC CTCTAGAGGG AGGTGAATTG 
TTAACTGAGG AAAATTTTCT TCAAAACGGA AATATTAGTG TAGGTATTAC TTCGGGTGCT 
TCAACTCCCG ACCGTGTAGT TGAAGATGTT ATTCACAAGC TAATGAAAAT AGGCGAAAAT 
TTTTGA

Protein sequence

MDTQAFKQTL HKSDRYNRRG FGSANKRAQA LAEAYQSGLI GSIRENGNLL EHGRLKVKLA 
EAFGFCWGVE RSVAMAYETR KHYPNERIWI TNEIIHNPSV NDHLRKMNVL FISEEKGVKD 
FSVVKDGDVV ILPAFGATVQ DMKLLHDRGC HIIDTTCPWV SKVWHTVEKH KKHTFTSIIH 
GKYKHEETLA TSSFAGTYLV LFDLEEANYV SDYILGKGNR EDFLKRFSKA SSAGFDPDKD 
LQKVGVANQT TMLKSETEEI GRLFEKTMLQ RFGPAQLNEH FLAINTICDA TEERQGAMFS 
LVDEPLDLMV VIGGFNSSNT THLQEIAISR GIRSFHIDTP ERIGEETNTI THMPLEGGEL 
LTEENFLQNG NISVGITSGA STPDRVVEDV IHKLMKIGEN F