Gene NATL1_16841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_16841
Symbol
ID	4780030
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1372716
End bp	1373768
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	40%
IMG OID	640084968
Product	putative diaminohydroxyphosphoribosylaminopyrimidine deaminase and 5-amino-6-(5-phosphoribosylamino)uracil reductase
Protein accession	YP_001015504
Protein GI	124026389
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0117] Pyrimidine deaminase [COG1985] Pyrimidine reductase, riboflavin biosynthesis
TIGRFAM ID	[TIGR00227] riboflavin-specific deaminase C-terminal domain [TIGR00326] riboflavin biosynthesis protein RibD

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACGCT CAATCCAACT GGCTTTATTA GCAGAAGGTA GGACAAGCCC AAACCCCCTA 
GTAGGATCTG TTGTTTTGGA TTCAAATGGA AGACTTGTTG GAGAGGGATT TCATACAGGC 
GCAGGGAATC CTCATGCTGA AATAGAAGCA CTTGCTCAGG CGGGAAAGAA GTCGCTGGAT 
GGAACAATTG TTGTAACTTT AGAACCCTGT TGTCATCAAG GCTTAACACC TCCCTGCACA 
GAAGCAATAA TCAAAGCAGG TCTAAAGAAA GTTGTTGTTG GGATGGTCGA TCCTGATCCA 
AGAGTTTCAG GTAATGGAAT CTCAAGATTG AAAGACTCTG GACTTGAAGT AATCGAGGGT 
GTTTTGAGTC AAGAATGTGA ATCAATAAAT CGCGAATTTA GTTTTCGAGT TCGTCATGGA 
CGTCCTTGGG GAATTCTTAA ATGGGCAATG AGCTTAGATG GGAAAATTGG CTTGCCAAAT 
GGTTGTAGCA AGTGGATTAC AGATATTCCT GCAAGGGATT CGGTTCATAG AATTCGATCT 
AAGTGCGATG CAGTAATAGT TGGAGGAGGA ACAGTTCGGG CCGATAATCC ACTTTTAACT 
TCTAGGGGGA AATCAGATTT TGAACCGTTA AGGGTTGTTT TTTCAAGAAC TTTGAACTTG 
CCTCAATCTG CAAAACTTTG GGATACAAAA ATCGCTAGAA CATTAGTTGC TTATGGACCA 
GAGGGTGATG AATCTTTCTT TTCTGATTTG CTAGATGGTC CAGAAAAATT GAGATTAAAT 
TCGGATAATC CATCCGAATT GCTTTCCTCA CTTGCGAAAA AAGGCTGCAA TAAAATTCTT 
TGGGAATGCG GTCCTCAACT TGCTACAAGT GCAATCGAAG CAAATTGTGT TCAGGAATTA 
GTAGTTTTTG TAGCACCAAA ACTCTTAGGA GGGATGTCTT CGATGAGTCC TTTGAACAAC 
TTTGGATTTG AATCAATAAG TTCTTCCTAT AAATTGCAAC ATTCTTTTTT AGATCGAAAA 
GGAGAAGACA TCTGTTGGAG ACTGATTTTT TAG

Protein sequence

MRRSIQLALL AEGRTSPNPL VGSVVLDSNG RLVGEGFHTG AGNPHAEIEA LAQAGKKSLD 
GTIVVTLEPC CHQGLTPPCT EAIIKAGLKK VVVGMVDPDP RVSGNGISRL KDSGLEVIEG 
VLSQECESIN REFSFRVRHG RPWGILKWAM SLDGKIGLPN GCSKWITDIP ARDSVHRIRS 
KCDAVIVGGG TVRADNPLLT SRGKSDFEPL RVVFSRTLNL PQSAKLWDTK IARTLVAYGP 
EGDESFFSDL LDGPEKLRLN SDNPSELLSS LAKKGCNKIL WECGPQLATS AIEANCVQEL 
VVFVAPKLLG GMSSMSPLNN FGFESISSSY KLQHSFLDRK GEDICWRLIF