Gene P9303_19231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_19231
Symbol
ID	4776867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	1691301
End bp	1692407
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	59%
IMG OID	640087433
Product	putative diaminohydroxyphosphoribosylaminopyrimidine deaminase and 5-amino-6-(5-phosphoribosylamino)uracil reductase
Protein accession	YP_001017930
Protein GI	124023623
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0117] Pyrimidine deaminase [COG1985] Pyrimidine reductase, riboflavin biosynthesis
TIGRFAM ID	[TIGR00227] riboflavin-specific deaminase C-terminal domain [TIGR00326] riboflavin biosynthesis protein RibD

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.533116
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTCA ACCCCTCTGC AAGTGCTGTT TGGCTGCCAT GGATGCGGCG GGCGTTGCAG 
TTGGCTGCGC TCGCAGATGG TCGCACCAGT CCCAACCCTC TTGTTGGGGC CGTTGTTCTC 
GACAAGGCTG GCAAGCTTGT CGGAGAGGGT TTCCATGCAT GTGCTGGTGA GCCCCATGCT 
GAGGTAGGCG CTCTCGCACA AGCTGGTGAA CAGGCCAGCG GTGGAACCCT GGTGGTCACC 
CTGGAACCCT GTTGCCATCA AGGCCGCACG CCTCCCTGCA CGCAGGCCGT CATCGCTGCC 
GGACTTCGCC GAGTTGTGGT GGCAATGCAG GACCCCGACC CACGCGTTGC TGGGGCCGGC 
ATCACTCGTT TGCGCGATGC CGGCCTCGAG GTGATCACTG CTGTGTTGGA GCCGGAAGCC 
GCACATCAGA ACCGGGCTTT TGTGCATCGT GTTTCTACTG GGCGCCCCTG GGGGATTCTC 
AAATGGGCGA TGAGCCTCGA TGGACGCACG GCTCTGCCCA ATGGCGCCAG TCAGTGGATC 
AGTGGTGGTG AAGCGCGTAG CTGGGTGCAT CGCTTACGTG GCCAATGTGA TGCTGTGATC 
GTTGGCGGCG GCACTGTGCG TGCGGACGAT CCGTTGCTGA CCAGTCGTGG GCACTCTGAC 
CCCGAACCAA AGCGGGTGGT GCTGAGTCGC AGCCTTGATT TGCCTCAACA AGCTCAGCTT 
TGGGATATTG CAGTGGCTCA CACCCTCGTT GCTCATGGCC TAGAGCCTGG CCATGAACAG 
TTGGCTCATT TGCCTGAGGG GCCTGAGCTA CTTGCTTTGC CTGCCTCTGA ACCGCTTGAG 
TTGCTGCAGG CCTTAGCTCA ACAAGACTGC AATCGTGTGT TGTGGGAATG CGGGCCAGCT 
TTAGCAGCCG CAGCATTGCA GCAAGGCTGT GTTCAAGAAT TGGCGGTGGT GGTAGCTCCC 
AAGCTGTTGG GTGGCTTGCC GGCCAGAACA CCATTTGATG ATCTTGGCTT CACAAGCATG 
AAAGAGGTTG TTGGGCTCGC GTCTGGCTCA TTGCAGCAGT TGGGGGCTGA CTGGCTCTTG 
CAATATGAGC TTTCTAAGCA TTGCTGA

Protein sequence

MNVNPSASAV WLPWMRRALQ LAALADGRTS PNPLVGAVVL DKAGKLVGEG FHACAGEPHA 
EVGALAQAGE QASGGTLVVT LEPCCHQGRT PPCTQAVIAA GLRRVVVAMQ DPDPRVAGAG 
ITRLRDAGLE VITAVLEPEA AHQNRAFVHR VSTGRPWGIL KWAMSLDGRT ALPNGASQWI 
SGGEARSWVH RLRGQCDAVI VGGGTVRADD PLLTSRGHSD PEPKRVVLSR SLDLPQQAQL 
WDIAVAHTLV AHGLEPGHEQ LAHLPEGPEL LALPASEPLE LLQALAQQDC NRVLWECGPA 
LAAAALQQGC VQELAVVVAP KLLGGLPART PFDDLGFTSM KEVVGLASGS LQQLGADWLL 
QYELSKHC