Gene P9303_22671 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_22671
Symbol	hemF
ID	4777397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	2001390
End bp	2002463
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	53%
IMG OID	640087785
Product	coproporphyrinogen III oxidase
Protein accession	YP_001018267
Protein GI	124023960
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0408] Coproporphyrinogen III oxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.364873
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTCCTA CTTTGATTGG CAAGGTTATG GGTGCTTCTG AGAATGTTGG CCAAGGTCCT 
CCTCCTCACT CGCGCGAACG TGTACGTGAA TTGGTACTCG GATTGCAAGA TGAGATCAGT 
AATGAACTGG AGAGTCTTGA TGGTGGCCAA TCTTTTAGAA CTGATAGTTG GGAGCGGCCT 
GAAGGGGGTG GTGGGCGATC CAAGGTGATG CGTGAGGGCC GAGTTTTTGA ACAGGGCGGC 
GTTAATTTCT CTGAGGTGCA CGGCGAGGAG TTGCCTCCGT CGATTCTGAA TCAGCGACCT 
GAGGCAAAGG GGCATCCCTG GTTCGCTACC GGCACTTCGA TGGTGCTACA CCCGCGCAAT 
CCCTATGTGC CTACGATCCA CCTTAATTAC CGCTATTTCG AGGCGGGGCC GGTGTGGTGG 
TTTGGCGGTG GCGCTGACCT CACGCCGTTT TATCCCTACC TGGAAGATGC CCGCCATTTT 
CATCGCGTTC ACAAGCAGGC TTGCGATACG GTTGGACCTG AGCTCCATAA GGTCTTTAAA 
CCTTGGTGTG ACGAATATTT CTATCTGAAG CACCGTGGTG AGACCCGTGG TGTGGGTGGG 
ATTTTTTACG ACTACCAGGA TGGATCTGGA GTGCTTTACA AAGGTCAAAA CCCTGAGGGT 
CCAGCTGCAC AGGTCTCACG GGAGTTAGGG CCTCATCCGA AGAGCTGGGA ACAGTTATTT 
GAGCTGGCCA AGGCTTGTGG GAAGGCTTTC TTGCCGGCTT ATGTGCCGAT TGTGGAGAAA 
CGTCAGCAGC AGGCCTATGG CGATCGAGAA CGTCAATTCC AGTTGTATCG CCGTGGGCGA 
TATGCGGAGT TCAATCTGGT CTGGGATCGG GGCACGATTT TCGGATTGCA AACCAATGGC 
CGAACGGAGT CGATCTTGAT GTCTTTGCCA CCACTGGCTC GTTGGGAGTA TGGATATGCC 
GCACCAGCTG ATTCAAGGGA GGCTTTGCTC ACTGATTTGT TTACTCGACC TCAGAATTGG 
TTTGAGGATT CGACGTTGGA TGAGCGTTGT CGACCACACC AGGCGGTGGA TTAG

Protein sequence

MVPTLIGKVM GASENVGQGP PPHSRERVRE LVLGLQDEIS NELESLDGGQ SFRTDSWERP 
EGGGGRSKVM REGRVFEQGG VNFSEVHGEE LPPSILNQRP EAKGHPWFAT GTSMVLHPRN 
PYVPTIHLNY RYFEAGPVWW FGGGADLTPF YPYLEDARHF HRVHKQACDT VGPELHKVFK 
PWCDEYFYLK HRGETRGVGG IFYDYQDGSG VLYKGQNPEG PAAQVSRELG PHPKSWEQLF 
ELAKACGKAF LPAYVPIVEK RQQQAYGDRE RQFQLYRRGR YAEFNLVWDR GTIFGLQTNG 
RTESILMSLP PLARWEYGYA APADSREALL TDLFTRPQNW FEDSTLDERC RPHQAVD