Gene P9211_17021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_17021
Symbol	hemF
ID	5730086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	1529251
End bp	1530378
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	42%
IMG OID	641286084
Product	coproporphyrinogen III oxidase
Protein accession	YP_001551587
Protein GI	159904243
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0408] Coproporphyrinogen III oxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.18622
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.770424
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCATAA TTTGCAATCT GAATTCAATA ATCCTAAATG GGTATTCTGA TGTCCTAGCC 
TCAACTAGAA AATACAGATA TAGCCCAGTG TCATTGGAAC ACCTTTCTCA GCCTCCTGCA 
AATTCGAGAC AGAGGGCCAA AGAACTTGTA CTTTCGCTAC AAGATCAAAT ATGTAATGGC 
CTTGAAGCAG TAGATGGTGA AGGAACTTTC AAGGAAGAGA CATGGGAAAG ACCTGAAGGA 
GGCGGGGGCA GGTCAAGAGT AATGAGTGAA GGAAGAGTTC TTGAACAAGG AGGGGTCAAC 
TTCTCTGAAG TACAAGGACA GGAACTCCCC CCATCAATAA TTAATCAACG ACCTGAAGCC 
AAAGGGCATC CCTGGTTTGC AACTGGGACT TCTATGGTCC TTCATCCAAA AAATCCCTAT 
ATTCCAACTG TTCATCTCAA TTACCGTTAT TTCGAAGCTG GTCCAGTTTG GTGGTTTGGC 
GGTGGTGCAG ATCTAACACC TTACTATCCA TACTTAAGCG ATACCAAGCA TTTCCACAAA 
ACTCTCCAGC AAGCTTGTGA TTCCATAAAT CCCTTACTGC ATAAGGTTTT CAAGCCATGG 
TGTGATGAAT ATTTCTTTCT AAAGCACAGG AATGAAACAA GAGGCGTAGG TGGTATTTTC 
TTTGACTACC AAGATGGATC AGGAAATTTA TATAAGGGTC AAGACCCTAA AGGGCCCGCT 
GCAAAAATTG CAAATGAACT AGGCAAGCAT CCTATGAATT GGGAGGAACT CTTTGCATTG 
GCAAAAGCAT GCGGGAATGC TTTTCTACCT TCTTATATCC CAATCATCGA AAAGCGACAG 
AATCAATCAT TTACGGAGCG AGAAAGACAA TTTCAGCTGT ATAGACGAGG AAGATATGTT 
GAATTTAATT TGGTATGGGA TAGAGGAACA ATTTTCGGTC TTCAGACAAA CGGTAGAACG 
GAGTCAATAC TAATGTCTCT CCCTCCTTTA GCAAGATGGG AATATGGCTA CAAGGCAGAG 
AAGGGATCAA GAGAAGAACT ACTCACTAAT GTGTTTACTA AGCCTCAAGA ATGGTTTAAC 
GATAAGACTT TGGAAGAAAA ATGTCATCCG TTAGAAGCTG TGGATTAA

Protein sequence

MVIICNLNSI ILNGYSDVLA STRKYRYSPV SLEHLSQPPA NSRQRAKELV LSLQDQICNG 
LEAVDGEGTF KEETWERPEG GGGRSRVMSE GRVLEQGGVN FSEVQGQELP PSIINQRPEA 
KGHPWFATGT SMVLHPKNPY IPTVHLNYRY FEAGPVWWFG GGADLTPYYP YLSDTKHFHK 
TLQQACDSIN PLLHKVFKPW CDEYFFLKHR NETRGVGGIF FDYQDGSGNL YKGQDPKGPA 
AKIANELGKH PMNWEELFAL AKACGNAFLP SYIPIIEKRQ NQSFTERERQ FQLYRRGRYV 
EFNLVWDRGT IFGLQTNGRT ESILMSLPPL ARWEYGYKAE KGSREELLTN VFTKPQEWFN 
DKTLEEKCHP LEAVD