Gene A9601_15101 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_15101
Symbol	hemN
ID	4718234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1293792
End bp	1295015
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	32%
IMG OID	640079234
Product	putative oxygen-independent coproporphyrinogen III oxidase
Protein accession	YP_001009900
Protein GI	123969042
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID	[TIGR00539] putative oxygen-independent coproporphyrinogen III oxidase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.574259
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAGT TTCCAAGAAG TGCTTATGTG CACATTCCTT TTTGCCACAG AAGATGTTTT 
TATTGTGATT TTGCAGTTAT TCCATTAGGA AACAAAGTTG AAACTTTAAA AGGTTATGGA 
AGCAAAACTG TTCAAGAGTA TTTGCAATTT TTATTTAAAG AAATATTGTC AATTAAACAT 
AAATCACCTC TATCGACAAT TTATATAGGA GGTGGTACAC CATCAATTTT AGATCCCAGC 
CAAATCAAAG AATTAATTGA TCTTTTTAAA GAAAATTATG GCATTGACTA TGGTGCTGAA 
ATCACTATGG AGATTGATCC AGCTAGTTTT ACTCAAGATG ATCTTTTTGG ATTCATAAAT 
GCTGGGATAA ATAGATTTAG TCTCGGAGTA CAAAGTTTTA ATAATCAGGT ACTTCAAAAG 
TCGGGAAGGC GTCATTTGAA AGAAGATGCA GAAAAATCTT GTTTCTGGTT GAAGAGAGAA 
TATGATTCTG GGTTAATAAA AAGCTGGAGT TTAGATTTAA TACAAAACTT GCCACTTAGT 
GGATTTAAAG AATGGCAAGA TGACTTAAAA AAAGCAATAA CATTTTCACC GCCGCATCTA 
TCTATTTACG ATTTAAATAT TGAAAATGGC ACTGTTTTTA AGAAATTAGT TAATTTAGGC 
AAATTAAAAC TCCCAAGTGA TGAAGAAGCT GTTAGAAATA GTGAATCAAC ACATTTAATT 
TTAAAAAACT TAGGGTATTC AAGATATGAA ATCTCAAACT ATTGCCTTCC GGGACATCAA 
TCGAGACACA ATAGAGTTTA TTGGAGTGGT TTAGGCTGGT GGGGTTTTGG TCAAGGCTCC 
ACTAGTTCAC CTTGGGGGGA AAAATTAACT AGACCAAGAG TTAGTAAAGA ATATAAAGAA 
TGGGTAATTA GACAATACGA ATTTAATTTA GATTCATCCT TAACTAATAA GGATTTTGTC 
TACAAAGAAC TTGATGAGAA AATAATGTTG GGATTAAGAC TCAAAGAGGG TTTAGATATC 
AAAAAAGTGT TTCAAGAACA AAACTGGGAG AACAAAAAAT TTGAAAGCAA CTTTAGTAAA 
TTGCTCAAAG AATGGGAAAG GTTTCTTGAA AGTGGACTTT TAGTAAGAAA GGGTTATAGA 
TTCTTTTTAA GTGAGCCTAA TGGCATGGAA CTAAGCAATC AAGTTCTTGT TTCTATGTTT 
AAGTGGTGGG ATGAGATTAA TTAA

Protein sequence

MNKFPRSAYV HIPFCHRRCF YCDFAVIPLG NKVETLKGYG SKTVQEYLQF LFKEILSIKH 
KSPLSTIYIG GGTPSILDPS QIKELIDLFK ENYGIDYGAE ITMEIDPASF TQDDLFGFIN 
AGINRFSLGV QSFNNQVLQK SGRRHLKEDA EKSCFWLKRE YDSGLIKSWS LDLIQNLPLS 
GFKEWQDDLK KAITFSPPHL SIYDLNIENG TVFKKLVNLG KLKLPSDEEA VRNSESTHLI 
LKNLGYSRYE ISNYCLPGHQ SRHNRVYWSG LGWWGFGQGS TSSPWGEKLT RPRVSKEYKE 
WVIRQYEFNL DSSLTNKDFV YKELDEKIML GLRLKEGLDI KKVFQEQNWE NKKFESNFSK 
LLKEWERFLE SGLLVRKGYR FFLSEPNGME LSNQVLVSMF KWWDEIN