Gene Dshi_0659 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_0659
Symbol	hemN2
ID	5711495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	662948
End bp	664309
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	67%
IMG OID	641266568
Product	coproporphyrinogen III oxidase
Protein accession	YP_001532006
Protein GI	159043212
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID	[TIGR00538] oxygen-independent coproporphyrinogen III oxidase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACCCA AAACGCAACT TGCGCGCTAC GGGCTTTTTG ACACTCGCGT TCCACGGTAC 
ACGAGCTATC CCACGGCGAC CCATTTCTCG CAGGCCACCC GGCCAAGGGA TTTCACGGCC 
TGGATCCAGG CGATCCCCCC GGGGAGCGAG ATTTCCCTCT ACGCGCATGT GCCGTTTTGT 
CGCCGCCTGT GCTGGTTCTG CGCCTGCCGC ACCCAAGGCA CCCAGAGCGA CGCGCCGGTG 
CGCGCCTATG TCGATACCCT GCTGGCTGAA ATCGCCCTGC TGCGCGCGGC GCTGCCCGAA 
GGTGTCCGCC TGTCGCGCAT CCATTGGGGG GGCGGCACAC CGACCCTGCT CGCGCCGGAC 
CTGGTGACGC GGCTGGCCGA GGCGATGTTC GCCCTGGCGC CCACCACCGA CCGGGCGGAA 
TTCTCGGTCG AGATCGACCC GAACGAGATC GACGCCGCCC GCCTCGACGC GCTGGCCGCC 
GCGGGCATGA ACCGCGCCTC GATCGGGGTG CAGGATTTCG ACCCGGACAT CCAGAAGGCG 
ATCGGACGCG AACAGCGATT CGAAGTGACC GAGGCGGTGG TGATGGACCT GCGCGACCGC 
GGCATCCGAA GCCTGAACAC CGACATCCTT TATGGCCTGC CCTTCCAGAC ACCGGTGAAG 
ATCACCGAGT CGGTACAGAA GCTGCTGTCG CTGCAACCGG ACCGGGTCGC CCTCTATGGC 
TACGCCCATG TGCCCTGGAT GGCCCGGCGC CAGAACCTGA TCCCGAACGA GGCGCTGCCC 
ACCCCGGAGG CCCGGCTCGA CCTGTTCGAA ACCGCCCGCC GCCTGTTCCG CTGGGACAAC 
TACGCCGAGA TCGGTATCGA CCATTTCGCG CACCAGGGAG ACGGGCTCGC CGTGGCCGCC 
GCCGAACGGC GCCTGCATCG GAATTTCCAG GGCTACACGG ACGATTCCGC AACCGTTCTG 
ATCGGCCTCG GCGCCTCGGC GATCTCGCGC TTCCCGCAAG GCTACGCCCA GAACGCCAGC 
GGCACCGCCC AGTACCAGAA GGCCATCCGC GCAGGCGGCT TCGCCACGGT GCGGGGCCAC 
GACTTTGCCG GGGACGATGC GATGCGGGCG CGAATGATCG AGATGATCAT GTGCGATTTC 
GCCGTGGATG GCCGGGAACT GGTCCGCGTG TTCAAGGTGC CCGAGGCCCG GATCACCGCC 
CTGTTCCGCG CCGCACAAGA GCAATTCGGC GGTATGGTCG AGCTCGACAG CGGGGCACTC 
AGCTTCCGTA TCCCCCCCGA TGCACGCCCC CTGACCCGGA TGATTGCAAG GGCCTTCGAC 
CGCTACGAGG CCCCGGCAGG CAGCCACTCG GTCGCCACCT GA

Protein sequence

MTPKTQLARY GLFDTRVPRY TSYPTATHFS QATRPRDFTA WIQAIPPGSE ISLYAHVPFC 
RRLCWFCACR TQGTQSDAPV RAYVDTLLAE IALLRAALPE GVRLSRIHWG GGTPTLLAPD 
LVTRLAEAMF ALAPTTDRAE FSVEIDPNEI DAARLDALAA AGMNRASIGV QDFDPDIQKA 
IGREQRFEVT EAVVMDLRDR GIRSLNTDIL YGLPFQTPVK ITESVQKLLS LQPDRVALYG 
YAHVPWMARR QNLIPNEALP TPEARLDLFE TARRLFRWDN YAEIGIDHFA HQGDGLAVAA 
AERRLHRNFQ GYTDDSATVL IGLGASAISR FPQGYAQNAS GTAQYQKAIR AGGFATVRGH 
DFAGDDAMRA RMIEMIMCDF AVDGRELVRV FKVPEARITA LFRAAQEQFG GMVELDSGAL 
SFRIPPDARP LTRMIARAFD RYEAPAGSHS VAT