Gene Daro_1048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1048
Symbol
ID	3568211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	1149253
End bp	1150668
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	56%
IMG OID	637679510
Product	coproporphyrinogen III oxidase
Protein accession	YP_284274
Protein GI	71906687
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID	[TIGR00538] oxygen-independent coproporphyrinogen III oxidase

Plasmid Coverage information

Num covering plasmid clones	62
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTGCC TAATGAACTT CGCAACAGAA AACCTCGTCT TCGATCCGCA GATCATTCGC 
CGCTTCGACG TCAACGGCCC GCGCTACACG TCCTATCCAA CGGCTGATCG CTTTGTTGAG 
GCTTTCGACT CGGAGGCTGC CAAGCTGTGG CTCGGAAAGC GCAATATTGG CGGGATCAGC 
CGACCGCTCT CATTATACTT CCACATCCCT TTCTGTAACA CTATTTGCTA TTACTGCGCC 
TGTAACAAGA TCATCACCAA GGATCATGGG CGCAGCGCCA AATACCTGAA ATATCTGGCC 
AAGGAACTCG AGATTCAGGC GGCGGCACTG GAAGGCCGCG ACGGTGAGCA CGAGGTCATC 
CAGTTGCATT GGGGTGGCGG TACGCCGACC TTCCTGTCGC ACAGCGAAAT GCGCCAGTTG 
ATGGGCGAAA CCCGCAAGCA CTTCAAGTTG CTCGATGGCG GCGAATATTC GATTGAAGTC 
GACCCCCGCA AGGTGGATAC GGCCACGGTC GCTCTGCTGG GTGAGCTGGG TTTCAACCGC 
ATGAGCGTCG GCGTTCAGGA TTTCGACGAA AAGGTACAAG TTGCCGTCAA TCGCGTTCAG 
AGCGAGGAAG AAACCTACAG CGTCATCCGT GATGCGCGGG CCAACGGCTT CAAGTCAGTT 
TCTGTCGACC TGATCTACGG TCTGCCGCAT CAGACGGTGA TGGGGTTCAA CCGGACGCTG 
GAGCGCGTTC TGGCGATGGA TCCTGACCGT CTGTCGATCT ACAACTATGC GCACATGCCC 
AGCATGTTCA AGCCGCAGCG CCGGATCAAC GAAGGTGATC TGCCCTCAGC CGATACCAAG 
CTGCAGATTC TGGCGCTGGC GATCAAGAAA CTGACCGATG CGGGTTATGT CTTCATCGGC 
ATGGACCACT TTGCCAAGCC GGATGACGAA CTGGCAGTTG CCCAGCGTCA GGGCCGCCTG 
CACCGTAATT TCCAGGGCTA TTCGACTTAC GCCGATTGCG ACATGCTGTC TTTCGGCATC 
TCTTCGATCA GCAAGGTCGG GCCGACCTAT TACCAGAACG TCAAGACGGC GGACGAGTAC 
TACGATCGTC TGGATACCGA TACGCTGCCG GTTTTCCGCG GTATCGAGCT GACGGCTGAC 
GATATCCTGC GTCGTTCGAT CATCCAGGCG TTGATGTGCC ATTTCGAGTT GTCCATCGAG 
AGCATCGAAA GCGCCCATCT GATCGACTTC CACAAGTATT TCGCAGCCGA ACTGGAAGAC 
ATGAAGGAAA TGGAGCGGGC CGGTTTGCTC AAGATCGATC GCGAGTGGAT CACCGTACTG 
CCACCAGGAC GCCTGCTGGT TCGCATCATT TCCATGGTTT TTGATCGCTA TCTGCGGGCA 
GGGCGCCAGC GGGCAACCTA CTCCAAAGTC ATCTGA

Protein sequence

MACLMNFATE NLVFDPQIIR RFDVNGPRYT SYPTADRFVE AFDSEAAKLW LGKRNIGGIS 
RPLSLYFHIP FCNTICYYCA CNKIITKDHG RSAKYLKYLA KELEIQAAAL EGRDGEHEVI 
QLHWGGGTPT FLSHSEMRQL MGETRKHFKL LDGGEYSIEV DPRKVDTATV ALLGELGFNR 
MSVGVQDFDE KVQVAVNRVQ SEEETYSVIR DARANGFKSV SVDLIYGLPH QTVMGFNRTL 
ERVLAMDPDR LSIYNYAHMP SMFKPQRRIN EGDLPSADTK LQILALAIKK LTDAGYVFIG 
MDHFAKPDDE LAVAQRQGRL HRNFQGYSTY ADCDMLSFGI SSISKVGPTY YQNVKTADEY 
YDRLDTDTLP VFRGIELTAD DILRRSIIQA LMCHFELSIE SIESAHLIDF HKYFAAELED 
MKEMERAGLL KIDREWITVL PPGRLLVRII SMVFDRYLRA GRQRATYSKV I