Gene Dshi_2749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_2749
Symbol
ID	5713648
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	2910830
End bp	2912143
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	69%
IMG OID	641268674
Product	putative cytochrome c peroxidase
Protein accession	YP_001534083
Protein GI	159045289
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.0452779
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCGCG CGCTGCATAT CCTCGCCTTT CTTTGTGCCG GGCCCGCGGT GGCGGAGGTG 
CCGCCGCCGC TGTCGCCTGC GGATTTCCAC GCGTTCGACC CGGATCAGGC CCGGATCGGT 
CAGCTTCTGT TTTACGACAA GATCCTGTCG GGCAACAGGA ACATCGCTTG CGGGACCTGT 
CACCACCATG ACCACGCGGG CGGCGACGGG CTGAGCCTGG GGATCGGCGA GGGGGGCGTG 
GGTGTCGGGC CGGAGCGGAC GGCAGGAACC GGCGCGGATC GTATCCGCAA GCGGATCCCG 
CGCAACGCCC CCGCCCTGTG GAACCTCGGG CACAAGGACA TCCGGGTGCT GTTCCATGAC 
GGGCGGCTTG AGGTGTCGGA GCTTTATGGA AATGGGTTCA ACTCGCCTGC GCAGGAATGG 
CTGCCCACGG GGTTCGACCA TATCCTTGCG GCGCAGGCGG TGCTGCCGTT GGTGGCGCAG 
TTCGAGATGG CGGGAAATCC CAAGGAGAAC GAGATCGCCG GTGCGGTGCA TGACCGGATC 
GACGCGGCCT GGCCGATCCT GGCCAAGCGG GTGCGGACGA TCCCGGAATA CGGCGCGATG 
TTCGTGGACG CGTTTGACCA TGTCGAGACG CCCGAGCAGG TCACGATTGT CGAGATCGCT 
AATGCGCTGG CGGCGTTCAT CGGCACGGAA TGGGCCAATT ACGACAGCCC GTTCGACGCC 
TACCTGGCCG GGGATGCGGG CGCGCTCGAC GCAGCGGCGG CGCGAGGGAT GGCGTTGTTC 
TACGGGGCGG CCGGGTGCGC GACGTGTCAT TCCGGGCCCT TGCTGAGCGA CCAGAAGTTT 
CATGCGCTGG GCCTGCCGGC CTTCGGCCCC GGGCGCACGC GGCAATGGGA TCCGATCCCG 
CGTGACATGG GCCGGGTGGG GGAGAGCAAC CGGCTGGAGG ATGCCTACCG GTTCCGCACG 
CCGCCCCTGC GCAATGTCGC GCTGACCGGG CCCTACGGCC ATAACGGGGC CTACCGGACG 
CTGGAGGGGA TCGTGCGCCA CCATCTCGAC CCGGGTGGGA TGGGGGCGGC CTGGAGACCG 
CAGGATGCGC AGCTGCCCGA GGCACCCTGG CTGGCCGAGA TTGATTTCGT GATCCGGTCC 
GACCGGGCGG AGATGGCGCG GCAAGCGGCG GCGCGGGATA TCGCGCCCGT CGCGCTGGAC 
GATGCCCAGG TGGCGGATCT TGTGGCCTTC CTGCACGCGC TGACCGGGCG GACGGCGGAG 
GCGCGGCCCC TCGGGCGGCC GGAGACGGTG CCTTCGGGCC TGCCGGTTGA CTGA

Protein sequence

MKRALHILAF LCAGPAVAEV PPPLSPADFH AFDPDQARIG QLLFYDKILS GNRNIACGTC 
HHHDHAGGDG LSLGIGEGGV GVGPERTAGT GADRIRKRIP RNAPALWNLG HKDIRVLFHD 
GRLEVSELYG NGFNSPAQEW LPTGFDHILA AQAVLPLVAQ FEMAGNPKEN EIAGAVHDRI 
DAAWPILAKR VRTIPEYGAM FVDAFDHVET PEQVTIVEIA NALAAFIGTE WANYDSPFDA 
YLAGDAGALD AAAARGMALF YGAAGCATCH SGPLLSDQKF HALGLPAFGP GRTRQWDPIP 
RDMGRVGESN RLEDAYRFRT PPLRNVALTG PYGHNGAYRT LEGIVRHHLD PGGMGAAWRP 
QDAQLPEAPW LAEIDFVIRS DRAEMARQAA ARDIAPVALD DAQVADLVAF LHALTGRTAE 
ARPLGRPETV PSGLPVD