Gene Rsph17029_1058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1058
Symbol
ID	4896048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	1089337
End bp	1090380
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	69%
IMG OID	640111645
Product	cytochrome-c peroxidase
Protein accession	YP_001042941
Protein GI	126461827
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0622508
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.212255
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCTGA CCCTCACCGT CCTGATCGCG ACGACGGCCC TCGCCGGCGC GGCTCAGGCC 
GACGCCCTCC GGGACAAGGC TCTGGGATAT TTTGCCCCGC TGCCCTCGAC GGTTCCGGCC 
GTGAAGGACA ACCGCATCAC CCCGGAGAAG ATCGAGCTCG GCAAGGCGCT CTTCTTCGAT 
CCGCGTCTGT CGGCCTCGGG CGTCTTCTCC TGCTATTCCT GCCACAACCT CACGACGGGC 
GGCGGCGACA ACCTCGAGAC CTCGATCGGC CACGGCTGGC AGAAGGGGCC GCGGAACGCG 
CCCACCGTGC TCAATGCGGT GCTGAACGAG GCGCAGTTCT GGGACGGGCG GGCCGACGAC 
CTGAAGGCGC AGGCCAAGGG GCCGGTGCAG GCGGGCGTCG AGATGGCGAA CACGCCCGGG 
CAGGTCGAGG TGACGCTGAA ATCCCTGCCG CAATATGTCG ACTGGTTCGC CGCCGCCTTC 
CCGGGCGAGC CGGAGCCCAC CAGCTTCGAC AACATGGCCA AGGCCATCGA GGCCTTCGAG 
GCGACGCTCA TCACGCCTGC GCCCTTCGAC GCCTTCCTGA ACGGAGACGA TGCGGCCCTG 
ACCGAGGATC AGCGGGCGGG CCTCGATCTC TTCATCGACA AGGGCTGCTC GACCTGCCAC 
TCGGGCGTGA ACGTGGGCGG GCACGGCTAC TATCCGTTCG GCCTGATCGA GAAGCCCGGC 
GCGGACATCC TGCCCGAGGG CGACAAGGGC CGTTTCGCGG TGACGGCCAC GGTGGACGAC 
GAATATGTCT TCCGGGCGGC GCCGCTGCGC AACGTGGCGG TCACGGCGCC CTATTTCCAC 
TCGGGCAAGG TGTGGGACCT GAAGACCGCC GTCACGATCA TGGCCGAGAG CCAGCTCGGC 
GAGACGATGA GCGATCAGGA GGTGGGGCAG GTCGTGGCCT TCCTCGAGAG CCTCACGGGG 
ACCATGCCGC CGGTCACGCT GCCGGTGCTG CCTGCCGAGA CGGCAGGCAC GCCGCGCCCC 
ACGGCCGAGA TCCGGGTCGA GTGA

Protein sequence

MRLTLTVLIA TTALAGAAQA DALRDKALGY FAPLPSTVPA VKDNRITPEK IELGKALFFD 
PRLSASGVFS CYSCHNLTTG GGDNLETSIG HGWQKGPRNA PTVLNAVLNE AQFWDGRADD 
LKAQAKGPVQ AGVEMANTPG QVEVTLKSLP QYVDWFAAAF PGEPEPTSFD NMAKAIEAFE 
ATLITPAPFD AFLNGDDAAL TEDQRAGLDL FIDKGCSTCH SGVNVGGHGY YPFGLIEKPG 
ADILPEGDKG RFAVTATVDD EYVFRAAPLR NVAVTAPYFH SGKVWDLKTA VTIMAESQLG 
ETMSDQEVGQ VVAFLESLTG TMPPVTLPVL PAETAGTPRP TAEIRVE