Gene Rcas_0505 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0505
Symbol
ID	5537968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	653563
End bp	654660
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	62%
IMG OID	640892667
Product	cytochrome-c peroxidase
Protein accession	YP_001430653
Protein GI	156740524
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0442639
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGCT TCGTCCATTT TTTTAGCCTG GCGCTATTGA TTGCTGTGTT CATCACAGTG 
ATACGCGGAG ATTCGCCTAT TGCCAGAACG CCAGCCCCCG GCGAGTCGCC GCAGGCGATG 
ATTGCATTGG GACGCCGGCT CTTTTACGAC CGACGCCTGT CGGCAAACGA ACAGATCGCG 
TGCGCTGCCT GTCACCGCCA GGAATTGGGG TTCAGCGATG GACGGGTTGT TTCGAACGGC 
GCCACAGGCG CACTGCTGCG GCGGAATACG CCAGGGTTGT TCAATAGCGG CGAACTCCTG 
GCGTTTACCT GGGCGAATGT TGAGGTGCGA ACGCTGGAAC AGCAGGTGGA GCGCGCGCTT 
TTTACCGTTG ACCCGCCTGA GATGTGGGTG AGAGGGTATG AGACCACGGT GATCGACCGC 
CTGCGCGCCG ATCCAGAATA TCTGCGTCAA TTCACTGCTG CGTTTCCCGC AGATGACGAC 
CCGTTCACCT GGCGACGCAT CACCGGGGCG CTGGCAGCCT TTGTTCGCTC GCTGGCTGCG 
CGCAACACGC CATACGACCG ATACGTCTAT GCTGGCGACC GTGCGGCATT GAGCGACAGT 
GCGCAACGAG GCATGGCGCT CTTCTTTTCG CCAGGGCTGG CGTGCGGTCA TTGTCATGTT 
GATGTTCCGT CGCCGGAGCG CGCCACGCCG CCACGCTGGT CCGATCTGGC ATATGTGGCG 
ACGGGCGCCG GGTACAGCGC AGATCGCGGT CTAGCGGAGC AGACCGGCAA TCCGGCGGAT 
GCCTACCGAT TTCGCGTGCC GCCGTTGCGG AATGTGGCGG TGACTGCACC CTATATGCAC 
GACGGAAGCC TGCCTACCCT CGAGGCGGTC ATCCGATTTT ATGAGTCCGG CGGGCGATGG 
GGCGCCGGCG TGGAACCGGA ACGCGTCGCC GCCCGTCACC CGCTGATCGC CGGTTTTGCG 
CTGAGCGACG AGGAGCGTCG CGATCTGATA GCCTTTCTCG AAGCGCTGAC CGACGATGAA 
GCGTTGCGGA ACCCGGCATT TGCCGACCCG TTCTTATCCG ATGCGCGAAC CCCGTCTGTT 
CGCTCGCTCT CCCGGTAA

Protein sequence

MQRFVHFFSL ALLIAVFITV IRGDSPIART PAPGESPQAM IALGRRLFYD RRLSANEQIA 
CAACHRQELG FSDGRVVSNG ATGALLRRNT PGLFNSGELL AFTWANVEVR TLEQQVERAL 
FTVDPPEMWV RGYETTVIDR LRADPEYLRQ FTAAFPADDD PFTWRRITGA LAAFVRSLAA 
RNTPYDRYVY AGDRAALSDS AQRGMALFFS PGLACGHCHV DVPSPERATP PRWSDLAYVA 
TGAGYSADRG LAEQTGNPAD AYRFRVPPLR NVAVTAPYMH DGSLPTLEAV IRFYESGGRW 
GAGVEPERVA ARHPLIAGFA LSDEERRDLI AFLEALTDDE ALRNPAFADP FLSDARTPSV 
RSLSR