Gene Clim_1506 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1506
Symbol
ID	6354822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	1621221
End bp	1622279
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	51%
IMG OID	642669111
Product	Cytochrome-c peroxidase
Protein accession	YP_001943536
Protein GI	189347007
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.558747
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACCTCA GGCAGATTAT TTCAGGAATT GCCGTACTTT CGGTAACCGC ATCATGCGCG 
CCGACACCCC AGGTGGAAAA GAAAAGTGAA CCGGCTGAAA CCCTGAACGT GGAAGTGCCA 
AAACCAAGAG CCGGTGAGCC GGTATCACCG ATCAGTGCAG CAACGGTTTC CAATGCCGAA 
ATGGTCGAGC TTGGTAAAAA GCTTTTTTTT GATCCCCGGC TTTCAAAATC AGGTTTTATC 
TCCTGCAACT CCTGCCACAA TCTCAGTATG GGAGGCAGTG ACAACCTGAA GTCCTCTATT 
GGTCACAAAT GGAACAAGGG TCCGATCAAT TCGCCAACAG TTCTGAACTC CTCCATGAAT 
CTTGCGCAGT TCTGGGATGG CAGAGCAAAA GATCTGAAGG AACAGGCAGG GGGCCCTATT 
GCCAATCCCG GCGAAATGGC CTTTACCCAT GAGCTTGCGG TAGGTGTACT GCAGTCAATT 
CCCGGCTATG TCGATGAATT TAAAAAAGTG TTCGGATCCG ATCAGATCAC CATCGATCAG 
ATTACCCAGG CGATAGCTGC ATTTGAAGAG ACGCTTGTGA CGCCCGGCTC ACGTTTTGAC 
AAATGGCTGC TGGGAGATGA TAATGCCATA ACGAAAGATG AACGTGAAGG GTATGAGCTT 
TTCAAATCGA GCGGATGTAC TGCCTGTCAT AACGGCCCGG CACTTGGGGG CAATTCCTAT 
CAGAAAATGG GCGTTGTTGA ACCTTACAAA GCTGCCAGCA AGGTCGAAGG GAGATCTGCC 
GTTACCGGAA AAGATGCCGA CCGCTTCAAT TTCAAGGTTC CTGCTCTCCG CAATGTTGCT 
TTGACCTATC CATATTTCCA TGATGGCGAA GCGGCAACCC TTGCCAAAGC GATCGATGTG 
ATGGGGCAGA TACAGCTCGG CAAACGGTTC ACTCCTGAAG AGAATGCAAA GATTGTGGCG 
TTCATGAAGA CCCTGACCGG CAAGCAGCCG GTATTTGAGC TTCCCGTTCT TCCGCCTTCT 
TCCGATACGA CACCGGCTCC GGAGCCTTTC GGGAAGTAA

Protein sequence

MHLRQIISGI AVLSVTASCA PTPQVEKKSE PAETLNVEVP KPRAGEPVSP ISAATVSNAE 
MVELGKKLFF DPRLSKSGFI SCNSCHNLSM GGSDNLKSSI GHKWNKGPIN SPTVLNSSMN 
LAQFWDGRAK DLKEQAGGPI ANPGEMAFTH ELAVGVLQSI PGYVDEFKKV FGSDQITIDQ 
ITQAIAAFEE TLVTPGSRFD KWLLGDDNAI TKDEREGYEL FKSSGCTACH NGPALGGNSY 
QKMGVVEPYK AASKVEGRSA VTGKDADRFN FKVPALRNVA LTYPYFHDGE AATLAKAIDV 
MGQIQLGKRF TPEENAKIVA FMKTLTGKQP VFELPVLPPS SDTTPAPEPF GK