Gene Cag_1187 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1187
Symbol
ID	3748221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1580886
End bp	1581944
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	47%
IMG OID	637773721
Product	cytochrome c551 peroxidase
Protein accession	YP_379492
Protein GI	78189154
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0823128
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAC ATCAAATGCT TGCGGCTACT TTGTTAGCTG TTGGGGTTCT TACTTCATGC 
TCCAAAAAGT CGGAGCCTGT GCCTGAACCA GCCCCCGTTC CACCACCAGC CCCCGTGCTT 
CAACCACGCA CTGGCGAACC AGCGCAACCT ATTGAAGCTC CAACCGTTGC TGATGCGGGA 
ATGGTTGAGC TTGGCAAAAA GCTCTTTTTT GATCCACGTC TTTCCAAGTC AGGTTTTATT 
TCTTGTAACT CCTGCCATAA TTTGAGCATG GGCGGCAGTG ATAACCTGAA AAGTTCAATT 
GGGCATAAGT GGCAGCAAGG ACCTATTAAT TCGCCAACCG TGCTTAATTC AAGCATGAAT 
TTGGCACAAT TTTGGGATGG ACGCGCTAAA GATTTAAAAG AGCAAGCAGG TGGTCCAATA 
GCTAATCCGG GTGAAATGGC ATTTACGCAC GAATTGGCAA TTAATGTACT AAAAACAGTA 
CCCGGTTATG TTGATGAGTT TAAAAAAGTC TTTAAAAGCG ATTCCCTCTC AATTGATCAA 
GTAACGCAAG CTATTGCCTC TTTTGAAGAG ACGTTAGTAA CGCCTAACTC CCGTTTTGAT 
AAGTGGTTAA AGGGAGATGA TGCGGCTCTT ACCGCTGAAG AGCTTGCGGG TTACCAGCTC 
TTTAAAAGCA GTGGATGTAC GGCGTGCCAT AATGGTGTGG CGCTTGGCGG TAACTCCTTC 
CAAAAGATGG GAGTAGTCCA GCCCTATCGT TCCACTAACA AAGCAGCAGG TCGTTTTGCG 
GTAACGAAGG ATAACGCTGA CCGTTTTGCC TTTAAAGTGC CAACATTGCG TAACGTCGAG 
CTAACCTATC CATACTTCCA TGATGGAGCG GCACCAACTC TTGCAAAAGC AGTGGAAATT 
ATGGGTCAAG TGCAGCTTGG GCGCACCTTT ACGCCTGAAG AAAATGGTTC GATTGTGGCA 
TTCTTGAAAA CCTTAACGGG CGATCAACCA AGCTTTAGCC TACCACAATT ACCACCATCA 
TCCGACACAA CGCCTGCACC TCAGCCATTT GGTAAGTAG

Protein sequence

MKKHQMLAAT LLAVGVLTSC SKKSEPVPEP APVPPPAPVL QPRTGEPAQP IEAPTVADAG 
MVELGKKLFF DPRLSKSGFI SCNSCHNLSM GGSDNLKSSI GHKWQQGPIN SPTVLNSSMN 
LAQFWDGRAK DLKEQAGGPI ANPGEMAFTH ELAINVLKTV PGYVDEFKKV FKSDSLSIDQ 
VTQAIASFEE TLVTPNSRFD KWLKGDDAAL TAEELAGYQL FKSSGCTACH NGVALGGNSF 
QKMGVVQPYR STNKAAGRFA VTKDNADRFA FKVPTLRNVE LTYPYFHDGA APTLAKAVEI 
MGQVQLGRTF TPEENGSIVA FLKTLTGDQP SFSLPQLPPS SDTTPAPQPF GK