Gene Bind_0203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_0203
Symbol
ID	6201074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	241450
End bp	242490
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	60%
IMG OID	641704197
Product	cytochrome-c peroxidase
Protein accession	YP_001831348
Protein GI	182677202
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.908377
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.102484
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATGC GTTTACCGAT GTTCATGTCT CTGGCGGCTC TGGTGCTGTC GGGCGCGACC 
ACCATGGCCG ACCCTCTGCG CGACGAGATC AAGGACCAGT TCGCCCCGAT TCCTGCAAAA 
GCGCCGGGCC TGCCCAATAA TCCGGCGACG CCGGAGAAAT TGGCCCTCGG CAAAATGCTC 
TATTTCGATC CGCGGCTCTC CATCAGCCAT TCGCTGAGCT GCGCGAGCTG CCATAATCTG 
GGGCTTGGTG GGACCGACGA CCGTCCGAAA TCCTTGGGGC ATGATTGGCA GCAAGGTGGC 
CGCAATGCGC CGACGGTGCT GAACTCAGTT TTCAATCTGG CTCAGTTCTG GGACGGCCGC 
GCCGCCGATC TCGCTGAACA GGCGGGTGGC CCGATCCTCA ATCCGGTGGA AATGGGGTCG 
ACCAAGCCGC AAACCATCGA CGTTTTGAAG GGGATTCCCG GCTATGTGAC CGCCTTCAAG 
GCGGCTTTCC CGGGCACGTC CGATTCGATC ACCTATGAGA ATCTCGAAAA GGCCATTGCG 
GTTTTCGAGG CGACGCTGCT CACCCCTGAG GCGCCCTTCG ATCGCTGGCT TTCGGGTGAT 
GATAAGGCGC TGACTCAGAA CCAGAAGAAT GGTTTGCGTC TGTTCGTCGA TAAGGGGTGT 
TCCGGTTGCC ATAATGGGGT GAATATCGGC GGCAGCATGT ATGCGCCCTT CGGCGTGGTG 
AAAGCGCCGG CCCCGGACGT TCGGCCAGCG GATGATCTGG GACGTGCCGC GATCACCAAG 
TCAAAAGACG ATGATTATGC GTTCAAAGTG CCGACCTTGC GCAATATTGC TTTGACTGCG 
CCCTATTTCC ACAGCGGCAA GGTCTGGGAT CTGAAAGAGG CGGTCAAGAT CATGGGGGAG 
AGCCAGCTTG GCGTGACCCT GAGCGATGCG GAAACCGGCA AAATCGTCGA TTTTCTGAAT 
TCCCTGACCG GCCGGCAGCC CGATGTCAGC ATCCCGGTTC TGCCGGCGCT GGCCGCGACG 
ACACCGCATC CCGTGCCGTG A

Protein sequence

MKMRLPMFMS LAALVLSGAT TMADPLRDEI KDQFAPIPAK APGLPNNPAT PEKLALGKML 
YFDPRLSISH SLSCASCHNL GLGGTDDRPK SLGHDWQQGG RNAPTVLNSV FNLAQFWDGR 
AADLAEQAGG PILNPVEMGS TKPQTIDVLK GIPGYVTAFK AAFPGTSDSI TYENLEKAIA 
VFEATLLTPE APFDRWLSGD DKALTQNQKN GLRLFVDKGC SGCHNGVNIG GSMYAPFGVV 
KAPAPDVRPA DDLGRAAITK SKDDDYAFKV PTLRNIALTA PYFHSGKVWD LKEAVKIMGE 
SQLGVTLSDA ETGKIVDFLN SLTGRQPDVS IPVLPALAAT TPHPVP