Gene Msil_1809 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1809
Symbol
ID	7090926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	1969442
End bp	1970743
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	64%
IMG OID	643465136
Product	Dyp-type peroxidase family
Protein accession	YP_002362116
Protein GI	217977969
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2837] Predicted iron-dependent peroxidase
TIGRFAM ID	[TIGR01412] Tat-translocated enzyme [TIGR01413] Dyp-type peroxidase family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.64569
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAATC GAAAGACTCC GCTCTCGCTT TCCCCGGATC GCCGCAGCCT GCTGCTCGCG 
GGCGGCGCCC TTGCCGGCGC CCTTTCGGCC GGCGCGCCGC AACGGGCGCT TGCGCAAAGC 
GACAGCACCA ACGTCACCAA CGCCCCGATC AGCGAAAAAC AGCAGCAGCG CAACCCGTTC 
TACGGCGCGC ATCAGGCGGG AATCGTCACG CCGCGCCAAG AATTCGGCAT GATCGCCACC 
TTCGACGTGA TCGCCTCGAG CCCGCCCGAT CTCGTGCGCT TGTTCAGGAC GCTGACGGCC 
CGCTTCGCCC TTTTGACGCA AGGATGGACG CCGCCGGAGC TCGACCCCCG CCTGCCGCCG 
CCGGACTCGG GGTTGCTCGG TCCGGTCGTC GAGCCTGACA ATCTGACGGC GACGCTGTCG 
GTCGGCTCGT CGATGTTCGA CGAACGTTTT GGCCTTGCGA AAGTGAAGCC GGCCGTTCTG 
ACGCGCATGA CCAGCTTCAA GAACGATGCG CTGGACCCCG CGCTCTGTCA TGGCGATCTG 
TCGATACAGT TTTCGTCGAA CTCGGCCGAC GCCAACATCC ACGCCCTGCG CGATATCCTG 
AAGAGCCTGC CGGATCTTCT GGTGCTGCGC TGGAAGCAGG AGGGCTATGT TCCGGCTCTG 
CCGGCAAAGC CCGGCCAGCC GCCGGAAAGC GCGCGCAATT TCCTCGGCTT CCGCGACGGA 
TCGGCCAATC CGCACGCAGG CGATCCGGCC GCAATGAATG AGATCGTCTG GGTCCAGCCG 
GGCTCGAAAG AGCCGGCCTG GGCCGCCGGC GGAACCTATC AGGCCGTGCG CATCATCCGC 
AATTTCGTCG AACGCTGGGA CCGCACGCCG CTCGGCGAGC AAGAGCGGAT CATCGGCCGA 
AGAAAGCCCT CCGGCGCGCC GTTCGACGGC AAAACCGAAG CGGACGTTCC GGATTTCGCC 
GCCGATCCCA ACGGCAAGAT CACGCCGATT GACGCCCATA TCAGGCTCGC CAATCCGCGC 
ACGCCGGAAA GCCGCGCCAA TCTCATTTTG CGCCGCCCGT TCAACTATTC CAACGGCGTG 
TCGAAATCCG GCCAGCTCGA AATGGGCCTG CTCTTCATCG CCTATCAGGC GGATCTCGAA 
AAGGGCTTTA TCACGGTCCA GCACCGGCTC GATGGCGAAC CGCTCGAAGA ATACATCAAC 
CCGATCGGCG GCGGCTTTTT CTACACGCTG CCAGGCGCAA GAGACGAACA GGATTTCCTC 
GGCCGCTCCA TGCTGGAGGC GGCAGGCATC GCTCTGTCGT AG

Protein sequence

MSNRKTPLSL SPDRRSLLLA GGALAGALSA GAPQRALAQS DSTNVTNAPI SEKQQQRNPF 
YGAHQAGIVT PRQEFGMIAT FDVIASSPPD LVRLFRTLTA RFALLTQGWT PPELDPRLPP 
PDSGLLGPVV EPDNLTATLS VGSSMFDERF GLAKVKPAVL TRMTSFKNDA LDPALCHGDL 
SIQFSSNSAD ANIHALRDIL KSLPDLLVLR WKQEGYVPAL PAKPGQPPES ARNFLGFRDG 
SANPHAGDPA AMNEIVWVQP GSKEPAWAAG GTYQAVRIIR NFVERWDRTP LGEQERIIGR 
RKPSGAPFDG KTEADVPDFA ADPNGKITPI DAHIRLANPR TPESRANLIL RRPFNYSNGV 
SKSGQLEMGL LFIAYQADLE KGFITVQHRL DGEPLEEYIN PIGGGFFYTL PGARDEQDFL 
GRSMLEAAGI ALS