Gene Mvan_2157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_2157
Symbol
ID	4649134
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	2304046
End bp	2305242
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	70%
IMG OID	639805642
Product	Dyp-type peroxidase family protein
Protein accession	YP_952978
Protein GI	120403149
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2837] Predicted iron-dependent peroxidase
TIGRFAM ID	[TIGR01412] Tat-translocated enzyme [TIGR01413] Dyp-type peroxidase family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.923175
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGAGC AGCGCTGGAC CCTCAACCGG CGGCGCCTCC TCACCGGAGG CGCCGCCGTG 
GCGGCGGGCG CCGCACTGAC CCAGTGCGCG ACCGCCGGCT CCTCGACACC AACAGGTTTC 
GGTTCCGCGA CGGAGCCGTT CCACGGCCGG CACCAGGCCG GGATCGCAAC GCCGCCGCAA 
GCGCACGCCC TGTTCGTCGC GCTGGACATG GCGCCCAGCG CAGATCGCAG CCCGCGGGAC 
ACCCTGATTG CGATGCTGCG GCTGTGGAGT TCCGACGCCG CGCGCCTCAC CGCGGGCCAG 
CCCGCCCTGG CGGACACCGA ACCCGAACTT GCGCAACACC CTTCACGGCT CACTGTGACG 
GTGGGCATCG GACCACACGT CTTCGACCGG ATCGGGCTGG CCCACCGTCG TCCGGATTCG 
GTGTCCGAGT TGCCGGCGTT CTCCACCGAC CGACTCGATC GGCGCTGGTG CGGTGGTGAC 
ATCCTGCTGC AGATCTGTGC CGATGACCGG GTCGCCGTCG CACACGCCGC GCGGGTCCTA 
CTCAAGAACG TACGCACGCT GACCGTGCAG CGGTGGCGGC AGGACGGGTT CCGAACCGCG 
CGCGGCGCGG ACAAGTCCGG TGCGACGATG CGCAACCTGA TGGGGCAGGT CGACGGCACC 
GCGAACCCAC GCGAGGATGC CGAACTCGAT CGTTACGTCT GGGACGACGG TTCGCAGCAA 
CCGTGGTTCG CCGGCGGGAC CGTGCTCGTG ATCCGCCGCA TCCGGTCCGA GCTGGACACC 
TGGGACGAAC TGGACCGCAC CAGCAAGGAA TTGACGCTGG GCCGGCGACT GGACACCGGG 
GCGCCACTGA CCGGCGAGGG CGAGTTCGAC GAGCCCGACC TCGCCGCCAC CGAGAACGGC 
ATACCGGTCA TCCCGCCGAA TTCGCATGTG GCACTGGCTC GGCGGCAGTC GGACGATGAG 
CGCTTCCTGC GGCGGGGGTA CAACTACGAC GACCCGCCGA CGGTGGGCAC CACGGACGCG 
GGACTGATCT TCGCGGCGTA CCAGCGTGAC CCGGCGCGGC AGTTCGTTCC GGTACAGCGA 
CGGCTGGCCG AGGCGGACGC GATGAACCCG TGGATCACGA CGATCGGCTC CGCGGTGTTC 
GCGATGCTAC CCGGGGTGCC TGAGGGCGGT TATCTGGGGC AGAACCTGTT GGGGTGA

Protein sequence

MAEQRWTLNR RRLLTGGAAV AAGAALTQCA TAGSSTPTGF GSATEPFHGR HQAGIATPPQ 
AHALFVALDM APSADRSPRD TLIAMLRLWS SDAARLTAGQ PALADTEPEL AQHPSRLTVT 
VGIGPHVFDR IGLAHRRPDS VSELPAFSTD RLDRRWCGGD ILLQICADDR VAVAHAARVL 
LKNVRTLTVQ RWRQDGFRTA RGADKSGATM RNLMGQVDGT ANPREDAELD RYVWDDGSQQ 
PWFAGGTVLV IRRIRSELDT WDELDRTSKE LTLGRRLDTG APLTGEGEFD EPDLAATENG 
IPVIPPNSHV ALARRQSDDE RFLRRGYNYD DPPTVGTTDA GLIFAAYQRD PARQFVPVQR 
RLAEADAMNP WITTIGSAVF AMLPGVPEGG YLGQNLLG