Gene Mvan_4389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_4389
Symbol
ID	4648728
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	4710077
End bp	4711099
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	73%
IMG OID	639807860
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_955171
Protein GI	120405342
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.537564
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCTTCG ACGTCCGGGA CCTGTCCGTG CCGGTGCTCG TCGCCCCGAT GGCAGGCGGA 
CCCTCGACGC CCGAGCTTGC GGCGGCGGGC ACGAACGCCG GCGGCCTGGG CTTCGTCGCC 
GCCGGTTACC TGACGGCCGA CGTGTTCGCC GAACGCGTGC GGGCCGCGCA ACGGCTGACC 
AGCGGGCCCC TCGGGGTGAA TCTCTTTGTG CCGCAACCCA GTGCCGGCAC TCCTGCGGCG 
GTCGCGGCCT ATGCGGAGAG GTTGGCGGAG GAGGCGCGAC GTTACGGCAC CGAGCTCGGC 
GCCCCCCGGT TCGACGACGA CCACTGGAAC GCCAAGCTCG AGGTGGTGCT GGACCTGAGG 
CCCGCGCTGG CGTCGTTCAC GTTCGGGCTG CCCACCGTCG AGGAGCGGCG CCGTCTCAGC 
GCGGCCGGAA TCGCCACGGC GGCAACGGTG ACCACGCCGG CCGAAGCGCG GCTGGCCGCC 
GACTGCGGCG TCGACATCCT GGTGGCACAG GGCCCGTCGG CGGGCGGGCA CCGCGGGACC 
TTCGACCCGA CCGCGACGCC CTCCGGGCAG CCACTGGACG AACTGCTGGC CGCGGTCACG 
GCCGACCACG CGATCCCCGT CGTCGCGGCG GGCGGCTTGA TGACCGCCAC CGATATCCGC 
CGGGTCCGGC AGGCGGGTGC GGCCGCCGCA CAACTCGGCA CCGCCTTCCT GCTGTCCGAC 
GAGGCGGGCA GCAGCCCGGT GCACCGGGCC GCGCTGATCG ACCCGCAGTT CACCGAAACG 
GCTGTCACGA AAGCGTTTTC CGGACGGTAC GCGCGGGGAC TGCGCAACCG GTTCATCGTC 
GAGCACGAAG CGGAGGCGCC GTTCGGTTAC CCCGAGGTGC ATTACCTGAC CAGCCCGCTT 
CGGGCCGCGG CGGTACGGGC CGGCGATCCG CAGGCGGTCA ACATCTGGGC CGGCACCGGG 
TTCCGGCAGG CCGGCGGCGG TTCGGTACGC GACATCATGG ACACGTTGAT CGGTCGAGAC 
TGA

Protein sequence

MSFDVRDLSV PVLVAPMAGG PSTPELAAAG TNAGGLGFVA AGYLTADVFA ERVRAAQRLT 
SGPLGVNLFV PQPSAGTPAA VAAYAERLAE EARRYGTELG APRFDDDHWN AKLEVVLDLR 
PALASFTFGL PTVEERRRLS AAGIATAATV TTPAEARLAA DCGVDILVAQ GPSAGGHRGT 
FDPTATPSGQ PLDELLAAVT ADHAIPVVAA GGLMTATDIR RVRQAGAAAA QLGTAFLLSD 
EAGSSPVHRA ALIDPQFTET AVTKAFSGRY ARGLRNRFIV EHEAEAPFGY PEVHYLTSPL 
RAAAVRAGDP QAVNIWAGTG FRQAGGGSVR DIMDTLIGRD