Gene Mvan_3005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3005
Symbol
ID	4648533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	3172711
End bp	3173841
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	67%
IMG OID	639806485
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_953816
Protein GI	120403987
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.558356
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATACTC CCCTGTGCGA CGAGTTGGGC ATCGAGTTCC CTATCTTCGC TTTCACCCAC 
TGCCGCGACG TGGTCGTCGC CGTCAGCAAG GCGGGTGGTT TCGGCGTGCT CGGCGCGGTC 
GGGTTCACGC CTGAACAGCT CGAGATCGAG CTGAACTGGA TCGACGAGAA CATCGGCGAC 
CACCCCTACG GCGTGGACAT CGTGATCCCG AACAAGTACG AGGGCATGGA CTCGAACATG 
TCGGCCGACG AACTCAAGTC GACGCTCAAC GCGCTCGTTC CGCAGGAGCA CCTGGACTTC 
GCGAAGAAGA TCCTCGCCGA CCACGGCGTG CCCACCGACG ACAGCGACGA CAACGCGCTG 
CAGCTGCTCG GCTGGACCGA GGCCACCGCC ACCCCGCAGG TCGAGGTCGC GTTGCGGCAC 
CCGAAGATGA CTCTGATCGC CAACGCGCTC GGCACCCCGC CCAAGGACAT GATCGAGCAC 
ATCCACGCCG AGGGGCGCAA GGTCGCCGCG CTGTGTGGCT CGCCGTCACA GGCGCGCAAG 
CACGCCGACG CCGGGGTGGA CATCATCATC GCCCAGGGCG GTGAGGCCGG TGGACACAGC 
GGTGAGGTCG GTTCCATCGT GCTCTGGCCG CAGGTCGTCA AGGAGGTGGC GCCGGTGCCG 
GTGCTGGCCG CCGGTGGCAT CGGCAGCGGT CAACAGATCG CCGCGGCGCT CGCGCTCGGC 
GCGCAGGGCG CGTGGACGGG CTCCCAGTGG GTGATGGTCG AGGAATCGGA GAACACCCCG 
GTCCAGCACG CCGCTTACGC GAAGGCCACC AGCCGCGACA CCGTGCGCAG CCGGTCGTTC 
ACCGGAAAGC CGGCACGCAT GCTGCGCAAC GACTGGACCG AGGCCTGGGA GAACCCGGAG 
AACCCCAAGC CGCTCGGAAT GCCGCTGCAG TACATGGTTT CCGGGATGGC CGTGGCTGCG 
ACGCACAAGT ACCCCAACGA GACCGTCGAC GTCGCGTTCA ACCCGATCGG CCAGGTCGTC 
GGACAGTTCA CCAAGGTGGA GAAGACCGCG ACCGTCATCG AGCGCTGGGT GCAGGAGTAC 
CTGGAGGCGA CCAACACGCT CAACGAGCTC AACGAGGCCG CCAGCGTATA G

Protein sequence

MHTPLCDELG IEFPIFAFTH CRDVVVAVSK AGGFGVLGAV GFTPEQLEIE LNWIDENIGD 
HPYGVDIVIP NKYEGMDSNM SADELKSTLN ALVPQEHLDF AKKILADHGV PTDDSDDNAL 
QLLGWTEATA TPQVEVALRH PKMTLIANAL GTPPKDMIEH IHAEGRKVAA LCGSPSQARK 
HADAGVDIII AQGGEAGGHS GEVGSIVLWP QVVKEVAPVP VLAAGGIGSG QQIAAALALG 
AQGAWTGSQW VMVEESENTP VQHAAYAKAT SRDTVRSRSF TGKPARMLRN DWTEAWENPE 
NPKPLGMPLQ YMVSGMAVAA THKYPNETVD VAFNPIGQVV GQFTKVEKTA TVIERWVQEY 
LEATNTLNEL NEAASV