Gene Mflv_0037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mflv_0037
Symbol
ID	4971660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium gilvum PYR-GCK
Kingdom	Bacteria
Replicon accession	NC_009338
Strand	-
Start bp	33741
End bp	34877
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	71%
IMG OID	640454243
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_001131321
Protein GI	145220643
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.452006
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCATGA CGTCCACAGC GCTGTGTGAA CAGTTCGGCA TCGACTTCCC GCTCTTCGCG 
TTCAGCCACT GTCGCGACGT GGTGGCCGCG GTGACCAATG CCGGCGGCTT CGGCGTGCTC 
GGCGCCACCG CGTACTCGCC CGACCAGCTC GACCAGGAAC TGGCCTGGAT CGACGAGGCC 
GTCGGCGGCA GGCCCTACGG CGTGGACCTC ATCGTCCCGG CGAAGTTCGA GGGCAAGGGC 
GAGAAGCTGT CCAGCTCCGA TCTCGCGGCG CGCATCCCGC AGACCTACAA GGACCTCGTC 
GATGAGCTGC TGCGCAAGCA CGACATCGAG CCCGAGCCCG AGCGGCGTAT CGGCAAGCCC 
ATGCTGTCCG GCAACACCGG ACGTGAGCTG CTCGACGTCG CGCTCACCCA TCCGGTCAAG 
CTGATCGCCA ACGCCCTCGG CGTCCCGCCG GACTACATGA TCGAGGCCGG CAAGGAACGC 
GGCATCCCGG TCGCGGCGCT CGTCGGCGCC AAGGAGCACG CGGTCAAGCA GGCCGCCGCC 
GGCGTGGACC TGATCGTCGC GCAGGGCACC GAGGCGGGCG GACACTGCGG TGAGGTCAGC 
ACGCTCGTCG TGGTGCCCGA GGTCTTGGAG GGTCTGGCGG CGCTCGGCGT GTCCACCCCG 
GTGCTCGCGG CCGGCGGCAT CGTCACCGGA CGCCAGATGG CGGGCATGGT CGCGATGGGC 
GCCTCCGGGG CGTGGACGGG GTCGGTGTGG CTGACCACCG AAGAGGCCGA GACCGCACCG 
CACACCGTGG CCAAGATGCT GGCCGCGACG TCACGCGACA CCGTGCGCTC GGCGGGCCGT 
ACGGGCAAGC CGTCACGGCA GCTGGTGTCG GACTGGACGA AGGCGTGGGC GCCGTCGAAG 
GACGGGGAGC AGCCGCTGGG CCTGCCGCTG CAGTCGATGC TGTGCGAGCC GGTGATCCGC 
CGCATCGACG TGCTGGCCTC GCAGGGCCAC GAGGGTGCGC AGGCGCTCGC GACGTACTTC 
GTCGGGCAGG GCGTCGGGCT GATGAACAAG GTGAAGCCGG CCCGCGAGGT CGTCCGCGAG 
TTCATCGAGG ACTACCTCGC CGCCGCCGAG CGCCTCAGCA GCTCTCTGCC GGGCTGA

Protein sequence

MSMTSTALCE QFGIDFPLFA FSHCRDVVAA VTNAGGFGVL GATAYSPDQL DQELAWIDEA 
VGGRPYGVDL IVPAKFEGKG EKLSSSDLAA RIPQTYKDLV DELLRKHDIE PEPERRIGKP 
MLSGNTGREL LDVALTHPVK LIANALGVPP DYMIEAGKER GIPVAALVGA KEHAVKQAAA 
GVDLIVAQGT EAGGHCGEVS TLVVVPEVLE GLAALGVSTP VLAAGGIVTG RQMAGMVAMG 
ASGAWTGSVW LTTEEAETAP HTVAKMLAAT SRDTVRSAGR TGKPSRQLVS DWTKAWAPSK 
DGEQPLGLPL QSMLCEPVIR RIDVLASQGH EGAQALATYF VGQGVGLMNK VKPAREVVRE 
FIEDYLAAAE RLSSSLPG