Gene Mjls_5008 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_5008
Symbol
ID	4880706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	5246967
End bp	5248088
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	67%
IMG OID	640142318
Product	2-nitropropane dioxygenase, NPD
Protein accession	YP_001073263
Protein GI	126437572
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.498712
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTACCG AACTGTGTGA CCGCTTCGGC ATCGAGTATC CGATCTTCGT CTTCACGCCC 
TCGGAGAAGG TCGCGGCCGC CGTCACCCGC GCCGGCGGGA TGGGTGTGCT CGGGTGTGTG 
CGGTTCAACG ACTCCGACGA CCTCGAGAAC GTCCTTCAGT GGATGGACGA GAACACTCTC 
GGCAAGCCCT ACGGGGTCGA CGTCGTGATG CCCGCGAAGA TCCCGACCGA GGGCACCGCG 
GTCGACATCA ACAAGCTGAT CCCGAAGACG CATCGGGAGT TCGTCGACAA GACGCTCGCC 
GATCTCGGGG TGCCGCCGCT GCCCGAGGAC GAGGCCCGCA ACGAAGGTGT GCTGGGCTGG 
CTGCACTCGG TGGCCAGGTC GCATGTGGAG GTCGGCCTCA AGCATCCGAT CAAGTTGATC 
GCCAACGCGT TGGGTTCGCC GCCGAAGGAC GTCATCGACC AGGTGCACGA GGCGGGTGTG 
CCGGTCGCGG CACTGGCGGG CAGCGCCAAA CATGCGCAGC GGCATGTCGA CAACGGCGTC 
GACATCGTCG TTGCCCAGGG CCATGAGGCC GGTGGGCACA CAGGTGAGAT CGGTTCGATG 
GTGCTGTGGC CGGAGATCGT CGACGCACTC GACGGTCGAG CGCCGGTGCT CGCCGCCGGC 
GGTATCGGAA CGGGGCGTCA GGTCGCGGCC GCGCTCGCGC TCGGCGCGTC CGGGGTGTGG 
ATGGGGTCGG CGTTCCTGAC GGCGGCGGAA TACGATCTCG GACACCGCAA ACCGAGCGGC 
GTGTCGACCA TCCAGGAGGC GATGCTGCGC GCCACCTCCA GCGACACCGT TCGCCGGCGG 
ATCTACACCG GTAAGCCGGC CCGGCTGCTG AAGACGAAGT GGACCGAGGC CTGGGACGCC 
CCCGACGCTC CCGAACCGCT GCCGATGCCG CTGCAGAACA TCCTCGTCAG CGAGGCGCAT 
CAGCGGATGA ACGAGTCGGA CAACCCGGAC ACGGTGTCGA TGCCGGTCGG TCAGATCGTC 
GGCCGGATGA ACGAGATCCG CCCGGTCGCC GACATCATCG CCGAACTGGT GTCGGGCTTC 
GAAGAGGCCT CGAAGAGGTT GGACGGCATC CGCGAAGGCT GA

Protein sequence

MRTELCDRFG IEYPIFVFTP SEKVAAAVTR AGGMGVLGCV RFNDSDDLEN VLQWMDENTL 
GKPYGVDVVM PAKIPTEGTA VDINKLIPKT HREFVDKTLA DLGVPPLPED EARNEGVLGW 
LHSVARSHVE VGLKHPIKLI ANALGSPPKD VIDQVHEAGV PVAALAGSAK HAQRHVDNGV 
DIVVAQGHEA GGHTGEIGSM VLWPEIVDAL DGRAPVLAAG GIGTGRQVAA ALALGASGVW 
MGSAFLTAAE YDLGHRKPSG VSTIQEAMLR ATSSDTVRRR IYTGKPARLL KTKWTEAWDA 
PDAPEPLPMP LQNILVSEAH QRMNESDNPD TVSMPVGQIV GRMNEIRPVA DIIAELVSGF 
EEASKRLDGI REG