Gene Mjls_3503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_3503
Symbol
ID	4879214
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	-
Start bp	3695017
End bp	3696048
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	70%
IMG OID	640140807
Product	2OG-Fe(II) oxygenase
Protein accession	YP_001071771
Protein GI	126436080
COG category	[R] General function prediction only
COG ID	[COG3491] Isopenicillin N synthase and related dioxygenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00994559
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.800786
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCAGCG ATCGTGAACG CCGCTCGCCT CACCGGCGTC GACGGCCGAC AATGGCGCAC 
GTGCTGCCCG TCCTCGACCT CACCGACGCC GACACCGACC CGGCGGGTTT CCGCGCCCGG 
TTGCGGGAGG CCGCCCACGA CGCCGGGTTC TTCTACCTCG TCGGGCACGG TGTGCCGGTC 
GAGGGCTTCG AGCGGGTGCT GCGCCTGGCG CGTGACTTCT TCACCCAACC GCCGGAGCGA 
AAGAACGAGA TCAGCCAACT GCTCAGCCCG CAGTTCCGCG GATACTCCCG GCTCGGTGGG 
GAACTGACCA ACGGCACCGT GGACTGGCGC GAGCAGATCG ACATCGGACC GGAGCGCGAC 
GTCATCGAGG GCGCCGAAGG CTACTGGCGG CTGCAGGGGC CGAACCTGTG GCCGGCGCAG 
CCGCCGGGAT TCCGTGCCGC ATTCGAAGAG TGGGGGGCCG CGCTGTCGGA GGTGGGTGTG 
CGGCTGCTGC GGCACTGGGC GGTGTCGCTC GGTGCGGCCG AGGACACCTT CGACGCAGCC 
TTCGCCGACC GGCCCGCCAC GTTGATGAAG GTGGTGCGCT ATCCCGGCAC GACCCAGACG 
GCGCAGGGTG TGGGCGCGCA CAAGGACTCC GGGGTGTTGA CGCTGCTGCT CGTCGAACCG 
GGATCGGTCG GGCTGCAGGT CGAGTCGGGC CCCGACGAGT GGATCGACGT ACCGCCCCTT 
CCCGGAGCCT TCATCGTCAA CATCGGGGAA CTGCTGGAGG TGGCGACGGG TGGGTACCTG 
CGTGCCACCC GCCACCGTGT GCTCGCCCCG CCACCCGGCA CGGACCGCAT CTCGATCCCG 
TTCTTCCTCA ACCCGGCCCT CGACGCGCTG ATCCCCATCC TGCCGTTGCC TCCGGAGCTG 
GCTGTGCGCT CGCGGGGGGT GGAAACCGAC CCGGACAACC CGATCTTCAA CACTTACGGG 
GAGAACGCGT GGAAGTCGCG CACCCGGGCG CATCCCGACG TCGCCGAACT GCATCACGGC 
ATCACCCGGT GA

Protein sequence

MSSDRERRSP HRRRRPTMAH VLPVLDLTDA DTDPAGFRAR LREAAHDAGF FYLVGHGVPV 
EGFERVLRLA RDFFTQPPER KNEISQLLSP QFRGYSRLGG ELTNGTVDWR EQIDIGPERD 
VIEGAEGYWR LQGPNLWPAQ PPGFRAAFEE WGAALSEVGV RLLRHWAVSL GAAEDTFDAA 
FADRPATLMK VVRYPGTTQT AQGVGAHKDS GVLTLLLVEP GSVGLQVESG PDEWIDVPPL 
PGAFIVNIGE LLEVATGGYL RATRHRVLAP PPGTDRISIP FFLNPALDAL IPILPLPPEL 
AVRSRGVETD PDNPIFNTYG ENAWKSRTRA HPDVAELHHG ITR