Gene Mkms_3804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3804
Symbol
ID	4611739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	4018411
End bp	4019367
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	71%
IMG OID	639793484
Product	luciferase family protein
Protein accession	YP_939787
Protein GI	119869835
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03564] F420-dependent oxidoreductase, MSMEG_4879 family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0754765
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGATCG GGTTGATGGT CGGCTCCGAC CGGGAACGCA CACGTGCGGA CCGGTTGGAC 
GGGCTGCTCG ACGACGGGCG GGCCGCCGAG GCGCAGGGGT TCGCGTCGTT CTGGTTCCCA 
CAGGTGCCCG GTTATCTCGA CGCGATGACC GCGGTCGCAC TGCTCGGCCG CGTCACCGAA 
CGCATCGAGA TCGGCACCGC AGTCGTGCCC ATCCAGACGC GGCACCCGCT CGTCATGGCA 
CAACAGGCGG CCACGACCCA GGCGGCCTGC GGCGGACGAT TCACCCTGGG GATCGGCCCA 
TCTCACGACT GGATCATCTC CGGGCAGCTG GGGCTGCCCT ACGACCGGCC TGCCCGACTG 
GTGCGCGACC ATCTCGACGT CCTCGGCGCG TCGCTGTCCG GTGCGGGTCC GGTCGACGTG 
GACAACGACA GCTACCGCGT GCACGGCTCG ATCGACGTCA CCGACTACGA GGTTCCGGTA 
CTGCTCGCCG CACTGGGCCC GGTGATGCTG CGCCTGGCCG GTGAGCGTGC GGGCGGCACC 
ATCCTCTGGA TGGCCGACGA GCGGGCGATC GAGAGCCATA TCGCTCCCCG CCTCACCGCC 
GCCGCGTGCG CCGCGGGTCG CCCGGCGCCG CGCATCGTGG CCGGTGTCCC GGTCGCCCTG 
TGCTCACCAG GAGAGGTCGA CGACGCTCGC GCTCATGCCG GCGAGGTGCT CGGCCACGCG 
GAACTGTCGC CCAACTACCT TCGGCTGCTC GAGCACGGCG ACGCCGACGA CGTCGGCGAC 
ACCATGGCCG CGGGAGACGA GGCGTCGGTT CGCGCCCGGT TCCGGCGCTA CCGAGATGCG 
GGTGTGACAG ACCTGGCCGC GCGCGTGATC CCACTCGGTG AGGACGCCGC CGCGCGGCGG 
GACTCCCGTT GCCGTACAAA GGATTTCGTG GCATCACTGT GCGCGGAGTT CGGTTGA

Protein sequence

MRIGLMVGSD RERTRADRLD GLLDDGRAAE AQGFASFWFP QVPGYLDAMT AVALLGRVTE 
RIEIGTAVVP IQTRHPLVMA QQAATTQAAC GGRFTLGIGP SHDWIISGQL GLPYDRPARL 
VRDHLDVLGA SLSGAGPVDV DNDSYRVHGS IDVTDYEVPV LLAALGPVML RLAGERAGGT 
ILWMADERAI ESHIAPRLTA AACAAGRPAP RIVAGVPVAL CSPGEVDDAR AHAGEVLGHA 
ELSPNYLRLL EHGDADDVGD TMAAGDEASV RARFRRYRDA GVTDLAARVI PLGEDAAARR 
DSRCRTKDFV ASLCAEFG