Gene Mkms_3820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3820
Symbol
ID	4611755
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	4034333
End bp	4035655
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	63%
IMG OID	639793500
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_939803
Protein GI	119869851
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.365881
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCACATT TCCCCAAACC GGCCGCCGGT AGCTGGACCG AGAACTGGCC GGAGCTCGGC 
ACGGCACCGG TGGACTACAC CGACTCGATC GACCCGGAGC AGTGGAAGCT GGAGCAGCAG 
GCCATCTTCC GGAAGCTGTG GCTGCACGTC GGTCGCGTGG AGCGGCTCCC CAAGACCGGC 
AGCTACTTCA CCAGGGAGAT GCCCTCCGTC GGACCGGGCA CCTCGATCAT CGTCAACAAG 
GACAAGGACG GCACCATCCG GGCGTTCTAC AACCTGTGCC GCCACCGCGG AAACAAGTTG 
GTGTGGAACG ACTATCCGGG CGAAGAGGTC TCGGGCAGCT GCCGCCAGTT CACCTGCAAG 
TACCACGCCT GGCGTTACGC CCTCAACGGC GACCTGACGT TCATCCAGCA GGAGGATGAG 
TTCTTCGACG TCGACAAGGC CGACTACCCG CTCAAGCCGG TGCGCTGCGA GGTGTGGGAA 
GGCTTCATCT TCGTCAACTT CGACGACGAC GCCGAACCGC TGGAGGACTA CCTGGGCGAG 
TTCGGGCAGG GCCTCAAGGG CTACCCGTTC CACGAGATGA CCGAGGTGTA CAGCTACCGC 
TCCGAGATCA AGGCGAACTG GAAGCTGTTC ATCGACGCGT TCGTCGAGTT CTACCACGCG 
CCGATCCTGC ACATGAAGCA GGCGACCCCG GAAGAGGCGG CCAAGCTCGC CAAGATCGGT 
TTCGAGGCGC TGCATTACGA CATCAAGGAC CAGCACTCGA TGATCTCGTC CTGGGGTGGC 
ATGAGCCCGC CCAAGGACCT CAGCATGGTC AAGCCGATCG AGCGGATCCT GCACAGCGGT 
CTGTTCGGCC CCTGGGACCG TCCCGACATC AAGGGCATCC TGCCCGACGA GCTGCCGCCG 
GCGGTCAACC CGGCTCGCCA GAAGACGTGG GGCCAGGACT CGTTCGAGTT CTTCCCGAAC 
TTCACGCTGC TGCTGTGGGT TCCGGGTTGG TACCTGACGT ACAACTACTG GCCCACCGGT 
GTGGACACCC ACATCTTCGA GGCCAACCTG TACTTCGTGC CGCCGAAGAA CACCCGCCAG 
CGCCTGTCGC AGGAACTCGC GGCCGTGACG TTCAAGGAGT ACGCGCTGCA GGACGCGAAC 
ACCCTGGAAG CCACCCAGAC TCAGATCGGC ACCCGCGCCG TCACCGAGTT CCCGTTGTGC 
GATCAGGAGA TCCTGCTGCG CCACCTGCAC CACACCGCGC ACAAGTACGT CGACGAGTAC 
AAGCTCGAGC AGGCCGCGAA GGCGGCGACG AACGGAAAGG TCAAGGACGA GGCACATGTC 
TGA

Protein sequence

MAHFPKPAAG SWTENWPELG TAPVDYTDSI DPEQWKLEQQ AIFRKLWLHV GRVERLPKTG 
SYFTREMPSV GPGTSIIVNK DKDGTIRAFY NLCRHRGNKL VWNDYPGEEV SGSCRQFTCK 
YHAWRYALNG DLTFIQQEDE FFDVDKADYP LKPVRCEVWE GFIFVNFDDD AEPLEDYLGE 
FGQGLKGYPF HEMTEVYSYR SEIKANWKLF IDAFVEFYHA PILHMKQATP EEAAKLAKIG 
FEALHYDIKD QHSMISSWGG MSPPKDLSMV KPIERILHSG LFGPWDRPDI KGILPDELPP 
AVNPARQKTW GQDSFEFFPN FTLLLWVPGW YLTYNYWPTG VDTHIFEANL YFVPPKNTRQ 
RLSQELAAVT FKEYALQDAN TLEATQTQIG TRAVTEFPLC DQEILLRHLH HTAHKYVDEY 
KLEQAAKAAT NGKVKDEAHV