Gene Mkms_1391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_1391
Symbol
ID	4614222
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	1494464
End bp	1495852
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	66%
IMG OID	639791066
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_937393
Protein GI	119867441
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID	[TIGR03229] benzoate 1,2-dioxygenase, large subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.109638
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGGCAC CGATGAGCGC ACCGACAGCC GAACCCCGCA GTCACCTCGA GACCGTCCTC 
GCCGATGCGG TGATCGACGA CCACGCGGCC GGGATCTACC GCACCAACCG GCGGATCTTC 
ACCGACGAGG ACATCTTCGA GCTCGAGATG GAGCACATCT TCGAGGGCAA CTGGATCTAC 
CTCGCCCACG AAAGTCAGGT CGCCGAACCG GGCGACTACT TCACCACGTA CATGGGCCGC 
CAGCCCGTCG TCATCACCCG CGACAAGAAC GGGGGCCTCA ACTGCCTGGT CAATGCCTGT 
GCACACCGAG GGGCGATGGT GTGCCGACGC AAGACCGACA ACCGGATGAC GCTCACCTGT 
CCCTTTCACG GGTGGACCTT CCGCAACGAC GGGACCTTGC TCAAGGTCAA GGATCCCGAG 
GGGGCCGGCT ACCCGGCGAC GTTCGACGTC GACGGCTCGC ACAACATGAC CAAGGTGGCC 
CGGTTCGACA GCTACCGCGG ATTCCTGTTC GGCAGCCTCA ACCCGGACGT CGTCCCCCTC 
CTCGAGCACC TCGGTGACAC CACCAAGGTC ATCGACATGC TCGTCGACCA GTCCCCCGAC 
GGCCTGGAGG TGTTGCGCGG ATCGTCGACC TACACCTACG ACGGCAACTG GAAAGTGCAG 
GCGGAGAACG GCGCCGACGG TTATCACGTC ACCGCGACGC ACTGGAACTA CGCCGCGACC 
ACCTCACGGC GCAACACCGG CGAGTCCGCC AACGACACCA AGGCGCTCGA CGCCGGCAGC 
TGGGGGAAGT CCGGCGGCGG CTACTGGTCC TACCCGAACG GCCACCTCTG CCTGTGGACG 
TGGGCGGCCA ACCCCGAGGA CCGCCCGCTG TGGGACCGGC TCGACGACCT CAAGAGCGTC 
CACGGCGCGG CCAAGGGCGA GTTCATGGTG AAGGGTTCAC GCAACCTGTG CCTGTACCCG 
AATGTGTATC TGATGGACCA ATTCTCGACG CAGATCCGCC ACTTCCGGCC GATCGCGCCG 
GACAAGACCG AGGTCACCAT CTACTGCATC GCCCCCAAGG GTGAGAACGC CGATGCCCGC 
GCCAGGCGCA TCCGCCAGTA CGAGGACTTC TTCAACGCCT CGGGCATGGC CACCCCGGAC 
GACCTCGAGG AGTTCCGCTC CTGCCAGCTG ACCTACCAGG CCACCGCCGC CCCGTGGAAC 
GACATGAGCC GCGGTGCGCA GCACTGGCTG TCCGGACCCG ACGAGGTCGC CGAATCGCTG 
GGGATGCACG GCGTCATCTC CGCGGGCGTG CGCAACGAGG ACGAGGGCCT CTACCCCGTC 
CAGCACGGCT ACTGGCTGCA GACCATGCGT GCGGCGCTGG CCCAAAACGA GACCGGATCG 
GAGAAGTGA

Protein sequence

MEAPMSAPTA EPRSHLETVL ADAVIDDHAA GIYRTNRRIF TDEDIFELEM EHIFEGNWIY 
LAHESQVAEP GDYFTTYMGR QPVVITRDKN GGLNCLVNAC AHRGAMVCRR KTDNRMTLTC 
PFHGWTFRND GTLLKVKDPE GAGYPATFDV DGSHNMTKVA RFDSYRGFLF GSLNPDVVPL 
LEHLGDTTKV IDMLVDQSPD GLEVLRGSST YTYDGNWKVQ AENGADGYHV TATHWNYAAT 
TSRRNTGESA NDTKALDAGS WGKSGGGYWS YPNGHLCLWT WAANPEDRPL WDRLDDLKSV 
HGAAKGEFMV KGSRNLCLYP NVYLMDQFST QIRHFRPIAP DKTEVTIYCI APKGENADAR 
ARRIRQYEDF FNASGMATPD DLEEFRSCQL TYQATAAPWN DMSRGAQHWL SGPDEVAESL 
GMHGVISAGV RNEDEGLYPV QHGYWLQTMR AALAQNETGS EK