Gene Mkms_3790 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3790
Symbol
ID	4611725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	4003521
End bp	4004798
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	64%
IMG OID	639793470
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_939773
Protein GI	119869821
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.199454
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.144005
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCGGT TTCCCAAACC GCCAGAGGGC AGCTGGACGC AGCACTATCC GGAGCTCGGG 
ACGGGGCCGG TGTCCTATGA GGACTCGATC GATCCCGAGT TCTACGAGAT CGAGCGTAAG 
GCCGTCTTCA AGCGCGCCTG GCTCAACGTG GGACGGGTCG AACAGCTACC GCGCAAGGGC 
AGCTATTTCA CCAAAGAACT GAAGGTCGCG AACACCTCGA TCATCGTGGT GCGCACCGGC 
AGTGGTGAGG TCAAGGCGTA CCACAACATC TGCAGGCACC GCGGCAACAA GCTGGTGTGG 
AACGACATGC CGCTGGAAGA GACGAGTGGA GTCTGCCGGC AGTTCACCTG CAAGTACCAC 
GCCTGGCGCT ACGACCTCGA CGGCAACCTC ACGTTCGTGC AGCAGGAGGG CGAGTTCTTC 
GACCTCGACA AGAGCCGTTA CGGGCTGGTC GGTGTCCACT GCGACGTGTG GGAGGGCTTC 
ATCTTCGTCA ACTTCGCCGA ACAGCCCGAG CAGACACTGC GCGACTTCCT CGGACCGATG 
ATCACGAATC TCGAAGGCTA TCCGTTCGAC CGGATGACCT CGCGGTTCCA CTACCGCTCC 
GAGGTCAAGG CCAACTGGAA GCTCTACATG GACGCGTTCC AGGAGTTCTA CCACGCACCG 
GTGCTGCATG CGAACCAGTC ACCGACCGCG TACTCGAAGG CCGCGGCCGA AGCCGGTTTC 
GAAGCGCCGC ACTACCGCAT CGAAGGACCG CATCGGCTGG TCAGCACCTC GGGCGTGCGG 
GCCTGGGAGA TGGCCGACGA GATGCGCAAG CCGATCGAGG ACATCTGCCA GAGCGGGCTG 
TTCGGCCCGT GGGACAAACC GGATCTGGGG GAGATGCCCG CGGGGCTCAA CCCGGCGAAA 
TGCGATCCCT GGGGCCTGGA TTCGTTCCAG CTGTTCCCCA ACTTCGTCGT CCTGTTCTGG 
GGGCAGGGCT GGTATCTCAC GTACCACTAC TGGCCGACGT CGCACAACAC GCACATCTTC 
GAGGGCACGG TGTACTTCCC GCAGCCCCGC ACGGCGCGCG AACGCATCGC CCAGGAACTG 
GCCGCGGTGT CGTTCAAGGA GTACGGCCTG CAGGACGCCA ACACCCTGGA GGCCACCCAG 
TCGATGATCG AGTCGCGCGT GCTCGACAAC TTCGTGCTCT GCGATCAGGA GGTGCTGATC 
CGCCACCTGC ACAAGGAGAC CGCGGCCTGG GTCGAGGAGT ACCAGCGCAA GGCCCAGCAC 
GTCGGGCAGG GGGTGTGA

Protein sequence

MARFPKPPEG SWTQHYPELG TGPVSYEDSI DPEFYEIERK AVFKRAWLNV GRVEQLPRKG 
SYFTKELKVA NTSIIVVRTG SGEVKAYHNI CRHRGNKLVW NDMPLEETSG VCRQFTCKYH 
AWRYDLDGNL TFVQQEGEFF DLDKSRYGLV GVHCDVWEGF IFVNFAEQPE QTLRDFLGPM 
ITNLEGYPFD RMTSRFHYRS EVKANWKLYM DAFQEFYHAP VLHANQSPTA YSKAAAEAGF 
EAPHYRIEGP HRLVSTSGVR AWEMADEMRK PIEDICQSGL FGPWDKPDLG EMPAGLNPAK 
CDPWGLDSFQ LFPNFVVLFW GQGWYLTYHY WPTSHNTHIF EGTVYFPQPR TARERIAQEL 
AAVSFKEYGL QDANTLEATQ SMIESRVLDN FVLCDQEVLI RHLHKETAAW VEEYQRKAQH 
VGQGV