Gene Mkms_3224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3224
Symbol
ID	4611148
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	3381010
End bp	3382080
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	72%
IMG OID	639792895
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_939208
Protein GI	119869256
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.425254
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGGCT ACCACGCGCT GCGGCGGGTG CTGTTCCTGA TCTCCCCCGA GCGCATCCAC 
ACCTGGGTTT TCGCGCTGCT TCGCGCCGTC ACCACACCGG ACCTCCTGCG TCGCGCACTG 
CAGGGCCGGC TCGCCCCCCG CGATCCCGTG CTGGCCAGCA CCGTGTTCGG CGTGCGCTTC 
CCGGGGCCGC TCGGGCTGGC GGCCGGTTTC GACAAGGACG GTCGCGGCCT GCACACCTGG 
CCCGCACTCG GATTCGGGTA CGCCGAGGTG GGCACCGTCA CCGCCCACCC GCAGCCCGGT 
AACCCCGAAC CGCGGTTGTT CCGTCTGCCC GAGGACCGGG CGCTGCTCAA CCGCATGGGA 
TTCAACAACG ACGGCGCCGC CCGGCTCGCG CAGCGCCTCA CCCGCCACAC CTCCGACGCC 
CCCGTCGGCG TGAACATCGG CAAGACCAAG GCGACCCCCG CCGACCGAGC CGTCGAGGAC 
TACGCCCAGA GCGCCCGCCA ACTCGGCCCG CTCGCCACCT TTCTCGTGGT CAACGTCAGC 
TCGCCGAACA CGCCGGGCCT GCGTGACCTG CAGGCGGTGG AATCGTTGCG GCCCATTCTG 
ACCGCGGTGC GCGCCCAGAC CTCGACACCG GTGCTGGTGA AGATCGCCCC CGACCTGTCC 
GACGCCGACG TCGACGAGAT CGCCGACCTG GCAGTCGAAC TGGGGTTGGC CGGCATCGTG 
GCCACCAACA CCACGATCTC GCGCGCGGGG CTGAAGACCC CCGGCGTCGA AGAGCTCGGC 
CCCGGCGGGG TGTCCGGTGC CCCGGTCGCC GCCCGCTCCC TCGAGGTGCT GCGCCGGCTG 
TACCGCCGGG CGGGTGACCG GCTGGTGCTG ATCAGCGTCG GGGGTATCGA GACCGCCGAC 
GACGCCTGGG AGCGCATCAC CTCGGGCGCC TCACTGCTGC AGGGGTACAC CGGTTTCGTC 
TACGGGGGCG GCCTGTGGGC CAAGCACATT CACGACGGGC TGGCGACCCG GCTGCGCGCG 
GAGGGCTTCA CCTCACTGTC CGATGCAGTG GGCTCCGCGA TGCGGCAGTG A

Protein sequence

MTGYHALRRV LFLISPERIH TWVFALLRAV TTPDLLRRAL QGRLAPRDPV LASTVFGVRF 
PGPLGLAAGF DKDGRGLHTW PALGFGYAEV GTVTAHPQPG NPEPRLFRLP EDRALLNRMG 
FNNDGAARLA QRLTRHTSDA PVGVNIGKTK ATPADRAVED YAQSARQLGP LATFLVVNVS 
SPNTPGLRDL QAVESLRPIL TAVRAQTSTP VLVKIAPDLS DADVDEIADL AVELGLAGIV 
ATNTTISRAG LKTPGVEELG PGGVSGAPVA ARSLEVLRRL YRRAGDRLVL ISVGGIETAD 
DAWERITSGA SLLQGYTGFV YGGGLWAKHI HDGLATRLRA EGFTSLSDAV GSAMRQ