Gene Mkms_4989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_4989
Symbol
ID	4612666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	5228865
End bp	5229857
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	70%
IMG OID	639794681
Product	DNA polymerase III subunit epsilon
Protein accession	YP_940968
Protein GI	119871016
COG category	[L] Replication, recombination and repair
COG ID	[COG0847] DNA polymerase III, epsilon subunit and related 3'-5' exonucleases
TIGRFAM ID	[TIGR00573] exonuclease, DNA polymerase III, epsilon subunit family

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGAGCC ACGGTTGGGG AAGACCGGCG GTCGACACCG GTACAGGCTG GGCCGTCGTC 
GATGTCGAGA CGTCGGGTTT CCGGCCCGGG CAGGCGCGCA TCGTCAGCCT GGCCGCACTC 
GCGGTGGGTG ACGACGGCAA CGTCGAACAG AGCCTGGCCA CCCTGCTGAA TCCGGGTGTC 
GACCCGGGGC CCACGCATGT GCACGGGCTG ACCGCCGAGA TGCTCGAGGG TGCGCCCCGC 
TTCGGTGACG TCGTCGCCGA CCTCGCCGAA CTGCTGCGCG GTCGCACGCT CGTCGCGCAC 
AACGTCGGAT TCGACTACTC GTTCCTGACC GCCGAGGCCG AACTCGTCGG CGCGGAACTG 
CCGATCGACT CGGTGATGTG CACCGTCGAA CTCGCCCGCC GCCTCGACCT GGGGACGGAG 
AACCTGCGGT TGGAGACCCT CGCGGCGCAC TGGGGTGTGC CGCAACTCAA ACCGCACGAT 
GCGCTCGACG ACGCTCAGGT CCTCGCGCAG ATCCTCAAAC CGACGCTGGC GCGCGCCCGC 
GAGCGCAGGG CCTGGCTGCC GACGCGTTCG GTGAGCCGGC GGCGGTGGCC CAACGGCCGG 
GTCACCCACG ACGACCTGCA CCCGTTGAGG ATGGTGGCCG CGCGGCTGCC CTGCGCGTAC 
CTGAATCCCG GCCGCTACAT CGCGGGCCGC CCGCTGGTGA AAGGTATGCG CGTCGCGGTC 
GCCGCGGAGG TCACGCGCAC TTACGAAGAG CTGATCGAGC GGTTGCTCAC CGCCGGGCTG 
GCCTACACCG ACGCGGTGGA CACGGAGACC TCACTGGTCA TCTGCAACCA GCCCGATGTC 
GAACAGGGCA AGGGCTACCA GGCTCAGGAG CTCGGCGTCC CGGTGCTCTC GGACGCCGAC 
TTCCTGCGGG CCCTCGACCA CGTCGTCGGG GGCACCGGTA TCGAGGAGTT CTTCGACGCC 
ACCACGGTCG GCGATCAGTT CGCGCTGTTC TAG

Protein sequence

MVSHGWGRPA VDTGTGWAVV DVETSGFRPG QARIVSLAAL AVGDDGNVEQ SLATLLNPGV 
DPGPTHVHGL TAEMLEGAPR FGDVVADLAE LLRGRTLVAH NVGFDYSFLT AEAELVGAEL 
PIDSVMCTVE LARRLDLGTE NLRLETLAAH WGVPQLKPHD ALDDAQVLAQ ILKPTLARAR 
ERRAWLPTRS VSRRRWPNGR VTHDDLHPLR MVAARLPCAY LNPGRYIAGR PLVKGMRVAV 
AAEVTRTYEE LIERLLTAGL AYTDAVDTET SLVICNQPDV EQGKGYQAQE LGVPVLSDAD 
FLRALDHVVG GTGIEEFFDA TTVGDQFALF