Gene Mkms_3351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3351
Symbol
ID	4611277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	3513740
End bp	3515632
Gene Length	1893 bp
Protein Length	630 aa
Translation table	11
GC content	74%
IMG OID	639793024
Product	hypothetical protein
Protein accession	YP_939335
Protein GI	119869383
COG category	[L] Replication, recombination and repair
COG ID	[COG0322] Nuclease subunit of the excinuclease complex [COG2176] DNA polymerase III, alpha subunit (gram-positive type)
TIGRFAM ID	[TIGR00573] exonuclease, DNA polymerase III, epsilon subunit family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.477195
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0699162
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCAGG GCAGCGTCGG TGCCGTCGGG GGCGCGGCCG AGCAGCTGTC GTTCGACATG 
GAGGCGCTGT CGCTGCGCGA CACCACGTTC GTCGTCGTGG ACCTGGAGAC CACCGGCGGT 
CGCGCCACGG GTGAGCGTCC GGATGCGATC ACCGAGATCG GCGCGGTCAA GGTCCGCGGC 
GGTGAGGTGC TCGGTGAGCT CGCCACCCTG GTCGACCCCG GGCGGGCGAT ACCGCCGCAG 
ATCGTCTCGC TGACCGGCAT CACCACCGCG ATGGTGTGCG CCGCCCCCCG CATCGAATCG 
GTGCTGCCCG CATTCCTCGA GTTCGCGCGC GGCTCGGTGC TGGTGGCCCA CAACGCCGGC 
TTCGACATCG GCTTCCTGCG GGCGGCGGCC GAACAGTGCG CGCTGACCTG GCCCCGCCCG 
CCGGTGCTGT GCACGGTCAA GCTCGCGCGC CGCGTGCTCA CCCGCGACGA GGCGCCCAGC 
GTGCGGCTGT CAGCGCTGGC GCAGTTGTTC CGCGCGAAGA CGACGCCGAC GCACCGGGCC 
CTCGACGATG CCCGCGCCAC GGTGGACGTA CTGCACGGGC TGATCGAACG GATCGGCAAC 
CAGGGCGTGC ACACCTACAC CGACCTGCGC GCCTACCTGC CCGACGTCAC CCCCGCGCAG 
CGCCGCAACC GCCGCCTCGC CGACGGTCTG CCCCACCGGC CGGGGGTGTA CCTGTTCCGC 
GGCCCGGGCG ACGAGGTGCT CTACATCGGC ACCGCGGTGG ACCTGCGCCG CCGCGTCGGC 
CAGTACTTCA CCGGAGCCGA CCCGCGGGCG CGGATGAAGG AGATGGCGTC CCTGGCCACC 
CGCGTGGACC ACGTGGAATG CGCCCACGAA CTCGAGGCGG GCGTGCGTGA GCTGCGCCTG 
CTGGCCGCCC ATGCGCCGCC CTACAACCGG CGTTCGAAGT TCCCGCAGCG CTGGTGGTGG 
GTGGTGCTGA CCGACGAGCC CTTCCCGCGG TTCTCGGTCG TGCGCGCACC CCGTCACGGT 
TCGGCGGTCG GGCCGTTCCG GGCCCGCACG GACGCCGTGC AGACCGCTGA ACTGCTCGCC 
CGGTTCACCG GTGTGCGGAC CTGCACCGCC CGGCTCGCCC GCGCGGCCCG GCACGGCGCG 
GCCTGCGCCG AGCGTGAACT GTCACCGTGC CCGGCGCCGC GCGACATCGA CGCGGCGGCC 
TACGCCCCGG CCCACCGCCG CGCCGCCGAC CTCATCGAGG GCCGCGACGA TGCGGCGCTG 
GCCGCGGTGG TCGACGGGAT CGCCGCGCTG GCGGCCGTCA ACCGGTACGA ATCGGCCGCG 
CGCCTGCGTG ACCACGCCGC CACGGGCATC GACGTGCTGT GGCGGGGGCA GCGACTGCGT 
GCGCTCGCCG ACCAGACCGA GTTGGTCGCG GCCCGTCCGG ACGGCAGCGG TGGATGGGAC 
CTCGCCGTCG TGCGGTACGG ACGCCTGGCC GCCGCCGGGT GCGCCCGTCG CGGGGTGCCG 
CCGATGCCGG TCGTCGACGC GCTGACCGCC GCGGCGCAGA CGGTGCTGCC CGATCCCGCC 
CCGCTTGGCG GTGCGCTGGT CGAGGAGACC GGGCTGATCA CCCGCTGGCT CACCAGCCCC 
GGTGTGCGGA TCGTGCGGTG CGAACCCGGG TACGCCACAC CGATCGGCGC GGCGGGCCGC 
TGGCTGGGCT GGGCGGATAC GGCGCGTTCG GCACGGTTGG CCGCCGAGCA GACCGGTGCG 
GACGCGAGGA CCAGAGAGTC GGTCCCCTCA GAGCTTCTGG GTGAACCGCA CCCAACGCGC 
GAGCAGCTTT TCGGCCGCCC CGGAGTCGAT GGTCTCGGTC GCCCGGGCCA GGCCCGCCTC 
CCAGGCCGGC ACCCATTTGG CGTCGCTGGA TAG

Protein sequence

MGQGSVGAVG GAAEQLSFDM EALSLRDTTF VVVDLETTGG RATGERPDAI TEIGAVKVRG 
GEVLGELATL VDPGRAIPPQ IVSLTGITTA MVCAAPRIES VLPAFLEFAR GSVLVAHNAG 
FDIGFLRAAA EQCALTWPRP PVLCTVKLAR RVLTRDEAPS VRLSALAQLF RAKTTPTHRA 
LDDARATVDV LHGLIERIGN QGVHTYTDLR AYLPDVTPAQ RRNRRLADGL PHRPGVYLFR 
GPGDEVLYIG TAVDLRRRVG QYFTGADPRA RMKEMASLAT RVDHVECAHE LEAGVRELRL 
LAAHAPPYNR RSKFPQRWWW VVLTDEPFPR FSVVRAPRHG SAVGPFRART DAVQTAELLA 
RFTGVRTCTA RLARAARHGA ACAERELSPC PAPRDIDAAA YAPAHRRAAD LIEGRDDAAL 
AAVVDGIAAL AAVNRYESAA RLRDHAATGI DVLWRGQRLR ALADQTELVA ARPDGSGGWD 
LAVVRYGRLA AAGCARRGVP PMPVVDALTA AAQTVLPDPA PLGGALVEET GLITRWLTSP 
GVRIVRCEPG YATPIGAAGR WLGWADTARS ARLAAEQTGA DARTRESVPS ELLGEPHPTR 
EQLFGRPGVD GLGRPGQARL PGRHPFGVAG