Gene Mkms_3540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3540
Symbol
ID	4611470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	3732989
End bp	3734365
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	68%
IMG OID	639793216
Product	hypothetical protein
Protein accession	YP_939524
Protein GI	119869572
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.228644
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGACCG CCGTCGTCGG AATTCTCGTA GGTTTTCTCG TCGTCTTGGC GATCACAGCG 
TTGACCGGAT ACTTCGTCGC GCAGGAATTC GCCTACATGG CGGTGGACCG GTCACGGCTC 
AAGGCCCGCG CTGAGGCGGG CGACCACGCA GCCGCCCGCG CGCTGACCGT CACCCGCCGC 
ACTTCGTTCA TGCTGTCGGG TGCCCAATTG GGCATCACGG TCACGGGACT GCTGGTCGGA 
TACGTCGCCG AACCGCTGAT CGGGCGCGGT CTGGAAACAC TGCTCGGCGG TGCCGGGATC 
CCGACCGCGG TGGCTGTCGG CATCGGCGGT CTCGTCGCAA TCGCGGTCTC GACGGTCGTG 
CAGATGGTCT TCGGAGAACT CTTCCCGAAG AACCTGGCGA TCGCCCGCCC CGAGCCGCTG 
GCCCGCTGGC TGGCGTTGTC GACAACGATC TATCTCAAGC TGTTCGGCTG GCTCATCTGG 
CTGTTCGACC AGTCGTCGAA CATGCTGCTG CGGCTTCTGC GCATCGAACC GGTGCATGAC 
GTCGAGCATT CGGCGACGCC GCGGGACCTC GAACACATCG TCGCCGCTTC CCGCGATGCC 
GGGGAGATCC CGCGGGAACT CTCCGCCCTG CTGGACCGTA TCCTCGACTT CCCCACCAGC 
ACCGCCGAAC ACGCGATGAT CCCGCGTTCG CGCGTCGACG TGGTCCGCGC CGACGAAGCC 
GTGCCGGATG TGCTGGAGCG CATGGCCCGC GGGCACACCC GCTATCCCGT CACCGGTTCC 
GGCCCTGACG ACGTCATCGG CGTGATCGAC CTACACGACC TGCTCGGCCC CTCTACCCAG 
TCCACAAGCG GCACCGCCGG TGCGCGCTGC CGCCCGGCCG TGGTCGTCCC GGAGACGCTC 
CCGCTGCCAA ACGTGGTGCG CGAATTGGCT CAGACCGGTG ACGAGATGGC GATCGTCATC 
GACGAATACG GCGGGTTCGC CGGAATCGTC ACCGTCGAGG ATCTGGCCGA GGAACTCGTC 
GGCGAGATCG ACGACGAACA CGACACCGAA TCGACGGCGG ACATCGTCGC CCGGGACGGC 
GGCTGGCTGC TCGCCGGCGA TCTACCACTC GACGAGGCCG AACGCACCCT CGGGCTGACG 
CTGCCGGAAG GCGACTACGA AACGGTCGCG GGCATGGTCA TCGCACACGC GGCCGGCCTA 
CCCGACGCCG GGGACACCGT CGTCATCGAA TTGCCCAGCG ACAATGCGGA TCTGCTCAAC 
GACGGCCCTG CGCCGGCGCG GCAGATCGTC GCGGAGGTGC GGGCCGTCGA CCGGCGGGTA 
CCGTCGCGTG TGTTGGTCAC CGTCGACACC CGCACGGAGG GGGGCGACGA TGAATAG

Protein sequence

MLTAVVGILV GFLVVLAITA LTGYFVAQEF AYMAVDRSRL KARAEAGDHA AARALTVTRR 
TSFMLSGAQL GITVTGLLVG YVAEPLIGRG LETLLGGAGI PTAVAVGIGG LVAIAVSTVV 
QMVFGELFPK NLAIARPEPL ARWLALSTTI YLKLFGWLIW LFDQSSNMLL RLLRIEPVHD 
VEHSATPRDL EHIVAASRDA GEIPRELSAL LDRILDFPTS TAEHAMIPRS RVDVVRADEA 
VPDVLERMAR GHTRYPVTGS GPDDVIGVID LHDLLGPSTQ STSGTAGARC RPAVVVPETL 
PLPNVVRELA QTGDEMAIVI DEYGGFAGIV TVEDLAEELV GEIDDEHDTE STADIVARDG 
GWLLAGDLPL DEAERTLGLT LPEGDYETVA GMVIAHAAGL PDAGDTVVIE LPSDNADLLN 
DGPAPARQIV AEVRAVDRRV PSRVLVTVDT RTEGGDDE