Gene Mkms_2538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_2538
Symbol
ID	4616098
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	2666801
End bp	2667976
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	68%
IMG OID	639792206
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_938525
Protein GI	119868573
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1125] ABC-type proline/glycine betaine transport systems, ATPase components
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0404434
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.847899
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACAC AGTACGGTGC GACGGTGACC GATCCGTCCG GGGTGCGCAT CGAACTCGAC 
CACGTGTCCA AGGTCTATCC GGGTGCCACC GAACCCGCGG TCGACGACGC GTCGCTGGAC 
ATCCCGGCCG GTGAGATCGT CGTCTTCGTC GGCCCGTCCG GGTGCGGCAA GACGACGATG 
ATGCGAATGA TCAACCGGCT CTCCGAGCCG ACATCGGGCC GGATCCGCAT CGGCGACGTG 
GACGCGCTGT CGATCAAACC GACGGAACTG CGGCGCAAGA TCGGTTACTC CATCCAGCAG 
GCGGGTCTGT TCCCGCACAT GACGATCCGC CAGAACGTCG GACTGGTGCC CGGGCTGTTG 
CGCTGGGACC GCAAACGCAT CGCGTCGCGG GTCGACGAAC TGCTCGATCT GGTCGGACTC 
GATCCGGGGC AGTACGCCGA CCGGTATCCG CGCCAGTTGT CCGGCGGTCA GCAGCAGCGC 
GTCGGTGTCG CCCGGGCGCT GGCCGCCGAC CCTCCGGTGC TGTTGATGGA CGAACCGTTC 
GGCGCCGTCG ACCCGATCAC CCGCAGCACT CTGCAGGACG AATTGCTGCG CCTGCAAACC 
GAATTGCGCA AGACCATCGT GTTCGTCACC CACGACTTCG GCGAGGCGGT CAAACTCGGC 
GACCGGATCG CGGTGCTCGG GCCGCGGTCG AAGCTGCTGC AGTACGACAC CCCGCAGAAC 
ATCCTCGCCA ACCCTGCCGA CGAGACGGTG GCCGGATTCG TCGGGTCCGG CGCCTCGCTG 
CGCCAACTGG GGTTGATGCG GGTCAAGGAC ATCGAGTTGC GTCAGCACCT CGCGGTCCAC 
GCCGAGGACC CGGTCGAGCA GGTGCGCGAC CAGTTGGCGG CCGGCGACGC CGACTGGGCG 
GTCATTCTCG ACCAGCGGGA CCGCCCGGTG AAGTGGGTGC GCGAGAACCG GCTGCGGCAC 
GCCGCGTCGC TCTCGGAGGC CGCCGAGGAC CTCGACGTCG TCAGCACACA CTCCACCCTG 
GAGGACGCCC TCGAAGCCAT CCTCGCCGAA CAGCACGCGT CCGCGGTGGT CACCGGTGCC 
GGCGGCCGAT ACGCCGGTCT GGTCACCCTC GAGATGCTCA TCGACACCAT CACCCGGCTG 
CGCGCGGAGG CCAACGCGGA GAACCCGGAA CCGTGA

Protein sequence

MTTQYGATVT DPSGVRIELD HVSKVYPGAT EPAVDDASLD IPAGEIVVFV GPSGCGKTTM 
MRMINRLSEP TSGRIRIGDV DALSIKPTEL RRKIGYSIQQ AGLFPHMTIR QNVGLVPGLL 
RWDRKRIASR VDELLDLVGL DPGQYADRYP RQLSGGQQQR VGVARALAAD PPVLLMDEPF 
GAVDPITRST LQDELLRLQT ELRKTIVFVT HDFGEAVKLG DRIAVLGPRS KLLQYDTPQN 
ILANPADETV AGFVGSGASL RQLGLMRVKD IELRQHLAVH AEDPVEQVRD QLAAGDADWA 
VILDQRDRPV KWVRENRLRH AASLSEAAED LDVVSTHSTL EDALEAILAE QHASAVVTGA 
GGRYAGLVTL EMLIDTITRL RAEANAENPE P