Gene Mkms_3066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3066
Symbol
ID	4610900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	3209104
End bp	3210315
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	67%
IMG OID	639792736
Product	extracellular ligand-binding receptor
Protein accession	YP_939050
Protein GI	119869098
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.755308
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCGGTC GCGTGGCACG GAACGCATTC GCTTTCGGAA GTGCGGGGCT GTTGGCGCTC 
GCGCTCGGCG CCTGCAGTCA ATCGACACCC GAAGAGGAAG CGGCGCAGAC GAATCTGAAG 
ATCGTCGAGC AGGTCCAGAT CGACGAGAAC GGCGCGGAGG TCAAGGCCGC CGAAGGAGCC 
GCCCCGGCGG ATCCCGCCGG TGACGGCAAG GCGACCTGCC CACCGCTGTC GATCGCGATG 
GCCGGGGCGC TCAACGGCCC GGACGCGGCC CTGGGCATCA ACATCAAGAA CGGTGTGCAG 
CTCGCCGTCG ACAAGCACAA CGCGGCCAAC CCCGGCTGCC AGGTCCAGCT CAAGACGTTC 
GACACCGAGG GTGACCCGCA GAAGGCCAGC GCGATCGCCC CGCAGATCGT CGACGACCAG 
TACACGATCG GCCTTGTCGG CCCGGCCTTC TCGGGTGAGA CCAACGCCAC CGGCGACGTG 
TTCAACCAGG CCGGCCTGGT CGCGGCCACC GCCTCGGCCA CCAACGTCAC GCTGTCGGAG 
AAGGGGTGGC GGACGTTCTT CCGCGGCCTG GCCAACGACG GTGTGCAGGG CCCGTCGGTC 
GCCAACTACC TGAAGAACAC GCTCGGTCAC CAGAAGGTGT GCGTCGTCGA CGACAGCACC 
GACTACGGTT TGGGCCTGGC TCAGGCGGTC CGCGAAACCC TCGGGCCGGT CGCCGATCCG 
GCGTGCAACA TCTCGGTGAA GAAGGGCGAC AAGGACTTCT CCGCCGCCGT CACCCAGGTC 
AAGGGGGCGA GCCCGCAGTC GGTGTTCTTC AGCGGCTACT ACGCCGAGGC GGCGCCGTTC 
GTCCAGCAGC TCAAGGACGG CGGTTTCGAG GGCACGTTCG TCAGCGCCGA CGGCACCAAG 
GATCCGGAGT TCGTCAAGCA GGCCGGTGAG GCGTCCAAGG ACGCGCTGCT GTCGTGCCCG 
TGCGGCCCGG CCACCGGCGG CTTCGCCGAC GAGTACAACC AGAAGTTCGG CCAGGAGCCC 
GGCACCTACA GCACCGAGGG ATACGACCTG GGCACCATCC TGGTCAAGGG CATCGATTCC 
GGGGCCATCA CCCGCCAGGC GCTGCTGGAC TACGTGCGCA ACTACAACGG CCAGGGTGTG 
GCGCGCAACT ATCAGTGGAC ACCGCAGGGT GAGCTCACCA CCACCCTGAT CTGGATGTAC 
AAGGTCCAGT GA

Protein sequence

MRGRVARNAF AFGSAGLLAL ALGACSQSTP EEEAAQTNLK IVEQVQIDEN GAEVKAAEGA 
APADPAGDGK ATCPPLSIAM AGALNGPDAA LGINIKNGVQ LAVDKHNAAN PGCQVQLKTF 
DTEGDPQKAS AIAPQIVDDQ YTIGLVGPAF SGETNATGDV FNQAGLVAAT ASATNVTLSE 
KGWRTFFRGL ANDGVQGPSV ANYLKNTLGH QKVCVVDDST DYGLGLAQAV RETLGPVADP 
ACNISVKKGD KDFSAAVTQV KGASPQSVFF SGYYAEAAPF VQQLKDGGFE GTFVSADGTK 
DPEFVKQAGE ASKDALLSCP CGPATGGFAD EYNQKFGQEP GTYSTEGYDL GTILVKGIDS 
GAITRQALLD YVRNYNGQGV ARNYQWTPQG ELTTTLIWMY KVQ