Gene Mmcs_3020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_3020
Symbol
ID	4111852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	3191216
End bp	3192427
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	67%
IMG OID	638032149
Product	extracellular ligand-binding receptor
Protein accession	YP_640183
Protein GI	108799986
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCGGTC GCGTGGCACG GAACGCATTC GCTTTCGGAA GTGCGGGGCT GTTGGCGCTC 
GCGCTCGGCG CCTGCAGTCA ATCGACACCC GAAGAGGAAG CGGCGCAGAC GAATCTGAAG 
ATCGTCGAGC AGGTCCAGAT CGACGAGAAC GGCGCGGAGG TCAAGGCCGC CGAAGGAGCC 
GCCCCGGCGG ATCCCGCCGG TGACGGCAAG GCGACCTGCC CACCGCTGTC GATCGCGATG 
GCCGGGGCGC TCAACGGCCC GGACGCGGCC CTGGGCATCA ACATCAAGAA CGGTGTGCAG 
CTCGCCGTCG ACAAGCACAA CGCGGCCAAC CCCGGCTGCC AGGTCCAGCT CAAGACGTTC 
GACACCGAGG GTGACCCGCA GAAGGCCAGC GCGATCGCCC CGCAGATCGT CGACGACCAG 
TACACGATCG GCCTTGTCGG CCCGGCCTTC TCGGGTGAGA CCAACGCCAC CGGCGACGTG 
TTCAACCAGG CCGGCCTGGT CGCGGCCACC GCCTCGGCCA CCAACGTCAC GCTGTCGGAG 
AAGGGGTGGC GGACGTTCTT CCGCGGCCTG GCCAACGACG GTGTGCAGGG CCCGTCGGTC 
GCCAACTACC TGAAGAACAC GCTCGGTCAC CAGAAGGTGT GCGTCGTCGA CGACAGCACC 
GACTACGGTT TGGGCCTGGC TCAGGCGGTC CGCGAAACCC TCGGGCCGGT CGCCGATCCG 
GCGTGCAACA TCTCGGTGAA GAAGGGCGAC AAGGACTTCT CCGCCGCCGT CACCCAGGTC 
AAGGGGGCGA GCCCGCAGTC GGTGTTCTTC AGCGGCTACT ACGCCGAGGC GGCGCCGTTC 
GTCCAGCAGC TCAAGGACGG CGGTTTCGAG GGCACGTTCG TCAGCGCCGA CGGCACCAAG 
GATCCGGAGT TCGTCAAGCA GGCCGGTGAG GCGTCCAAGG ACGCGCTGCT GTCGTGCCCG 
TGCGGCCCGG CCACCGGCGG CTTCGCCGAC GAGTACAACC AGAAGTTCGG CCAGGAGCCC 
GGCACCTACA GCACCGAGGG ATACGACCTG GGCACCATCC TGGTCAAGGG CATCGATTCC 
GGGGCCATCA CCCGCCAGGC GCTGCTGGAC TACGTGCGCA ACTACAACGG CCAGGGTGTG 
GCGCGCAACT ATCAGTGGAC ACCGCAGGGT GAGCTCACCA CCACCCTGAT CTGGATGTAC 
AAGGTCCAGT GA

Protein sequence

MRGRVARNAF AFGSAGLLAL ALGACSQSTP EEEAAQTNLK IVEQVQIDEN GAEVKAAEGA 
APADPAGDGK ATCPPLSIAM AGALNGPDAA LGINIKNGVQ LAVDKHNAAN PGCQVQLKTF 
DTEGDPQKAS AIAPQIVDDQ YTIGLVGPAF SGETNATGDV FNQAGLVAAT ASATNVTLSE 
KGWRTFFRGL ANDGVQGPSV ANYLKNTLGH QKVCVVDDST DYGLGLAQAV RETLGPVADP 
ACNISVKKGD KDFSAAVTQV KGASPQSVFF SGYYAEAAPF VQQLKDGGFE GTFVSADGTK 
DPEFVKQAGE ASKDALLSCP CGPATGGFAD EYNQKFGQEP GTYSTEGYDL GTILVKGIDS 
GAITRQALLD YVRNYNGQGV ARNYQWTPQG ELTTTLIWMY KVQ