Gene Mmcs_2868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_2868
Symbol
ID	4111700
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	3034570
End bp	3035769
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	72%
IMG OID	638031992
Product	major facilitator transporter
Protein accession	YP_640031
Protein GI	108799834
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTCCG GAGTGCTCGA CGTGACCGCG GTGCGCGCCC GCCGTGCCCG GGTCGCGGTG 
GCCGCGCAGT TCCTCACCAA CGGGGCGTTG TTCGCGAACC TGCTGCCGCG CTTTCCGGAG 
ATCAAGACCG ATCTGGCGCT GTCGAATGCC GTGTACGGGC TCACGATTGC CGCGTTCTCC 
GCGGGGGCGT TCGTCGCCGG CCTCACCGCA GCCGCCCTGA TCCGCCGCTT CAGTTCGGCG 
CGCGTCGCGG TCGGGGGAAC CATCGCCATC GCGGTCTTCG TCTTCGCGGC CGGGCTCGCG 
CCGTCGGCGG TGCTGGTGGC CTGTGCGCTG TTCCTGGCGG GCGCGTCCGA CGCGGTCACC 
GATGTGGCGC AGAACGCGCA TGCCCTTCGG GTCCAGCGCA TCTACGGCCG ATCCATCATC 
AACTCGGTGC ACGCCGTGTG GGCCGGCGGC GCGGTCCTCG GCGGCCTCAT GGGCGCGGCG 
GCGATCGCCC TGCACATCCC GCGGCCGGTG CACCTCGGGG TGGCCGCCGT CGTGTTCACC 
GGTGTGGTGC TGGTCGCCTA CCGCTTCATG CTGCCGGGCG CCGACCAGGA CGACCATCCG 
GCGTCCGGGT ATGCCGAGGG CGAGCGCGCC GGCCGGAGGG TGTACCTCGT GCTGGTCGCG 
CTGGCCGTCA TCGCCATCGC AGGGGCGATG GTCGAGGACG CCGGAAGTTC GTGGGCCACC 
TTGTATCTGC GCGACAGTGT CGGCGCACCG GGGGCGATCG CGGCGTTCGG GTACATCGCC 
CTCGCGGCGT TCATGTTCGT CGGCCGGCTC ATCGGCGACC GGCTGGTCGA CCGGTTCGGC 
GAAACCGCGG TGGCCCGGGC CGGGGGAGCG CTGGCCGCGG CCGGGATGGG TGTGGCGCTG 
GCCTTCCCGA GCGTTCCCGC GACGATCGCC GGCTTCGCCG CCGCCGGACT CGGCGTGGCC 
ACCGCGATCC CGGCGGCCAT GCACGGCGCC GATCAGCTTC CGGGACTGCG ACCGGGGACC 
GGTCTGACCA TCGTCACGTG GCTGCTGCGG ATCGGCTTCC TGGCCTCACC GCCACTCGTC 
GGCCTGATCG CCGACTGGAC CAGTCTGCGG ATCGGACTGC TGACCGTGCC GGTTGCCGGG 
CTGGTGATCA TGGTGCTCGC GGGTGCGCTC AATGTGAGAG GCCGGCCAGT TCGATCGTGA

Protein sequence

MASGVLDVTA VRARRARVAV AAQFLTNGAL FANLLPRFPE IKTDLALSNA VYGLTIAAFS 
AGAFVAGLTA AALIRRFSSA RVAVGGTIAI AVFVFAAGLA PSAVLVACAL FLAGASDAVT 
DVAQNAHALR VQRIYGRSII NSVHAVWAGG AVLGGLMGAA AIALHIPRPV HLGVAAVVFT 
GVVLVAYRFM LPGADQDDHP ASGYAEGERA GRRVYLVLVA LAVIAIAGAM VEDAGSSWAT 
LYLRDSVGAP GAIAAFGYIA LAAFMFVGRL IGDRLVDRFG ETAVARAGGA LAAAGMGVAL 
AFPSVPATIA GFAAAGLGVA TAIPAAMHGA DQLPGLRPGT GLTIVTWLLR IGFLASPPLV 
GLIADWTSLR IGLLTVPVAG LVIMVLAGAL NVRGRPVRS