Gene Mmcs_0903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_0903
Symbol
ID	4109744
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	1002708
End bp	1003949
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	72%
IMG OID	638030025
Product	major facilitator transporter
Protein accession	YP_638075
Protein GI	108797878
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCGC AGACGACGGC GGCGCCGCAG GCGCGCGGTG CCCTCGGGCT GATGTTCGAC 
CCGGTCTTCG GGGCGTTGTT CTGGGGCAAG ATGTTCTCGG TCGTTGCCGT GTGGACGCAC 
GGCATCATCG CGGCGATCGT CATGTACGAG GCGACGGGTT CGGCGCTCAT GGTCGGCCTG 
GTCGGCGTCG TGCAGTTCGG ACCGCAGTTG ATCCTCAGCC CGGTCAGCGG CAAGTGGGCC 
GACACCGGCA ACCCGGCCCG GCAGATCCTG CTCGGCCGGG TGCTGTGCAT GGTGGGTTCC 
GGGTCGATCG CGGTGTGGTT GGCGATCACC GAGGCGCAGG CCGCGTTGGC GGTGCTGCTC 
GGCACGCTGC TGGTCGGGGT CGGGTTCGTG GTGGGCGGCC CGGCGATGCA GTCGATCGTG 
CCGAACCTCA TACGCACCGG CGAGCTGTCG ACGGCCATGG CGCTCAACAG CATTCCGATG 
ACGGTCGGCC GGATGATCGG CCCGGTCATC GGCGCCTACC TGGCCGCACA CCTCGGCTAC 
GCCGAAGGCT TCGCGGCCAG CGCGGGCCTG CACCTGATCT TCGCGATCTT CCTGCTGGTG 
GTCCGCTTCC CCGCTCCCCC GGTGCGGCGC GAAGGGGCGG ACTACCGCGT GCGCGCGGCG 
CTGAAGTACG TGTGGCGCGA CAAGCCGTTG TTCCTGGCCC TGCTGGCCGT CACGACGGTC 
GGGTTCGCCG CGGACTCGTC GATCACGCTG ACGCCGTCGA TGGCCGACGC GCTGGGCGGG 
GACACCCGAC TCGTCGGTGC GCTGTCGGCG GTGTTCGGCG TCGGCGCGGC GCTCGGCATG 
GCGGTGCTGG CGCTGTTGCG CGGACGGATC GCGGCCGGCT GGGTGTCGTC GGTCGGGTTG 
TGGCTGTTGT GCGCCGGATG CGCTGTCCTG GCGTTCGGGA CCGTGACGCC GGTGGCGGTG 
GCCGGGTTCT GGCTCGCCGG TCTCGGCTTC GGCTGGGCGA TGACGGGCCT GAGCACGGTG 
GTGCAGGAGC GGGCGCCCGA GGAGCTGCGG GGCCGGATCA TGGCGCTGTG GCTGGTCGGG 
TTCCTGGGCT CGCGACCCAT CGCGGCGGCC GTACTCGGCG GCGCGGCCGA CGCGGTGAAC 
GTGTTCGTGG CGTTCGGCAT CGCGGCGGCG TCGGTGGTGG GCGTCGCGGT GATGTGCCGG 
CCGTCGACGC TGATCGGCGG CCTGCCCGCT TCGCGAGACT GA

Protein sequence

MTAQTTAAPQ ARGALGLMFD PVFGALFWGK MFSVVAVWTH GIIAAIVMYE ATGSALMVGL 
VGVVQFGPQL ILSPVSGKWA DTGNPARQIL LGRVLCMVGS GSIAVWLAIT EAQAALAVLL 
GTLLVGVGFV VGGPAMQSIV PNLIRTGELS TAMALNSIPM TVGRMIGPVI GAYLAAHLGY 
AEGFAASAGL HLIFAIFLLV VRFPAPPVRR EGADYRVRAA LKYVWRDKPL FLALLAVTTV 
GFAADSSITL TPSMADALGG DTRLVGALSA VFGVGAALGM AVLALLRGRI AAGWVSSVGL 
WLLCAGCAVL AFGTVTPVAV AGFWLAGLGF GWAMTGLSTV VQERAPEELR GRIMALWLVG 
FLGSRPIAAA VLGGAADAVN VFVAFGIAAA SVVGVAVMCR PSTLIGGLPA SRD