Gene Mvan_5224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5224
Symbol
ID	4644325
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	-
Start bp	5593845
End bp	5595071
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	73%
IMG OID	639808699
Product	major facilitator superfamily transporter
Protein accession	YP_956001
Protein GI	120406172
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.469666
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.280666
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGTCG TCGCGGTCGC GGCGGCGACC ACCCGCCCGA GTGGTCGCAG CGCCCGCCGT 
TGGCTCGCGG TTGCCGCGGC GACCTTCGCC ATCGCGTGGG GCGGAAACGA GTTCACCCCG 
CTGCTGGTGA TGTATCGGAC CCAGGACGGC TTCTCCGCGC TGACCGTCGA TCTGCTGTTG 
TTCGCCTACG TGCTCGGCAT CGTGCCTGCG CTGCTCATCG GTGGGCCGCT GTCCGACCGC 
TTCGGTCGCC GGCCGCTGAT GTTGCCCGCG CCGGTGCTCG CCGCCGTCGG GTCGGCGATC 
CTGGCGCTCG GCGCACAGTC GGCGCCGGTG CTGGGAGTCG GACGGGTGTT CAGCGGCGTC 
GCCCTCGGCC TCGCGATGGC CGTCGGCGGC AGTTGGATCA AGGAGCTGTC CAGCCCGCCC 
TGGGAGGACG GTGACGCGGG CGCCCGTCGC GCCGCGATGA GTCTGACCGC CGGGTTCGGG 
CTGGGCGCCG GCACCGCAGG TGTGCTCGCC GAATGGGGTC CGGCGCCGAC GGTTCTTCCC 
TATGCGGTCA ACATCGCGAT GGCGCTCGCC GCGGCGGTGT TTGTGAGCAC CGCGCCCGAG 
ACACGGACCC GCCACGACTC GGGCCGCCCG TGGTGGACGG ACCTCGCGGT TCCGGGTGCG 
TCGCACCGCC GCTTCCTCTT GGTGGTCGTC CCCGTCGCTC CGTGGGTGTT CGGCGCGGGA 
GCGACGGCCT ATGCGGTGCT GCCCGCATTG ATGGCGGGGC GGGTGTCGTC GGCGCCCATC 
GCGTTCTCGG CGTTGATGTG CCTCGTCGCG CTCGGCGTCG GGTTCACCGT CCAGCAGTTG 
GGCCGCCACC TGGGCGCCGG TGGGCGCCGC GGAGTGGTCA CCGCGCTGGC GCTGCTGGTC 
GTCGGGATGC TGCTGGCCGG CTGGGCGGCG GCGGTGTTGA CGGTGTGGTC GGCACTGGTG 
GCGGCGGCGG TGCTCGGTGC CGGCTACGGG ATGGCGCTGT TGGCGGGCCT GCAGGAGATC 
CAGCGCATCG CCGGCCCCGA CGACCTCGCC GGTCTGACCG CGGTGTTCTA CAGCCTCAGC 
TACCTGGGCT TCGCGGTGCC TGCGGTGCTG GCGTTCGCGG TGCGATCGTT CAGCTATCCG 
GCGATGTTCG GCTTCGGGGC GTTCGCCGCG GCGGTGTGTC TGCTCGTCGC GGTGCTGGGA 
TCCCGGCGGA CGGCCGCAAT AAGCTGA

Protein sequence

MTVVAVAAAT TRPSGRSARR WLAVAAATFA IAWGGNEFTP LLVMYRTQDG FSALTVDLLL 
FAYVLGIVPA LLIGGPLSDR FGRRPLMLPA PVLAAVGSAI LALGAQSAPV LGVGRVFSGV 
ALGLAMAVGG SWIKELSSPP WEDGDAGARR AAMSLTAGFG LGAGTAGVLA EWGPAPTVLP 
YAVNIAMALA AAVFVSTAPE TRTRHDSGRP WWTDLAVPGA SHRRFLLVVV PVAPWVFGAG 
ATAYAVLPAL MAGRVSSAPI AFSALMCLVA LGVGFTVQQL GRHLGAGGRR GVVTALALLV 
VGMLLAGWAA AVLTVWSALV AAAVLGAGYG MALLAGLQEI QRIAGPDDLA GLTAVFYSLS 
YLGFAVPAVL AFAVRSFSYP AMFGFGAFAA AVCLLVAVLG SRRTAAIS