Gene Mvan_4890 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_4890
Symbol
ID	4648823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	5236428
End bp	5237639
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	70%
IMG OID	639808361
Product	major facilitator superfamily transporter
Protein accession	YP_955669
Protein GI	120405840
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGACA CCCTCCATCG CCCGTCCGGC CCCGTGTCGG TGGCCGCACC CGATCCGGTG 
GTGCGCCGGC TCGCCGTGGT CGCGCTCGCA CTCGGCGGAT TCGGGATCGG CACCACCGAA 
TTCGTGGCAA TGGGTCTGCT TCCCGACATC GCGACCGGTA TGGGTGTCTC CGAACCCACA 
GCCGGCCATG TCATTTCGGC CTACGCCCTC GGGGTCGTGG TCGGTGCCCC GGTGATCGCG 
GCCGTCACGG CGCGGATGGC GCGGCGCAAG CTCCTGCTGG CGCTGATGGC GTTGTTCACC 
ATCGGCAACC TGGCCAGCAT GCTGGCGCCG ACCTACGAGA CATTGATCGC GGCCCGGTTC 
CTCGCGGGCC TGCCGCACGG CGCGTACTTC GGTGTCGCGG CCCTGGTCGC CGCGCACCTC 
ATGGGTCCGC AGAACCGGGC CAAGGCGGTC GCCCACGTAC TGACCGGCCT GACGGTCGCC 
ACGGTGCTCG GTGTACCGAT CGCGTCGTGG CTCGGCCAAT CCCTGGGCTG GCGAGCAGCT 
TTCGGGTTGG TGGTGGGTGT CGGCCTGGTC ACCTTGACGG CGCTGTGGTG CTGGCTGCCG 
TTCCAGCTGA AGTTCATGCG GGCCACCAGC CCGCTCACCG AACTCGGCGC GCTGCGCCGC 
CCCCAGGTGT GGCTGGCGCT TCTCGTCGGG ATGATCGGCT TCGGCGGCAT GTTCGCCGTC 
TACACCTACA TCACCACCAC CATGACCGAT GTGGCGGGCA TGCCGCGTGG CCTCGTCCCG 
TTGGCGCTGA TGATGTTCGG CCTCGGCATG GTGCTCGGCA ACCTCGTCGG CGGCCGGCTG 
GCCGACGGTT CGGTGGTCCG TGCGCTCTAC CTGTCACTGG GTGCGTTGTG CGGTGCGCTC 
GCCCTCTTCG TCGTCGCGTC GCACAACCCG TGGACCGCGC TGCTGGTGCT GTTCCTCATC 
GGGCTCACCG GTTCGGCGGT CGGCCCGGCG CTGCAGACCC GGCTGATGGA CGTCGCGCAC 
GACGCGCAGA CTCTGGCTGC GGCGCTGAAT CATTCGGCGC TCAACATCGG CAACGCGACG 
GGCGCGTGGG TCGGTGGCCT GGTGATCGCC GCGGGTCTCG GCTACACCGC CCCTGCCGCA 
GCGGGCGCGG TGCTGGCGCT CGCCGGTCTC GCGGTGCTCA CGGTCTCGGT CCTGCTGCAG 
AAACGCGGCT GA

Protein sequence

MTDTLHRPSG PVSVAAPDPV VRRLAVVALA LGGFGIGTTE FVAMGLLPDI ATGMGVSEPT 
AGHVISAYAL GVVVGAPVIA AVTARMARRK LLLALMALFT IGNLASMLAP TYETLIAARF 
LAGLPHGAYF GVAALVAAHL MGPQNRAKAV AHVLTGLTVA TVLGVPIASW LGQSLGWRAA 
FGLVVGVGLV TLTALWCWLP FQLKFMRATS PLTELGALRR PQVWLALLVG MIGFGGMFAV 
YTYITTTMTD VAGMPRGLVP LALMMFGLGM VLGNLVGGRL ADGSVVRALY LSLGALCGAL 
ALFVVASHNP WTALLVLFLI GLTGSAVGPA LQTRLMDVAH DAQTLAAALN HSALNIGNAT 
GAWVGGLVIA AGLGYTAPAA AGAVLALAGL AVLTVSVLLQ KRG