Gene Mvan_5040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_5040
Symbol
ID	4644777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	5393090
End bp	5394775
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	70%
IMG OID	639808511
Product	major facilitator superfamily transporter
Protein accession	YP_955818
Protein GI	120405989
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.16972
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGGAT CGCGGCGTGA CCACCGGGAC CCTGACGGTC AGCAGGGTGG ACGCTACTAC 
CCTCCCCGCC CGCCCGCGGG CGAACACCCG GGGATGGCCA ACTACCCCAG CGATCCGGCG 
ATGAGCCCGG GCAACCGCAG GTCCGGGCGC CCCGGCCCCT CGAGTCAGAG CGCGAATCGG 
TGGCTGCCTC CGCTCGATGA CAGCTCCCGC CCACACGGCC ATTCCTACCC GCCTCCCCCC 
GGCCGAGGCG CAGACGAGAA GGTCACGGTC ACGCGCGCAG CCGCGCAGCG CAGCCGCGAG 
ATGGGCTCCA AGATGTACGG CCTGGTGCAT CGCGCGGCCA CCGCGGACGG CGCGGACAAA 
TCCGGGCTGA CCGCGCTGAC GTGGCCGGTG GTCGCGAACT TCGCCGTCGA CGCCGCGATG 
GCCGTGGCCC TGGCCAACAC CCTGTTCTTC GCGGCGGCCT CCGGTGAAAG CAAGAGCCGC 
GTCGCGCTGT ACCTGCTCAT CACCATCGCC CCGTTCGCGG TCATCGCGCC GCTGATCGGA 
CCTGCGCTGG ACCGGCTGCA ACACGGCAGG CGGGTCGCCC TGGCGGCCTC GTTCTCGCTG 
CGCACCGTGC TGGCCGTCGT GCTCATCGCG AACTTCGACA GCGCGACGGG CAGTTTCCCG 
TCGTGGGTGC TCTACCCGTG CGCGCTCGGA ATGATGGTGT TGTCCAAGTC GTTCTCGGTG 
CTGCGCAGCG CCGTGACGCC ACGGGTGCTG CCGCCGACGA TCGACCTGGT CCGGGTGAAC 
TCCCGGTTGA CGACGTTCGG CCTGCTGGGC GGCACGATGA TCGGTGGGGG CATCGCCGCG 
GCCGCCGAAT GGGGCTTCCA GCTGTTCCAG ATGCCGGGGG CGCTGTACGT CGTGGTGGCG 
GTGACGATCG GCGGCGCGGT CCTGGCCATG CGGATCCCGA AATGGGTCGA GGTCACCGCG 
GGTGAGGTGC CCACGACCCT GAGCTATCAC GGTCAGACCG AGGGGCTTCG CCGGGAACCT 
CATGGAGCCG TGTCCGCTAA GACCCGCCAG CCGCTCGGCC GCAACATCAT CACCGCGCTG 
TGGGGCAACT GCACGGTCAA GGTGATGGTC GGTTTCCTGT TCCTGTATCC GGCCTTCGTC 
GCCAAGGCGC ACGACGCCAG CGGCTGGGAG CAGCTGCGAA TTCTGGGGAT GATCGGCGCC 
GCGGCCGCCG TCGGCAACTT CGCGGGCAAC TTCACCGCCG CCCGTCTCAA GCTCGGCCAT 
CCGGCGCGGC TTGTGGTGCG TTGCGCCACT GCGGTCACCG TGATGGCGTT GGCGACGGCA 
CTGTCCGGGA ACCTGCTGGT GGCCGCGGCC GCGACGCTCG TCACGTCCGG CGCCAGCGCC 
ATCGCCAAGG CCTCGCTGGA CGCCTCCCTG CAGGACGACC TGCCCGAGGA GTCGCGCGCG 
TCGGCGTTCG GCCGTTCCGA ATCGCTGCTG CAGCTGGCGT GGGTCGCCGG CGGCGCCACC 
GGAGTGCTGA TCTATACCGA GCTCTACGCG GGCTTCACCA CCATCACCGC GATCCTGATC 
CTCGGCTTGG CCCAAACCGT GCTGAGCTAT CGTGGCGAGT CACTGGTGCC GGGCTTCGGT 
GGTAACCGTC CGGTACTCGC CGAACAGGAA GGTGTTTGGA CGGATGCGGC GGTGACCCGC 
GAGTGA

Protein sequence

MTGSRRDHRD PDGQQGGRYY PPRPPAGEHP GMANYPSDPA MSPGNRRSGR PGPSSQSANR 
WLPPLDDSSR PHGHSYPPPP GRGADEKVTV TRAAAQRSRE MGSKMYGLVH RAATADGADK 
SGLTALTWPV VANFAVDAAM AVALANTLFF AAASGESKSR VALYLLITIA PFAVIAPLIG 
PALDRLQHGR RVALAASFSL RTVLAVVLIA NFDSATGSFP SWVLYPCALG MMVLSKSFSV 
LRSAVTPRVL PPTIDLVRVN SRLTTFGLLG GTMIGGGIAA AAEWGFQLFQ MPGALYVVVA 
VTIGGAVLAM RIPKWVEVTA GEVPTTLSYH GQTEGLRREP HGAVSAKTRQ PLGRNIITAL 
WGNCTVKVMV GFLFLYPAFV AKAHDASGWE QLRILGMIGA AAAVGNFAGN FTAARLKLGH 
PARLVVRCAT AVTVMALATA LSGNLLVAAA ATLVTSGASA IAKASLDASL QDDLPEESRA 
SAFGRSESLL QLAWVAGGAT GVLIYTELYA GFTTITAILI LGLAQTVLSY RGESLVPGFG 
GNRPVLAEQE GVWTDAAVTR E