Gene DvMF_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_1049
Symbol
ID	7172945
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	+
Start bp	1275173
End bp	1276438
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	69%
IMG OID	643539556
Product	major facilitator superfamily MFS_1
Protein accession	YP_002435472
Protein GI	218886151
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	85
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTCCCT TTCCCGATCA CCAGGATCCC CGCGCCACCG GTCCGTTGCG GGTATTCCGC 
CATCGCAACT ACCGGCTGTT CTTCGCCGGG CAGGCCATTT CGCTGCCCGG CACCTGGATG 
CAGTCCATGG CCCAGTCGTG GCTGGTCTAC CGGCTGAGCG AATCCAGCTT CGTTCTGGGG 
GCGCTGGGCT TTGCCGCGCA ATTGCCGCTG TTCGTGCTGT CCGTGTTCGG CGGCGCGCTG 
GCCGACACGC GCGACAGGCG CGCCATACTG GTGGCCACGC AGGTGGCCTC CATGCTGCTG 
GCGCTGACTG CCGCCGCGCT GACCATGACC GACGTGGTGC AGGTGTGGCA CGTATTCGTG 
CTGGCCACGG CGCTCGGCAT CGTCAACGCC TTCGACGTGC CCACGCGGCA GTCCTTCATC 
ATGGACATGG TGGGGCGCGA CGATCTGCCC ACGGCCATCG GCCTCAACTC GTCCATGTTC 
AACGCGGCGC GTGTGGTCGG GCCAACCCTG GCGGGGCTGG TGGTGGCCGC CGCGGGCGAA 
GGGTGGTGCT TTCTGCTCAA CGGCATCAGC TTTGTGCCCG TCATCGCGGG GCTGATGATG 
ATGCGCCTGC CCGTCCACGT GCCCCCGCCG CCCGGCCCTT CCACGTTGCA GCGCATCCGC 
GAGGGGCTGG GCTTTGCCGC GCGCCACGAA GGTATCCGCA CCACCCTGCT GCTTGTGGGG 
GCCACCAGCC TCATCGCGGT GAACTATTCC GTGCTGATGC CGGTGGTGGC CGACAAGGTG 
CTGGGCGGCA ACGCCAGGAC ACTGGGCCTG CTGCTGGGGG CCGCCGGGGC GGGTGCGCTG 
CTGGGCGCGC TGTGCCTTGC CCTGCGGCGC AGCAGCGACG GGCTGTCACG ATGGGCGCTG 
TACGGGGCTG TTGGACTGGG GGCCAGCCTG ACGGCATTCG CGCTGTGCCG GTCGGTGTGG 
ACGGCGCTGG TGGCGCTGGT GCCCGTGGGC ATGTGCATGG TGGTGCTGAT GGCATCGGCC 
AACACGCTGC TGCAAATCAT GTCGCCCGAC GCCTACCGGG GCCGGGTCAT GGCCCTGTAT 
TCCATGATGT TCCTGGGCAT GGGGCCGTTC GGCTCGCTGC TTGGGGGCAG CGTTGCCCAT 
GCGCTGGGCC CATCGCTCAC GCTGCTGCTG TCCGGCATCG TCTGCCTGGG CAACGCGCTG 
TGGTTCGGGG TGTGGCTGCG GCGGCACGGC CCGTCGCTGG CTGGCGTGGG GCGCGAGACA 
AGTTGA

Protein sequence

MPPFPDHQDP RATGPLRVFR HRNYRLFFAG QAISLPGTWM QSMAQSWLVY RLSESSFVLG 
ALGFAAQLPL FVLSVFGGAL ADTRDRRAIL VATQVASMLL ALTAAALTMT DVVQVWHVFV 
LATALGIVNA FDVPTRQSFI MDMVGRDDLP TAIGLNSSMF NAARVVGPTL AGLVVAAAGE 
GWCFLLNGIS FVPVIAGLMM MRLPVHVPPP PGPSTLQRIR EGLGFAARHE GIRTTLLLVG 
ATSLIAVNYS VLMPVVADKV LGGNARTLGL LLGAAGAGAL LGALCLALRR SSDGLSRWAL 
YGAVGLGASL TAFALCRSVW TALVALVPVG MCMVVLMASA NTLLQIMSPD AYRGRVMALY 
SMMFLGMGPF GSLLGGSVAH ALGPSLTLLL SGIVCLGNAL WFGVWLRRHG PSLAGVGRET 
S