Gene Dtpsy_2000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtpsy_2000
Symbol
ID	7382119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax ebreus TPSY
Kingdom	Bacteria
Replicon accession	NC_011992
Strand	-
Start bp	2137886
End bp	2139292
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	72%
IMG OID	643655318
Product	major facilitator superfamily MFS_1
Protein accession	YP_002553456
Protein GI	222111192
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0919237
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGCT TACCCGTGGG TGCGCCGCCC CTGGCCGACG GCCTGCCGCA GCCCGCACGC 
CGCCAGGCGA TGCTGGTCAT CGTTCTCGGG CTCACGCTGG CGGTGCTCGA CAGCAGCATC 
GTCAACCTGG CGCTGCCCGA CATCGCACGC CAGTTGCAGT CGGGCGCGGC GCAGAGCGTG 
TGGGTGGTCA ACGCCTACCA GCTCGCCACG CTGGTCGTGC TGCTGCCGCT GGCCGCGCTG 
GGTGAGCGCG TGGGCTACCG GCGCGTGTAC TTGGTGGGCA TGGCGCTGTT CGCGCTGGCG 
TCGGTGGGCG CCATGCTGGC GGCCAGCATG CCCGCCTTGA TTGCCGCGCG GGCGTTGCAG 
GGCCTGGGCG CCGCGGGCGT GATGGCCGTG AATGCGGCGC TGGTGCGCCT GATCTATCCG 
CGCGCACAGC TGGGCCACGG CATGGCCATC AATTCGCTGG TGGTGGCCAC CGCGTCCATG 
GCGGGGCCGT CGGTGGCGGC GGCCATCCTG TCGGTGGCGT CGTGGCCCTG GCTGTTTGCC 
ATGAACCTGC CCTTGGGCGT GGGAGTCTGG TGGCTGGGGT GGCGCGCGCT GCCGGTCAAT 
CCTCCATCCG CCAACCATGC GCCGCGCTTT TCCGCCATCG ACGTGCTACT CAACGGCGCC 
ATGTTCACGC TGCTGTTCCT GGGCGGGGAG CAACTGGGCG TGCGCAGCGC GGCGCAGGGC 
GGCAGCGCGG CTACGGGTGC GATCCTGCTG GCCGCGGGTG TGGCCGTGGG GGCGGTGTTC 
CTGTGGCGCC AGCGCGGCTT GGCGGCGCCG CTGTTTCCGG TGGACCTGCT GCGCATTCCG 
GTGTTCGCCC TGTCGATGGG CTCGTCCGTG GGGGCGTTCT GCGCGCAGAT GCTGGGCTTT 
CTGTCGCTGC CCTTCCTGCT GTTGGAGGCG CAGGGCCGCA CCCACTTGGA GGCCGGACTG 
CTCATTACGG CCTGGCCCCT GGCCACCGCC GTGGTGGCGC CGCTGGCGGG CCGATTGATT 
GGCCGCTACC CGGACGGCCT GCTCGGCGGC ATTGGCATGG CGGTGTTTGC TGCCGGCCTG 
GTCTCGCTGG GCCTGATGCC CGCGCAGCCC GCGGACTGGA ACGTGGCCTG GCGCATGGCG 
CTGTGCGGTG CGGGCTTTGC GCTGTTTCAG TCGCCCAACA ATCACACCAT CGTCACCTCG 
GCCCCGCTGC ACCGCAGCGG CGCGGCCAGC GGCATGCTGG GCACCGCGCG CCTGACGGGC 
CAGACACTGG GCGCCGTGTC GCTCGCGGCC ATCTTCGCCC TGCGGCCGGG GCACGATGGA 
AGCGCGGAGT CGCTGGCACT GCTGGTGGCA GGGGCGTGCG CGGTGGTGGC AGGGGTGTGC 
AGCTCGCTGC GGGTGAGGCA GCGGTAA

Protein sequence

MSGLPVGAPP LADGLPQPAR RQAMLVIVLG LTLAVLDSSI VNLALPDIAR QLQSGAAQSV 
WVVNAYQLAT LVVLLPLAAL GERVGYRRVY LVGMALFALA SVGAMLAASM PALIAARALQ 
GLGAAGVMAV NAALVRLIYP RAQLGHGMAI NSLVVATASM AGPSVAAAIL SVASWPWLFA 
MNLPLGVGVW WLGWRALPVN PPSANHAPRF SAIDVLLNGA MFTLLFLGGE QLGVRSAAQG 
GSAATGAILL AAGVAVGAVF LWRQRGLAAP LFPVDLLRIP VFALSMGSSV GAFCAQMLGF 
LSLPFLLLEA QGRTHLEAGL LITAWPLATA VVAPLAGRLI GRYPDGLLGG IGMAVFAAGL 
VSLGLMPAQP ADWNVAWRMA LCGAGFALFQ SPNNHTIVTS APLHRSGAAS GMLGTARLTG 
QTLGAVSLAA IFALRPGHDG SAESLALLVA GACAVVAGVC SSLRVRQR