Gene Dtpsy_1147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtpsy_1147
Symbol
ID	7384579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax ebreus TPSY
Kingdom	Bacteria
Replicon accession	NC_011992
Strand	+
Start bp	1205743
End bp	1207053
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	64%
IMG OID	643654468
Product	major facilitator superfamily MFS_1
Protein accession	YP_002552620
Protein GI	222110356
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00900] H+ Antiporter protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.114141
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCTCCG TCCTAAAGAA CCGCACCTAC CGCCACCTGT TCACCGCGCA GGTGATCGCA 
CTCGTCGGCA CAGGCCTGAT GACGGTAGCG CTCGGCCTAC TTGCCTACGA GCTGGCCGGG 
GCCGATGCAG GTGCGGTGCT CGGGTCGGCG CTGGCTATCA AGATGCTGGC CTATGTGGGA 
GTCGCTCCAG TCGCACAGGC CTTCGCCGAC CAGTTCCCGC GACGGTCATT GCTCGTAGCG 
CTGGACCTGG TACGAGCGGT TGTCGCGATC TGTTTGCCCT TTGTCACCGA GGTCTGGCAG 
ATCTATCTGC TGATCTTTGT CCTGCAAGCG GCATCCGCCG GCTTCACGCC GACTTTCCAA 
GCCACTATCC CGGACATCCT TCCCGATGAA GAGGACTACA CGAAGGCGCT GTCGCTGTCC 
CGGCTGGCCT ATGACCTGGA AAGCCTGATT TCCCCGATGC TGGCTGCTGC GCTGCTGACC 
GTCATCAGCT TTCACAACCT GTTCGCGGGA ACAGTGCTCG GTTTCCTCGT TTCAGCCGCG 
CTCGTGGTCA GCGTGCGGTT GCCCACAACT ATTCCCGGAC CGCGCCGCGG CATTTGGGAT 
CGCACGACCC GCGGCACACG CATCTATCTC GCTACGCCAC GCCTGCGGGG CCTGCTGGCG 
ATCAGCTTGG CCGTCTCGGC GGCGGGCGCC ATGGTGATCG TGAACACGGT GGTTCTCGTG 
AAGGCGCGCT TTGGCCTAGG CGAGGTCGAA GTGGCGTCGG CACTGGCGGC ATTCGGAGGC 
GGTTCGATGG TGGCAGCCTT CGTTCTGCCA TCCTTACTGG AAAAGGTGGC CGACCGAACC 
GCGATGCTCA CCGGCGCTAC CGTACTGGTC GTGGGCACGG GGATCGGCGC ACTGCTGCCG 
AGCTATGCAT TGTTGCTGCC GCTGTGGTTG ATCATCGGCT TTGGCTACAG CGTGGCGCAA 
ACGCCATCCG GCCGTCTTCT GCGCCGCTCG GCCCATGCCG AGGACCGTCC TGCGATCTTC 
GCGGCACACT TCGCGCTGTC GCACGCCTGT TGGCTCATCT GCTACCCACT TGCCGGCCGC 
TTCGGCGCGG TCATGGGCTT GCCATCGACC TTCATTGTCA TGTCCCTGGT CGGCTTGGCC 
GGCGTGGCGC TGACGCTCTG GCTGTGGCCG GCCAGCGACC CTTCTGACGT GGCGCATGAC 
CACCCCAGCT TGCCGCCGGA TCACCCTCAT TTACGCACAC ACGCAGACCA AGGCAGGCAC 
CATCACCAGC TGATTCTGGA TGACCTGCAC CGTATCTGGC CGAAAGGATA G

Protein sequence

MLSVLKNRTY RHLFTAQVIA LVGTGLMTVA LGLLAYELAG ADAGAVLGSA LAIKMLAYVG 
VAPVAQAFAD QFPRRSLLVA LDLVRAVVAI CLPFVTEVWQ IYLLIFVLQA ASAGFTPTFQ 
ATIPDILPDE EDYTKALSLS RLAYDLESLI SPMLAAALLT VISFHNLFAG TVLGFLVSAA 
LVVSVRLPTT IPGPRRGIWD RTTRGTRIYL ATPRLRGLLA ISLAVSAAGA MVIVNTVVLV 
KARFGLGEVE VASALAAFGG GSMVAAFVLP SLLEKVADRT AMLTGATVLV VGTGIGALLP 
SYALLLPLWL IIGFGYSVAQ TPSGRLLRRS AHAEDRPAIF AAHFALSHAC WLICYPLAGR 
FGAVMGLPST FIVMSLVGLA GVALTLWLWP ASDPSDVAHD HPSLPPDHPH LRTHADQGRH 
HHQLILDDLH RIWPKG