Gene Dtpsy_1156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtpsy_1156
Symbol
ID	7384588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax ebreus TPSY
Kingdom	Bacteria
Replicon accession	NC_011992
Strand	+
Start bp	1218944
End bp	1220125
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	68%
IMG OID	643654477
Product	major facilitator superfamily MFS_1
Protein accession	YP_002552629
Protein GI	222110365
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0686413
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGACC AGAGCATCAC GCGCCGAAAC ATCGGCGTTC TCACCGCCGC GCAGGCGCTC 
GGCGGCGCCA GCGCGCCCAT CGTGATGTCG CTGGGTGGGC TGGTCGGCCA GCAGCTTGCC 
AAGAATTCGG CCTGGATCAC CTTGCCCGTG AGTCTGTTCG GCCTGGGTCT TGCCATCGGC 
ACCTTGCCTG CCGCCTTCAT CATGCGGCAC CATGGCCGCC GCAACGGATA CGTGGTGGGG 
GTCGGCTTCG GCGTGGCCTC GGGCCTGATC GCCGCGTTGG GCATCATGCT GGCCTCGTTC 
TGGATCTTCT GCGCCGGCAC CTTCCTGGCG GGCTTCTACG GCGCGTATGT GCAGAGCTAC 
CGCTTCGCAG CCGCCGACAC CGCCGAGGAC GCGCTTAAGG CCAAGGCCAT TTCCTGGGTC 
ATGGTGGGCG GTCTCGCGGG CGCCATCATC GGGCCGCAGT TGGTGATCTT CACGCGCGAT 
GCGGTAGCGG GCACGCCCTA CGTTGGCAGC TTCCTCAGCC AGGCGCTGCT GCCGCTGATC 
GCCTTGCCGA TCCTGCTGAT GCTGCGCACG CCGAGCCAGA CCCAGGCCGA AGCAGTCGCC 
GATAGCGGTC GGACGGTGCT GCAGCTCTTG GCGATGCCGC GCTATCTGCT GGCCGTGGCT 
GCGGGCGTGG TGTCCTATGG GGTGATGGCG TTCGTGATGA CGGCCGCGCC GGTGGCGATG 
GTCAACCACG GGCATTCGGT GGACAACGCC GCCCTAGGAA TACAGTGGCA CCTGCTGGCG 
ATGTTCGGGC CGAGCTTCTT CACCGGGCGA CTGATGGTGC GCTACGGCAA GGAGCGCGTG 
ACCGCCGTCG GCATGGTGCT GCTCGCCGCC TCCGGGGTGG TGGCCCTGGG CGGGCTCGGC 
CTGTCCCACT TCTGGGGCTC GCTGGCGCTG TTGGGCATCG GCTGGAATTT GAGTTTCATC 
GGCGCCACGG CGATGGTCAC CGACTGCCAC ACCCCGGCCG AGCGGGGCAA GGCGCAGGGC 
ATGAACGACT TCTTCGTCTT CGCCGCCACG GCGGCCGTGT CGTTCCTCGC GGGGTCGATC 
CTGCACAGCT CGGGCTGGCA AGCGGTCAAC TGGATGATCT TCCCGGCCTT GGCGCTGATC 
TTGGTGCCGC TGCTGTGGCA GGGGCGGTAC GGTTGCAACT GA

Protein sequence

MTDQSITRRN IGVLTAAQAL GGASAPIVMS LGGLVGQQLA KNSAWITLPV SLFGLGLAIG 
TLPAAFIMRH HGRRNGYVVG VGFGVASGLI AALGIMLASF WIFCAGTFLA GFYGAYVQSY 
RFAAADTAED ALKAKAISWV MVGGLAGAII GPQLVIFTRD AVAGTPYVGS FLSQALLPLI 
ALPILLMLRT PSQTQAEAVA DSGRTVLQLL AMPRYLLAVA AGVVSYGVMA FVMTAAPVAM 
VNHGHSVDNA ALGIQWHLLA MFGPSFFTGR LMVRYGKERV TAVGMVLLAA SGVVALGGLG 
LSHFWGSLAL LGIGWNLSFI GATAMVTDCH TPAERGKAQG MNDFFVFAAT AAVSFLAGSI 
LHSSGWQAVN WMIFPALALI LVPLLWQGRY GCN