Gene Tmz1t_1851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_1851
Symbol
ID	7084274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	2084539
End bp	2085870
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	71%
IMG OID	643698874
Product	major facilitator superfamily MFS_1
Protein accession	YP_002355499
Protein GI	217970265
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0650056
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGAGC CCCCACGCGC GCTGCGTTCG CTGCCCCCCG AGGGGGCTGG ATCCTCCGTG 
GGGCGGCCCG GCGGAGGCCC GCAACACGCC GCGCGCAACT ACGCCGTCGT CACCGCCGCC 
TACTGGGGCT TCACGCTCAC CGACGGCGCG CTGCGCATGC TGGTGCTGCT GCATTTCTAT 
CGCCTGGGCT ACTCGCCGTT CACGCTCGCC TTCCTGTTCC TGCTCTACGA GGCGGCCGGT 
GTGCTGGCGA ACCTGGTCGG CGGCTGGCTG GCGACGCAAC ACGGCATCGC GCGCATGCTG 
GCGGTGGGGC TGGTCACGCA GATTCTCGGC TTTGGCCTGC TGTCCGCGCT CGACCCCGGA 
TGGACAGCAA CGATGGCGGT GGCCTGGGTG GTGGTGGCGC AGGGCATCTG CGGCGTGGCC 
AAGGACCTGA CCAAGACGGC CAGCAAGTCG GCGATCAAGC TCACTCAGGC CCAGTTCCAG 
GCCGAGGCCA ACGAGCAGGG CGCGGGCCAG CTCTTCAAGT GGGTGGCCTG GTTCACCGGC 
AGCAAGAACG CGATGAAGGG CATCGGCTTC TTCCTCGGCG GGGTGCTGCT GGAGGTGCTC 
GGCTTTCGTG GTGCGCTGTG GGCGATGGCG GGCTTGCTGG CGTTGGTGCT CGCTGGCGTG 
CTGCTGGCGC TGCCGCCGAT GATGGGCAGG AAGAAGGCGT CGGGCTCGGT GCGCGAGCTG 
TTCGCCAAGA GCCCCGGCAT CAACGCGCTG GCCGCGGCGC GCGTGGCGCT GTTCGGCGCG 
CGCGATGTGT GGTTCGTGGT CGGGGTGCCG GTGTTCCTGT ACTCGGCGGG GTGGACCTTC 
ACGATGGTCG GCACCTTCCT CGCCGGGTGG ACGATCGCCT ACGGCCTGGT GCAGGCGCTG 
GCGCCGCAGA TCGTCCGCCG CAGTGCCGAT GGCCTGAGCC GCGAGGTGCC GGCGGCACGG 
CTGTGGTCGG CGCTGCTGGC GCTGATTCCC GCCGCGCTCG CGGTGGCAGT GTGGCTGCAG 
GTGCCCGGCC TGGAGTGGGT GGTGGTCGGC GGCCTCGGCC TGTTCGGCTT CGCCTTCGCG 
GTCAACTCCT CGGTGCATTC CTACCTGGTG CTGGCCTACG CGGGCTCGGA GAAGGCGGCG 
GAGGACGTCG GTTTCTATTA CGCTGCGAAC GCGCTCGGGC GCTTCATCGG CACGCTGCTG 
TCGGGACTGC TGTACCAGTG GGGCGGCTTG CCGTACGCGC TCGTCGGCTC GGCGGCGATG 
CTGCTGGGGT GCTGGCTGGT GACGCTGGCG TTGCCGCTCG AACGCCATGA CGCCGCCCGG 
GCGGCCCCCT GA

Protein sequence

MNEPPRALRS LPPEGAGSSV GRPGGGPQHA ARNYAVVTAA YWGFTLTDGA LRMLVLLHFY 
RLGYSPFTLA FLFLLYEAAG VLANLVGGWL ATQHGIARML AVGLVTQILG FGLLSALDPG 
WTATMAVAWV VVAQGICGVA KDLTKTASKS AIKLTQAQFQ AEANEQGAGQ LFKWVAWFTG 
SKNAMKGIGF FLGGVLLEVL GFRGALWAMA GLLALVLAGV LLALPPMMGR KKASGSVREL 
FAKSPGINAL AAARVALFGA RDVWFVVGVP VFLYSAGWTF TMVGTFLAGW TIAYGLVQAL 
APQIVRRSAD GLSREVPAAR LWSALLALIP AALAVAVWLQ VPGLEWVVVG GLGLFGFAFA 
VNSSVHSYLV LAYAGSEKAA EDVGFYYAAN ALGRFIGTLL SGLLYQWGGL PYALVGSAAM 
LLGCWLVTLA LPLERHDAAR AAP