Gene Tpau_0210 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_0210
Symbol
ID	9154344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	+
Start bp	223887
End bp	225317
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	69%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003645203
Protein GI	296137960
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTGAGG TCAACCGAGA AAAACCGGTT GAATACGCCG TCGTCCGGCG GCATCGTAGA 
AAGGTGCATA CCGACCTCGG CTCCCGCCAG CATGTGCCCC GCATGCTGCG GCCTTTGCTG 
CGCCGGGACT ACCGCCTCCT GTTCGTCACG CTGCTCTGTG CGCTGACCAC CGACGGCATG 
TGGCTGGTCT CCGTGGTGTG GCAGGTGATC GACATGGGCG GCTCGGCCAC CAGCGTCTCG 
TTGGTCTCGG GGGCGGCCTC GGTGGGTTTG CTGGTGTCCA CCCTCGCCGG CGGTGTGCTC 
GCGGACCGGG TCTCGCAGCA GCGCATCCTG TTCGTACTGG AGCTGCTCAA GGTCGTGGTG 
ATCGGTGGCG TGGGCGTGCT CGCGTTGACC GGTGCCATCA CGATTCCCCT GTTGATGGCG 
GGCTCGCTGG CGCTGGGCCT GGTGTCGGGT TTCTACTTTC CCGCGTACTC CGCGCTGGTA 
CCGCGGCTGG TCCCGCCCGA CGAACTGCTC GCCGTCAACG GCTACGAGTC GGCGGTACGT 
CCGGCCGCCG CGATGGCCGT CGGTCCCGCT GTCGCGGCGT GGATCATCGC CGTCGCCTCG 
CCCGGTGCCG CGCTGCTGGT GGGCGGCGCG ATCTGCCTGT TCGCCGCGTT ATGGGTGGTG 
CGGATCCGCG TCCCGCGGAC CGAAGCGGCC GATGAGGCGG AACCCGGTTC GCCGCTGCGC 
GAGCTGTGGG AGGGCATCAA GTACGTGCGC CAGACCCCGT GGCTGCTGGC GACGCTGCTG 
TTCGCGAGCC TGATGGTGCT GGTCACCGTG GGGCCGATCG ACGTGCTGTT GCCCTTCGCC 
ATCAAGGATC AGGCGCACGG CGCCGCGAGT GAGCACTCGA TGATCCTGGC CGCGTACGGT 
TTCGGTGGGG TGGCGGGTGC GCTGTTCATG GCGGCCCGCA GGATGCCCCG CCGCTACCTC 
ACGGTGATGA TGGGCGTGTG GGGCATCGCG TCGCTGCCGA TGCTGGTGTT CGGTATCGCC 
GAGAGCGTGT GGCCCATGGT GATCGCGGGC TTCGTGCTGG GCGTGCTGTT CGAGGCTCCG 
GTGGTGATCT GGGGCACCCT GTTGCAGCGC CGCGTGCCGC GGCGGCTGCT GGGCCGGGTC 
TCGAGCCTGG ACTTCTTCGT TTCGCTCGTG TTCATGCCGG TGTCCTTCGC GCTCGCCGGT 
CCGGTGAGCC AGGCGATCGG TCTCACCGCG ACCTTCGTGC TGGCCGCGCT GGTCCCGGTG 
CCGCTCGCGG TGATCGCGAT CCTGGCCGCG CGGATGCCGC AGGACGAACT GGCCCACCCC 
CTGGTCGACG AGGATGACGA GGACGACGGC ACAGGTGCGG CGGGCGACGC CGCCGACGCG 
CCGGTTACGC CCACCGTGAA CGCTCCGGCA CCCGAGGGCA CCGTCGGATA G

Protein sequence

MVEVNREKPV EYAVVRRHRR KVHTDLGSRQ HVPRMLRPLL RRDYRLLFVT LLCALTTDGM 
WLVSVVWQVI DMGGSATSVS LVSGAASVGL LVSTLAGGVL ADRVSQQRIL FVLELLKVVV 
IGGVGVLALT GAITIPLLMA GSLALGLVSG FYFPAYSALV PRLVPPDELL AVNGYESAVR 
PAAAMAVGPA VAAWIIAVAS PGAALLVGGA ICLFAALWVV RIRVPRTEAA DEAEPGSPLR 
ELWEGIKYVR QTPWLLATLL FASLMVLVTV GPIDVLLPFA IKDQAHGAAS EHSMILAAYG 
FGGVAGALFM AARRMPRRYL TVMMGVWGIA SLPMLVFGIA ESVWPMVIAG FVLGVLFEAP 
VVIWGTLLQR RVPRRLLGRV SSLDFFVSLV FMPVSFALAG PVSQAIGLTA TFVLAALVPV 
PLAVIAILAA RMPQDELAHP LVDEDDEDDG TGAAGDAADA PVTPTVNAPA PEGTVG