Gene Tpau_4036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_4036
Symbol
ID	9158220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	-
Start bp	4165867
End bp	4167180
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	66%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003648946
Protein GI	296141703
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.16141
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAGCA GTCACAACCG GTCCCGCCGT GCGGGGCTCG CCGCGTTCGT CGGCACCACG 
ATCGAGTGGT ACGACTTCTA CGTCTACGCC ACCGCCGCCG CACTGGTCTT CGGTCCGCTG 
TTCTTCCCGA GTGACAATGC GGTCGCGGAG ACGGCGGCGG CGTTCGCGAC CTTCGCCATC 
GCCTTCGTGG TCCGGCCGGT CGGCGCGATC CTGTTCGGCC ACATCGGTGA TCGGCTCGGA 
CGACGACGCT CGCTCGTGCT GACTCTCCTG CTGATGGGCG TCTCGACGGT GCTCGTGGGC 
GTGCTGCCCA CCCACGCCCA GGTGGGAATC TGGGCACCGA TCATGCTCAT CGCGCTGCGG 
GCGATGCAGG GCCTGGCCGT GGGAGGTGAG TGGGGTGGCG CGGTGCTGAT GAGTGTCGAG 
CATGCACCGG CGAAGTCCAA GACCTTCTAC GGGGGCTTCA CTCAGCTGGG GAATCCCGCA 
GGCGCGCTTC TCGCCTCGGG AATCTTCGCG CTGATGTCGC GCCTCGGTGA CGACTTCATC 
CTCAATGGTG GGTGGCGCAT CCCGTTCTTG CTGTCGATCG TCCTGATCGC GGTCGGCTTC 
TGGGTCCGGT ACCGCGTCGA GGAATCGCCG GTCTTCGAGG CCGAAGTGCA GGGCAAGCAG 
CAGGAGCTGC CACTGCGGTC CGCGCTGCGC TCGAATCGTC TCGCCATCGT GCTGGGCATC 
GGCATCCTGC CGATCTCCAC CGGCGGCTAC TACCTGGCAA CAACTTTCGC CACGTCCTAT 
GCCACGGGCG AGACGATCCG GATGTCCGAA CGGGTCATCC TCGACGCCAT GACGGTGGCG 
TCCCTCGTGG AATTCTTGGT GACCCTGCCG GTGGCCTGGC TGGGCGACAA ATGGGGTCGC 
AAGAACGTGA TGTACATCGG CTTGGCGGCA TCGGTGCTCA CCTTCGCGCC GTTCCTGTTG 
ATCCTGCCGG GGCACGTCGA ACCCCTGGTC TTCCTGCTGG CTTCACTCGT CCGCGTGGCG 
CTCAGCGCCA CCTACGCACC GCTCGCCGCG ATCATGTCCC AGCTGTTTCC GCCTGGGGCG 
CGCTACACCT CGGTCGCCCT CACCTACGGG CTGGGAGCGG CCATCTGGGC GGGATTCTCG 
CCCTGGTTCG CGACCATGCT GCTCGGCTGG ACGGGATCGA TCTGGTCGGT GATCGCCATG 
TTCACCGTGA TGGCGGCCAT TGCGACGGTC TGCACGTACT TCGCACCCCA ATATGTTGAT 
GCCGAGCCGG ATTCCGCACC CGACGGGACC GTCTCCGAGA GGACCGCCGC ATGA

Protein sequence

MSSSHNRSRR AGLAAFVGTT IEWYDFYVYA TAAALVFGPL FFPSDNAVAE TAAAFATFAI 
AFVVRPVGAI LFGHIGDRLG RRRSLVLTLL LMGVSTVLVG VLPTHAQVGI WAPIMLIALR 
AMQGLAVGGE WGGAVLMSVE HAPAKSKTFY GGFTQLGNPA GALLASGIFA LMSRLGDDFI 
LNGGWRIPFL LSIVLIAVGF WVRYRVEESP VFEAEVQGKQ QELPLRSALR SNRLAIVLGI 
GILPISTGGY YLATTFATSY ATGETIRMSE RVILDAMTVA SLVEFLVTLP VAWLGDKWGR 
KNVMYIGLAA SVLTFAPFLL ILPGHVEPLV FLLASLVRVA LSATYAPLAA IMSQLFPPGA 
RYTSVALTYG LGAAIWAGFS PWFATMLLGW TGSIWSVIAM FTVMAAIATV CTYFAPQYVD 
AEPDSAPDGT VSERTAA