Gene Tpau_4220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_4220
Symbol
ID	9158408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	+
Start bp	4351634
End bp	4352959
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	73%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003649127
Protein GI	296141884
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.665807
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACAGTGA GCGGTCCGGG GTCGGACCCG CAGCCCCAGC AGGCGGCGTG GCGCACCTTC 
CGCGACCTCC CCGATCTGCT GCGGCTGCTC GGCGTCCGGT TGCTGAGCCA GTACGCCGAA 
GGCCTGTTCC AGGCGGCCCT GGGCAGCGCG ATCGTCTTCA ACCCGCAGCG CGGAGCGTCG 
CCCGCGGCGA TCGCGGCCGG GCTCGCCGTA CTGCTCCTGC CGTACTCCGC CGTCGGGCCG 
TTCGCCGGCG CGTTGCTCGA CCGGTGGGAC CGGCGCCGGG TTTTCATCGT CGCGAATCTG 
ATCCGCGCCG CGCTCATCGT GGTGTGCGCG GCGATCCTCG CATCGGGCGC CGGGGAGACG 
CCGATCTTCA TCGTCGCGCT CATCGTCGGC GGCGCCGGAC GCTTCGTGGC CTCCGGCCTG 
TCCGCATCGC TACCGCACGT CGTCGACCGC GACCAGCTGG TCGCGATGAA CTCGGTGACC 
ACCACCCTCG GCGCGGGCGC CACCGCACTG GGCGCCTCGA CCGCCGTAGG ACTGCGCGCG 
ATCTTCGGCC CCGACGATGA GGGCAGTGCC GCCGTACTCG GCTGCGCAGC CCTGATCGCC 
GTGGCCGGCG CGGCGCTCGC CTCCCGCTTC CCGGCCGGCG TACTGGGGCC CGACCACGAC 
CCCGCGCTGC CCGCCGAGCG GACCTCCGCG TTCCACGACC TCGTCACCGG CCTCGCGCAC 
GGCGCGGTCG CGGCCTGGCG CGCACCGTCG GTCACTGCGG CCCTGACCGG AATGGGCGCG 
CACCGCACCG TCTTCGGGTT CAACACGATG ATGCTGCTCC TGCTGACCCG GCACCACTTC 
ACCGACGGCA CCCTGGGCCT GGCCGGCTTC GGCGCCGTGG CCGGTGCCAC CGCCCTCGGT 
ATGTTCGCCG CCGCGGTGAT CATCCCGTTC GCGGTCGCCA AGGCGGGCCG GCGCATCACG 
GTGGTGGGAG CCCTGGCGAT CGCCTGCCTC ACCCAACTGA CGGTGCTCAC GCTCAACTTC 
GCCGTGCTGG TGTGCGCGGC TGCGGTACTC GGCCTGGCGG GGCAGGTGGT GAAGCTCTCC 
GCCGACGCAG CCATGCAGAT GGACGTGCCC GACGAGCGCC GCGGCCAGGT CTTCGCCTTT 
CAGGACGCAC TGTTCAATGT GACCTTCGTG GCCGCCGTCG CCTTCGCCGC CGCTGTGGTC 
CCGTACGACG GTGCCAGCCG ACCGCTCGCC CTCTTCGGGG CCGTGCTCTA CGCGGTGGCC 
GTGGTGGTGG TGCTGGCCCT GTACCGGCGG ACGGGAACCG AGGTCCCGGC CGGCGCGTCC 
AATTGA

Protein sequence

MTVSGPGSDP QPQQAAWRTF RDLPDLLRLL GVRLLSQYAE GLFQAALGSA IVFNPQRGAS 
PAAIAAGLAV LLLPYSAVGP FAGALLDRWD RRRVFIVANL IRAALIVVCA AILASGAGET 
PIFIVALIVG GAGRFVASGL SASLPHVVDR DQLVAMNSVT TTLGAGATAL GASTAVGLRA 
IFGPDDEGSA AVLGCAALIA VAGAALASRF PAGVLGPDHD PALPAERTSA FHDLVTGLAH 
GAVAAWRAPS VTAALTGMGA HRTVFGFNTM MLLLLTRHHF TDGTLGLAGF GAVAGATALG 
MFAAAVIIPF AVAKAGRRIT VVGALAIACL TQLTVLTLNF AVLVCAAAVL GLAGQVVKLS 
ADAAMQMDVP DERRGQVFAF QDALFNVTFV AAVAFAAAVV PYDGASRPLA LFGAVLYAVA 
VVVVLALYRR TGTEVPAGAS N