Gene Tpau_3744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_3744
Symbol
ID	9157924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	+
Start bp	3861972
End bp	3863369
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	66%
IMG OID
Product	General substrate transporter
Protein accession	YP_003648661
Protein GI	296141418
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGCGCAC GCGAACTCCC CACTGTCCCG AAGCCCCGGC TCCGCCGGGT CGCGATGGCC 
AGCTCGATCG GCACCACGAT CGAGTTCTAC GACTTCTTCA TCTACGGCAC CGCCGCCGCG 
CTGGTGTTCC CGACGATCTT CTTCTCGAAC ATGAGCCCGG GTGTGGCGAC GATGGCCTCG 
TTCGCCACGT TCGCCGTCGC CTTCTTCGCC CGGCCAGTGG GCGCGATCCT GTTCGGGCAC 
TTCGGCGATC GGATCGGCCG CAAGCGAACG CTGGTGTGGA CCCTGCTCAT CATGGGCTTC 
GCGACCGTCG TCATCGGGCT GCTGCCCGGC AGCGAGACCG GCGTCTTCGG GCTGTTTCCG 
AACGGCATCG GCACGCTGGC GCCCGTGCTG CTCGTGGTGA TGCGCTTCCT CCAGGGCTTC 
GCGGTGGGCG GCGAATGGGC CGGCGCCACG CTGCTGACCG CCGAATACGC CCCGAAGGGG 
CAGCGCGGTA AGTTCGCCAT GTACCCGCAG CTGGGTCCGG CCTTCGCGTT CTTCCTCTCC 
AGTGGCACCT TCCTGCTGTT CACCGTGACC GCGGGCAACA CCAAGGATGC CGACAGTGCC 
TTCATGACGA TCGGCTGGCG CGTGCCCTTC CTGCTCTCGG CACTGCTGGT GCTGGTGGGC 
CTGTGGGTGC GTCTCACCGT CGAAGAGACT CCGGTGTTCA CCGAGGTCCG CAAGCGCGCG 
ATGCAGGAGA TCCACCGCAC TAAGCTGCCC TTCCTGGATG CGATCCGCTT CCAGTGGAAG 
GAGATCCTGA TCGCCGGTGG CGCGCTGGCC TCGCTCTTCT CGCTGTTCTA CATGGGCACC 
GCATTCCTCA CGAACTACGC GACGAAGAAT CTCGGCTTCC CGCGCACCAC TGTGCTGGCG 
ATGGGAATGG TGGCCGCGGT GTTCTTCGGT CTCTCGATCG CCGCCTCGGC CGTGTACTCG 
GACACGATCG GGCGGCGCAA GGTGATCATG ACCTCGTGTG CACTGGCGGT GGTGTGGGCT 
CTGGTCCTGT TCCCGATTCT CGACACCAAG AACCTGGCGA TGTACGCACT CGGCCTGATC 
GGCACGCTGG TGATCTTCGG GATCGCGTAC GGCCCGGCCG GTGCGGCGCT GCCGGAGATG 
TTCCACGAGC GCTACCGCTA CACCGGGGCG GGTCTCGGCT ACAACCTCGC CGGCATACTC 
GGTGGCGCGA TCCCGCCGCT GATCGCCGCC AAGCTGGTCG AGGAGGGCCA CGTGCTGTGG 
GTGGGCGTGA TGCTCGCCGG GCTGTCCGCC GTGAGCGTGC TGTGTTGCTA CCTCATGGTC 
GAGACCAAGG ATCACGACAT CGTCGAGACC GCGGAAGAGC CCGCCCCGAC GGGAGATGAC 
GATCTGGCCT CGGTCTGA

Protein sequence

MSARELPTVP KPRLRRVAMA SSIGTTIEFY DFFIYGTAAA LVFPTIFFSN MSPGVATMAS 
FATFAVAFFA RPVGAILFGH FGDRIGRKRT LVWTLLIMGF ATVVIGLLPG SETGVFGLFP 
NGIGTLAPVL LVVMRFLQGF AVGGEWAGAT LLTAEYAPKG QRGKFAMYPQ LGPAFAFFLS 
SGTFLLFTVT AGNTKDADSA FMTIGWRVPF LLSALLVLVG LWVRLTVEET PVFTEVRKRA 
MQEIHRTKLP FLDAIRFQWK EILIAGGALA SLFSLFYMGT AFLTNYATKN LGFPRTTVLA 
MGMVAAVFFG LSIAASAVYS DTIGRRKVIM TSCALAVVWA LVLFPILDTK NLAMYALGLI 
GTLVIFGIAY GPAGAALPEM FHERYRYTGA GLGYNLAGIL GGAIPPLIAA KLVEEGHVLW 
VGVMLAGLSA VSVLCCYLMV ETKDHDIVET AEEPAPTGDD DLASV