Gene Tpau_3706 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_3706
Symbol
ID	9157886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	+
Start bp	3825245
End bp	3826612
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	73%
IMG OID
Product	peptidase M20
Protein accession	YP_003648623
Protein GI	296141380
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.114919
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAGA CCAGCGTTCG AGACATCGTC CGCGGACTTC TCCCGCAGGC CCGCGCCGAT 
CTGGCGGAAC TGGTCGCGCT GCCCTCCGTG CACGCCTCTC CCGAATTCGG CGAGGAACCG 
AACCGGGCCG CCGCGCACTG GGTCGCCGAC GCCTTCGGCG GCGCCGGGAT CGAGAACATC 
GAGCAGATCT CGACATCGGA CGGATCGATC GCGGTGGTCG GCCACACCCC GGCGCCCGCC 
GGAGCCAAGA CCGTGCTCCT GTACAGCCAC TTCGATGTGC AGCCGCCCGG CCCCCGCGAG 
CAGTGGGAAT CCGATCCGTT CACCCTCACC TCGCGCCCGG GCCCGGGTGC CGGGGCCGAG 
CGCTGGTACG GGCGCGGCGC CGCCGACTGC AAGGGCAACC TGGTCGCGCA CCTCACCGCC 
CTGCGCGCCG TGCGGGAGGC CACGGGCGGC CTGCCGGTGG GGGTACGGGT CATCGTCGAG 
GGGTCCGAAG AGGGCGGCGG CGAGGGCCTC GACGATCTGA TCGCGCAGCG TCCCGACCTC 
GCCCACGCCG ATCTCATCCT CATCGCCGAC ACCGGCAACG TCGCTGTGGG ACGTCCGACG 
CTGACCACCT CGCTGCGGGG GGTCGCGAGC GTGCGGGTCG AACTCACCAC CGGCCGATCC 
GACCTGCACT CGGGCCAATT CGGCGGCGCC GCCCCCGATG CGCTCGCGGC ACTGATCGCG 
CTGCTGGCGA CGCTGCGCGA TGAACGCGGG AACACCACGA TCGACGGCCT CGACACCTCC 
GCCCGCTGGG CCGGCGAGCC CTACGACGAG GCTGCCTTCC GCGCTGACGC CGCGCTTGTC 
GACGGCACCG AGATACTCGG CTCCGGCCTG ATCGGCGATC AACTCTGGGC GCGACCGGCC 
GTCACCGTGA TCGGCCTCGA CGCCCCCGCC ACCGCCACTG CGGCAGCAGC GATCGCGCCC 
CGCGCCGCCG CGCTGCTGAA CCTGCGGGTA CCGCCGGGCA CCGATCCCCG CGCCGCGGGC 
GACCTGCTGG TCGCGCACCT GAAGGCGCAC ACGCCGTGGG GTGCGCACGT CGACGCCGAG 
GTGGAGTCCA CCGGCGAGCC CTTCGCCGCC GACACCACCG GCCCCGGCTA CGACGCCCTG 
CGCGCCGCCC TCACCGAGGC CTACGACGGT GCCGAGGTGG TCACCAGTGG CCAGGGCGGT 
TCGATCCCGC TGTGTACGCG GTTGCGCAAG GCCGCGCCGT CCGCCGAGAT CGCGCTGCTC 
GGCGTCGAGG AGCCGCTGTG CCGGATCCAC GCACCCAACG AATCGGTCGA CCCCCGCGAA 
CTGGAGCGGA CCGCGCTCGC CGAGGCGATC CTGCTGACCT CGCTGTGA

Protein sequence

MTETSVRDIV RGLLPQARAD LAELVALPSV HASPEFGEEP NRAAAHWVAD AFGGAGIENI 
EQISTSDGSI AVVGHTPAPA GAKTVLLYSH FDVQPPGPRE QWESDPFTLT SRPGPGAGAE 
RWYGRGAADC KGNLVAHLTA LRAVREATGG LPVGVRVIVE GSEEGGGEGL DDLIAQRPDL 
AHADLILIAD TGNVAVGRPT LTTSLRGVAS VRVELTTGRS DLHSGQFGGA APDALAALIA 
LLATLRDERG NTTIDGLDTS ARWAGEPYDE AAFRADAALV DGTEILGSGL IGDQLWARPA 
VTVIGLDAPA TATAAAAIAP RAAALLNLRV PPGTDPRAAG DLLVAHLKAH TPWGAHVDAE 
VESTGEPFAA DTTGPGYDAL RAALTEAYDG AEVVTSGQGG SIPLCTRLRK AAPSAEIALL 
GVEEPLCRIH APNESVDPRE LERTALAEAI LLTSL