Gene Tpau_0052 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_0052
Symbol
ID	9154186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	-
Start bp	52982
End bp	54580
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	70%
IMG OID
Product	exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase
Protein accession	YP_003645045
Protein GI	296137802
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.444086
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAAC TGTCGTCCGA GACGTCCGGA CCCCACGCTC ATCGGGGTGT CACCACACAC 
CCGACCCTGC CGCCTCATCC GCCCCGCACG AGCCCCACGG CACCGGCTTC CGATGTGCCC 
GCCGCACCCC CCGTGTCACC CGATACCGCG AGCCTGGCGG ACACCGGCGC GGCGCCGGAA 
CCGCCCGCCA CGACCGGCTC CAGGAGCGTG CCGCGCGGCG CCGTCCTCAC CGATGACATC 
GTCGTCGCCA CCGTCGCCGC TGCCTCGGGT TCCGTCGCCG CGATCGCCGC CGGTGTACCC 
GCGGCCACGG CCGTCGCCGT GATCATCGCG ATCCACGCCG TCTGGGTGGG GGCGCTGAGC 
TCGTCGCGCA CCCTCGCCGT GCCACTACTG CGGCTCGGCT CGGCCGAGTT CCGGCACGTC 
CTCCGCGCGA CCGCCGTGGT CTTCGGTATC ACCGGCATCG TCGAGGCGTA CCTGCACGTG 
CCGCTGCTAC AGGCGGTCAT CCGCGCATCG CTTCCCGTCG CGCTCGGCGG AGTACTGCTG 
TGCCGGATGC TGTGGGGCCG CCGCGTGCGC ACCCAGACCG ACCAGGAGTT CCGGACACCG 
ACGCTCGTGG TGGGCAGCTT CTTCGCGACG CGGGCCACCG CGGCCGCCCT GCTGCGCGAG 
GGGCGGTCGG GCGCCGAGGT GGTGGGCGCG TGCCTGCCGG AGGGCGAATC CGAACTCTAC 
GAGTCGATTC CGCTCGACGA CGGGACCGCG ATACCCGTGG TCGGGTCCGA CCAGACCCTG 
CTCGCCGCGA TCGACCGGAC GGGGGCTCGC GCCGTCGCGC TCACCCCGAC CGACACCCTG 
GGCCCCGGCG ATCTGCGCAA GCTCATCTGG GAACTCGATG AGAAGCAGGT CGAGCTGGTC 
CTCGTGCCCG GCGTCGTCGA CGTGGCCGGA CATCGCGTGG TGTACCAATC CGTGAGCGGT 
ATGCCGATGC TGTCGATCGC GCGGCCCCAG CACCGCCGGG CCGACAGCAT GGCCAAGCGC 
ACCTTCGACA TCGTCTTCGC CACGATCGCC CTCCTGTTCA CCTTTCCGGT CACCCTGGCC 
GTGGCGATCG CCGTCAAGAT CGATTCCCGG GGCCCGCTGT TCTACAGCGC CGAGCGGGTG 
GGCGCCGGCG GGAAGACCTT CCACATGGTG AAGTTCCGCA GCATGGTCGA CGGTGCCGAC 
AGCTACCGGG ACGCACTCGC CGACAAGGAC ATCGGTGCCG GCGTGCTGTT CAAGATCCCG 
GACGATCCCC GGGTCACGCG GATCGGTCGC ATCGTGCGCC GCTACAGCAT CGACGAGCTT 
CCACAGTTCA TCAACGTCCT CAAGGGCGAG ATGTCCGTGG TCGGACCGCG ACCGGCACTC 
CCCGCCGAGG TCGCCCAGTA TCCGCCCGTG ATGCGGCGGC GGCACCTGGT CAAACCCGGA 
ATCACCGGAG CCTGGCAGGT CAGCGGTCGC TCGGACCTGT CCTGGGACGA ATCGGTCCGG 
CTCGACGTGG GTTACGTCGA GAACTGGTCG CTGTTCACCG ACCTGTCGAT CGTGGCTCGC 
ACCGTGGGCA CCGTGGTCGG ATCGAGTGGC GCATACTGA

Protein sequence

MTELSSETSG PHAHRGVTTH PTLPPHPPRT SPTAPASDVP AAPPVSPDTA SLADTGAAPE 
PPATTGSRSV PRGAVLTDDI VVATVAAASG SVAAIAAGVP AATAVAVIIA IHAVWVGALS 
SSRTLAVPLL RLGSAEFRHV LRATAVVFGI TGIVEAYLHV PLLQAVIRAS LPVALGGVLL 
CRMLWGRRVR TQTDQEFRTP TLVVGSFFAT RATAAALLRE GRSGAEVVGA CLPEGESELY 
ESIPLDDGTA IPVVGSDQTL LAAIDRTGAR AVALTPTDTL GPGDLRKLIW ELDEKQVELV 
LVPGVVDVAG HRVVYQSVSG MPMLSIARPQ HRRADSMAKR TFDIVFATIA LLFTFPVTLA 
VAIAVKIDSR GPLFYSAERV GAGGKTFHMV KFRSMVDGAD SYRDALADKD IGAGVLFKIP 
DDPRVTRIGR IVRRYSIDEL PQFINVLKGE MSVVGPRPAL PAEVAQYPPV MRRRHLVKPG 
ITGAWQVSGR SDLSWDESVR LDVGYVENWS LFTDLSIVAR TVGTVVGSSG AY