Gene Tpau_2142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_2142
Symbol
ID	9156298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	+
Start bp	2233137
End bp	2234297
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	71%
IMG OID
Product	type I phosphodiesterase/nucleotide pyrophosphatase
Protein accession	YP_003647092
Protein GI	296139849
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.216003
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGACAGG TGGTCCCACA GTACGGGTCG GCCTCGCTCG CCGATGTCGT ACCGTCGGCC 
GCCGCCGCGC TCGGCGTTCG CGGTTTCGTG AACCAGCTCG GTTTCCGCCC GACGCGACGG 
GTCTGCCTGC TGCTCGTGGA CGGCCTCGGA CATCTTCTCC TGGAACGGTA CGCCGCACAG 
GCGCCGTTCC TCTCCGAGCT CACCGCCACC CGCATCTGCG CGGGCTTCCC GTCGACCACG 
GCCACCAGCA TCTCCTCGAT CGGCACCGGA CTGCCCCCGG GGGAGCACGG CATCGTCGGC 
CTGTCCTTCG CCGTCTGCGG TGACGGTATC GCCACGGGGA CCACCATCAA CGCTCTCGGC 
TGGAATTCCT ACGGGGTCCG GCATGCGCGG GACCTCCGCG AGTCGGTGGT CCCGGAGCGG 
GTGCAGCCGG AGCGCACACT GTTCGAGGCG ATGGCGGCCG ACGGCGTCGC CGTGACCACG 
GTGACGCCGA AGGATCACGT GGGAAGCGGT CTGAGCCGCG CCGTCCTGCG GGGCGCGGAT 
CCGGTAGCGG CGACCGCGCT GGGTGACATC GTCGGTCGCG TGGCGGCCGC CACCGCCACG 
GGGACGGGCG AACGCGCCTT CTGCTACGCC TACCACGGCG ACCTCGACAT GCTGGGCCAC 
GTCTACGGTC CCGGTTCGCT GCCGTGGCTG ATGCAGTTGC GGCAGGTCGA CACCCTGGCC 
GAGTCACTGG CGATGGCGCT GCCCCCGGAC TGTCTGCTCG TGATCACGGC CGATCACGGC 
ATGATCGAGG CTCCGGAGCA GTCCCGCATC GACTTCGACG CGGAGCCCGC GCTTCGGGCC 
GGCGTCCGGC AACTGGCGGG AGAGCCGCGG GTCCGGCACG TGTACACCGC CGACGGTGCC 
GTTACCGACG TCCGCGCGGC ATGGTCGGCA GTGCTCGGAG AACGAGCGTG GATCCATACC 
CGGGACGAGG CCGCCGAGGC CGGCTGGTTC GGTCCGCGGG TGCTCGACCG CACCCGGGAG 
CGGATCGGAG ACCTGGTCGT GGCGATGCGC GGTGCGCACA CCGTGGCCGT CCCGTCCGCG 
GAGCCGGTCG TGTCGAACCT GCTCGGCCAA CACGGCTCAC TCACCGAAGA CGAGCAGCTC 
GTCCCGGTCC TGGTGCGCTA G

Protein sequence

MGQVVPQYGS ASLADVVPSA AAALGVRGFV NQLGFRPTRR VCLLLVDGLG HLLLERYAAQ 
APFLSELTAT RICAGFPSTT ATSISSIGTG LPPGEHGIVG LSFAVCGDGI ATGTTINALG 
WNSYGVRHAR DLRESVVPER VQPERTLFEA MAADGVAVTT VTPKDHVGSG LSRAVLRGAD 
PVAATALGDI VGRVAAATAT GTGERAFCYA YHGDLDMLGH VYGPGSLPWL MQLRQVDTLA 
ESLAMALPPD CLLVITADHG MIEAPEQSRI DFDAEPALRA GVRQLAGEPR VRHVYTADGA 
VTDVRAAWSA VLGERAWIHT RDEAAEAGWF GPRVLDRTRE RIGDLVVAMR GAHTVAVPSA 
EPVVSNLLGQ HGSLTEDEQL VPVLVR