Gene Tpau_3947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpau_3947
Symbol
ID	9158128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Tsukamurella paurometabola DSM 20162
Kingdom	Bacteria
Replicon accession	NC_014158
Strand	-
Start bp	4066454
End bp	4067572
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	72%
IMG OID
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_003648858
Protein GI	296141615
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.607291
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGATCG TCGGCGCGGT CCTGGAGGAG TCGGGCCGGC CGCGACCGTA CGCGCGGTCG 
CGGCCGATCA CCGTCGGCGA ACTCGAACTC GACGATCCCG GCCCGACGGA GCTCCTGGTC 
CGGATCGAGG CGGCTGGTGT CTGCCACTCG GATCTCAGTG TGGTCGAAGG TAACCGGCCG 
CGCCCCACCC CGATGCTGTT GGGGCACGAG GCCGCCGGAA TCGTGGTCGC GGCGGGCGAT 
GAGGTCGGGG ATATCAGTCC CGGGCAGCGG GTCGTGATGT GCTTCCTGCC CCGGTGCGAA 
CGGTGCCCGG ACTGTGCGGC GGGCGGCCGG CTCCCGTGTG CGGAGGGAAC CGCGGCGAAC 
TCCGCGGGCA CCCTGCTGCG CGGGGCCAGG CTGAGCCGGT CCGGGCGGAC GGTGCGGCAC 
CACCTCGGGG TCTCGGGGTT CGCCACGCAC GCCGTGGTGG ACCGGGCCTC GGTCGTGCCC 
GTGGATGCCG ATGTGCCGCC GGCGGTGGCC GCGGTACTCG GCTGCGCGGT GCTCACCGGC 
GGCGGCGCGG TTCTCACGGT CGCCGATCCG GCGCCCACCG ACAGCGTGAT GGTCGTCGGC 
CTCGGCGGCG TGGGCATGGC CGCCGTCCTC ACCGCCCGCG CGCTCGGCGT CGAACGCGTC 
GTCGCGGTGG ACACCGCCGA GGACAAGCTC GACCGGGCCC GGGAACTGGG CGCGACGGAG 
ACCTACACGC CGGCCCGGCT GACCGATGCG GGGATCACGG CGCGGTACGT CATCGAATGC 
GCTGGGAGCG CCCGGGCCTT CGAGACCGCC TTCGCCGCTA CCGAATCGGG CGGGACGACG 
ATCACCGTGG GGCTCCCGGC CCCGGCCGCC CGTGCCGAGA TCTCGCCGCT CACGGTGACC 
GCCGAGGCCC GCACGATCAT CGGCAGCTAT GTGGGTTCCT CGGTTCCTGC GCGCGACATC 
CCGCGGTATG TCGACTTATG GCGGGCGGGC AGGCTACCGG TCGAGAAGCT CATCTCATCC 
ACCATCCGGC TCGATCGGAT CAACGAGGCG ATGGATCTGC TGGCCGACGG CCGGGCTGTC 
CGCCAAGTCA TCCTGTTCGA TCACGACGAC GAAAGGTGA

Protein sequence

MRIVGAVLEE SGRPRPYARS RPITVGELEL DDPGPTELLV RIEAAGVCHS DLSVVEGNRP 
RPTPMLLGHE AAGIVVAAGD EVGDISPGQR VVMCFLPRCE RCPDCAAGGR LPCAEGTAAN 
SAGTLLRGAR LSRSGRTVRH HLGVSGFATH AVVDRASVVP VDADVPPAVA AVLGCAVLTG 
GGAVLTVADP APTDSVMVVG LGGVGMAAVL TARALGVERV VAVDTAEDKL DRARELGATE 
TYTPARLTDA GITARYVIEC AGSARAFETA FAATESGGTT ITVGLPAPAA RAEISPLTVT 
AEARTIIGSY VGSSVPARDI PRYVDLWRAG RLPVEKLISS TIRLDRINEA MDLLADGRAV 
RQVILFDHDD ER