Gene Htur_0018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_0018
Symbol
ID	8740581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013743
Strand	+
Start bp	18922
End bp	20274
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	69%
IMG OID	646510581
Product	Tryptophanase
Protein accession	YP_003401592
Protein GI	284163313
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3033] Tryptophanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTATGG TCGCGTACAA GACGAAAGTA GCGGAACGGA TTCACCTCCC CTCTCGAGAC 
CGGCGCGAAC GGGCGCTGGC CGAGGCGGGG TACAACGTCT TCAATCTCGA CGCCGAGGAC 
GTCTTCGTCG ACCTCCTGAC CGACAGCGGC ACCGGCGCGA TGAGCGACGC CCAGTGGGCG 
GCCGTAATGC GCGGCGACGA GTCCTACGCC GGCTCGCGCA GCTTCGACGA CCTCGAGTCG 
GCCGTCCGGG ACGTAATGGG TTTCTCGCGC GTCGTCCCGA CCCACCAGGG TCGCGGCGCG 
GAGAACGTCC TCTACGGCAC GCTGCTCTCG GAGGGCGACG TCGCGCTCAA CAACACCCAC 
TTCGACACGA CGCGGGCCCA CGTCGCGAAC CAGGGTGCCG ACCCGGTCGA TTGCCCCGTC 
GAGGGGGCTC GCGACCTCGA GTCGGACGAG CCGTTCAAGG GGAACTTCTC GCTCGAGCGC 
GCTCGCTCGG TCGTCGACGA GGTGGGCGCC GAGCGCGTGC CGCTGGTGAT CTTGACGATC 
ACGAACAACT CGACGGCGGG TCAGCCGGTC TCCGTCGAGA ACACCCGCCG CGTCCGCGAC 
TTCGCCGACG AGATCGGGGC GACGTTCGTC ATCGACGCCT GCCGGTTCGC CGAGAACGCC 
GGCTTCGTCC GGCGGCGCGA GGACGAGTTC ACGGACGCCG ATATCGACGA GATCGCCCGC 
GAACAACTCT CCTACGCCGA CGCGATCGTC ATGAGCGGCA AGAAGGACGG GCTGGCCAAC 
GCCGGCGGCT TCGTCGCGAC CGACGACGAG GCGCTGTTCG AGCGGTGCAA GCAGCGAGCG 
ATCCTCTACG AGGGCTTTCC CACGTACGGC GGCATGTCCG GCCGGGACGT CGCCGCGCTG 
GCCGTCGGCC TCCGCGAGGC CGTCGAGGAG GCTTACGTCG CCGACCGCCT CGACGGCGTC 
CGCGCGTTCG CGGACCTGCT CGAGGACGCC GGCGTCCCGA TCTACACGCC GCCCGGTGGT 
CACGCCGTCT ACCTCGACGC CGGGACCGCA CTCCCGCACC TCGCACCCGA CGAGTTCCCT 
GGTCAGGCAC TGGTCTGTGA ACTGTATCGA GAAGGCGGCG TCCGCGGGGT CGAACTCGGG 
AGCTTCGCGT TCCCCGATAC GGACCGGCCG GAACTGGTCC GCCTCGCGGT GCCGCGTCGC 
ACCTATCACA CCGAACACTT CGAACACGTC GCCGAGACCG CCGCGACGGT CCTCGAGAAG 
CGAGAGGCGG TCTCCGGGCT CGAGATCGTT TCCGAGCCGG AAAACCGCGA GTTACGTCAC 
TTCACGGCCG ACCTCGAGCC GCTGTCTGTA TGA

Protein sequence

MRMVAYKTKV AERIHLPSRD RRERALAEAG YNVFNLDAED VFVDLLTDSG TGAMSDAQWA 
AVMRGDESYA GSRSFDDLES AVRDVMGFSR VVPTHQGRGA ENVLYGTLLS EGDVALNNTH 
FDTTRAHVAN QGADPVDCPV EGARDLESDE PFKGNFSLER ARSVVDEVGA ERVPLVILTI 
TNNSTAGQPV SVENTRRVRD FADEIGATFV IDACRFAENA GFVRRREDEF TDADIDEIAR 
EQLSYADAIV MSGKKDGLAN AGGFVATDDE ALFERCKQRA ILYEGFPTYG GMSGRDVAAL 
AVGLREAVEE AYVADRLDGV RAFADLLEDA GVPIYTPPGG HAVYLDAGTA LPHLAPDEFP 
GQALVCELYR EGGVRGVELG SFAFPDTDRP ELVRLAVPRR TYHTEHFEHV AETAATVLEK 
REAVSGLEIV SEPENRELRH FTADLEPLSV