Gene Hoch_0225 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_0225
Symbol
ID	8542604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	332987
End bp	334132
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	71%
IMG OID	646385021
Product	Tryptophan 2,3-dioxygenase
Protein accession	YP_003264759
Protein GI	262193550
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3483] Tryptophan 2,3-dioxygenase (vermilion)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCGCG ATGTGACGAC ATACTGGGAC TACATCAAGG TCGAAGAGCT GCTCGGGTTG 
CAGACCGGGC TCGGCGACGA CGAGGGCACC CTCAGCAACG ATGAGGTGAT GTTCATCGTG 
GTCCACCAGA TCGACGAATT GTGGTTCAAG CTCACCCTGC GCGAGCTGGC CAGCGTGCGC 
GCGCTCTTCG CCCAGGAGCA CGTGCGCGAG CAGTCGCTGT CCTCGGCCGT GCGCGGCATC 
CGGCGGGCGG CGCTGCTGTT CGAGCAGACC GCCGGGCACT TCGCGCTGAT GGAGACGATG 
ACCACGCGCG ACTACCTGGC GTTCCGCGAC AAGCTGAGCC CGGCGAGCGG GTTTCAGTCG 
GCCCAGATGC GCGAGATCGA GATCCTGCTG GGGCTGCCCG AGAACGAGCG GATGGCGCTC 
GGCCACGAGA CCTATATGCA GGCGCTGCGC GACCCCGATG GCGGCGAAAC CGCGGCCTCG 
CTGCGGGTGC AGGCGCGCCA GCGCGATACG CCGACGGTGC GCGCGGCCAT CGAAGAGTGG 
CTGTACCGCA CGCCCATCGA CGGCTTCACG CCCGACAGCG AGGGCGACGC CGAGGCCGTG 
GCCGCGTTCA TCGACTCGTA CCTGGAGGCG CATCGCCGCG AGCTGGCCGG CATTCAGGCG 
CGGGCCGTGG CCAGCGCGCT CACCGAGGCC GACCGCACGC GCCTGGGCGA GCGCTACGAG 
CGCGAGCTGG CCTCGGCGCG GGCCTGGCTC GAGGGCCGCG ATGTGAGCGC GGCGCACGAC 
GACAGCGAGG GCACGATCGA GCGCACGCGG GCGCGGCGCT CGCGCATCCG GGCCGCGCTG 
GTGTTCATCG AGAGCTACCG CGAGCTGCCG CTGCTGGCGT GGCCGCGCGA GGTGCTCGAC 
GCCATCGTGG CGCTGGAGCA GGCGTTCACG ATCTTCCGCC AGCGCCACGC GCGCATGGTC 
GAGCGCGTGA TCGGCCGGCG CACCGGCACC GGCGGCTCGG CCGGGGTCGA TTATCTTGAC 
CGCACGGCGC TCACCTACCG CGTGTTTCGC GATATCTGGG CCACGCGGAC GGTGCTCTTG 
CGCGAGAGCG CGCTGCCGCC GCTGGTGCAC GCCGACTACT ACGGCTTCGC CGGCAGCGGC 
GCGTGA

Protein sequence

MTRDVTTYWD YIKVEELLGL QTGLGDDEGT LSNDEVMFIV VHQIDELWFK LTLRELASVR 
ALFAQEHVRE QSLSSAVRGI RRAALLFEQT AGHFALMETM TTRDYLAFRD KLSPASGFQS 
AQMREIEILL GLPENERMAL GHETYMQALR DPDGGETAAS LRVQARQRDT PTVRAAIEEW 
LYRTPIDGFT PDSEGDAEAV AAFIDSYLEA HRRELAGIQA RAVASALTEA DRTRLGERYE 
RELASARAWL EGRDVSAAHD DSEGTIERTR ARRSRIRAAL VFIESYRELP LLAWPREVLD 
AIVALEQAFT IFRQRHARMV ERVIGRRTGT GGSAGVDYLD RTALTYRVFR DIWATRTVLL 
RESALPPLVH ADYYGFAGSG A