Gene Dole_2074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2074
Symbol
ID	5694917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2525989
End bp	2527365
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	59%
IMG OID	641264675
Product	tryptophan synthase subunit beta
Protein accession	YP_001529955
Protein GI	158522085
COG category	[R] General function prediction only
COG ID	[COG1350] Predicted alternative tryptophan synthase beta-subunit (paralog of TrpB)
TIGRFAM ID	[TIGR01415] pyridoxal-phosphate dependent TrpB-like enzyme

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTCCC GGAAAATTTT TCTGACAGAA GATGAGATGC CGCGCCAGTG GTACAACATT 
CTGGCGGACA TCAAGATGAA TCCGCCGCTG GGACCCGACG GCAATCCCGT GGGACCCGAT 
TCCCTGGCCC CTGTGTTCCC CATGAACCTT ATCGAGCAGG AGGTCAGCAC CGAGCGGTGG 
ATCACCATTC CTGACGAGGT ACTGGACATT CTGACGACGT GGCGGCCGTC CCCCCTGGTG 
CGGGCCCGCA ATCTTGAAAA GGCGCTGGGA ACGCCGGCCA AGATTTACTA CAAGAACGAA 
AGCGTCAGCC CTGCCGGAAG CCATAAGCCC AACACCGCTG TCGCCCAAGC CTACTACAAC 
AAGGAGTTCG GCATCAAGAA GCTCACCACC GAAACCGGGG CCGGCCAGTG GGGCAGCGCC 
CTCTCCTATG CCTGTTCCCA GTTCGGCCTG GAGTGCAAGA TATTCATGGT ACGGATCAGC 
TTCGACCAGA AGCCCTACCG CAAAAGCATG ATGGGCGCCT GGGGTGGTAA CTGTATTCCC 
AGCCCCAGCG ACCAGACCCG TGCGGGCCGC GACGCCCTGG CCAAAGATCC CAACACCCCG 
GGCAGCCTGG GCATTGCCAT CAGCGAAGCC ATCGAATGTG CCGTCACCGA CGAATCGGGA 
GAGACCCGTT ATGCCCTGGG CAGCGTGCTC AACCACGTGA TGCTGCACCA GACCATCATC 
GGGCTGGAAG CCAGGAAACA GTTTGAAAAA GTCGGCGACT ATCCGGATGT CATCATCGGA 
TGCGCCGGCG GCGGCAGCAA CTTTGCCGGC ATCGCTTTTC CCTTTGTCTA CGACAAGATT 
CACGGCAAAG ATATTGAGAT TTACCCGGTG GAGCCCATGG GCTGCCCCAC CATGACCAAG 
GCCCCCTTTG TTTACGACCA CGGCGATACC GCCAAGTACA CCCCCCTGCT GGCCATGCAC 
AGCCTGGGTC ATGCCTTTGT TCCGCCGCCT TTTCACGCGG GCGGGCTCCG TTACCACGGC 
ATGGCGCCCA CGGTCAGCCA GCTGGTCTGC GAAGGCATTG TTACCCCCCG GGCGGTTTCC 
CAGTTGAGCA CCTTTGAGGC GGGCGTGCTG TTTGCCCGTT CCGAAGGTAT CATTCCCGCG 
CCCGAGAGCA ATCACGCCAT CGCCTGTGTC ATTGAAGAGG CCAACAAGGC AAAGGAAGAG 
GGCAAGGAAA AGGTGATCCT GTTCAACCTG AGCGGTCATG GCCTTCTGGA CCTGGCCGGA 
TACGACCGGT TCTTTGCCGG CGAGCTGTCC AACATTCTCA TGAACGATGA TGATCTGAAG 
GCGTCGGAAG CGGTGTTTGC CGATTATCCC AAGCCTGCGA TCCTCAAGCA CGATTAG

Protein sequence

MTSRKIFLTE DEMPRQWYNI LADIKMNPPL GPDGNPVGPD SLAPVFPMNL IEQEVSTERW 
ITIPDEVLDI LTTWRPSPLV RARNLEKALG TPAKIYYKNE SVSPAGSHKP NTAVAQAYYN 
KEFGIKKLTT ETGAGQWGSA LSYACSQFGL ECKIFMVRIS FDQKPYRKSM MGAWGGNCIP 
SPSDQTRAGR DALAKDPNTP GSLGIAISEA IECAVTDESG ETRYALGSVL NHVMLHQTII 
GLEARKQFEK VGDYPDVIIG CAGGGSNFAG IAFPFVYDKI HGKDIEIYPV EPMGCPTMTK 
APFVYDHGDT AKYTPLLAMH SLGHAFVPPP FHAGGLRYHG MAPTVSQLVC EGIVTPRAVS 
QLSTFEAGVL FARSEGIIPA PESNHAIACV IEEANKAKEE GKEKVILFNL SGHGLLDLAG 
YDRFFAGELS NILMNDDDLK ASEAVFADYP KPAILKHD