Gene Dole_1564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1564
Symbol
ID	5694401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	1862587
End bp	1863807
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	64%
IMG OID	641264159
Product	tryptophan synthase subunit beta
Protein accession	YP_001529445
Protein GI	158521575
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTTCCC ATGTTTCACA CCAGACGCCG GCGACTGCCC GCCCGGACAC GACCGGTCAT 
TTTGAGCAGT ACGGCGGCAT GTACCTTGCC GAGACCCTGA TGCCGGCGGT CCTGGAACTG 
GACGAAAAGC GGCGCCAGAT CATGATTGAC CCGGCGTTTC AAAAAGAGCT GGGGGGCCTG 
CTGGCCGATT ACGTGGGCCG ACCCACGCCC CTGTTTTTCG CTAAACGGCT GACGGCCCAC 
CTGGGCGGGG CCGCCATCTA TCTGAAGCGG GAGGACCTGG CCCATACCGG GGCTCACAAG 
ATCAACAACA CCATCGGCCA GGCGTTGCTT GCCAAGTGGA TGGGTAAAAA CCGGGTGATC 
GCCGAGACCG GGGCCGGCCA GCACGGCGTT GCCACGGCCA CGGCCGCGGC CCTGCTGGAC 
ATGACCTGTG AAGTCTTTAT GGGGGTTGAG GATATCCAGC GCCAGGCCCC GAACGTGATG 
CGGATGAAGC TGCTGGGCGC CACGGTGACA CCGGTGGACT CGGGTTCCGG CACGTTGAAG 
GACGCCATGA ACGAGGCCCT GCGCCACTGG GTGGCCCGGG TGCGGGACAC CTTTTACGTG 
ATCGGGTCCG TGGCCGGGCC CCATCCCTAC CCGGTGATGG TCCGCGACTT TCAGAGAATC 
ATCGGCGATG AAACCCGGCG ACAGATACTG GAGGTCACGG GCCGGCTGCC GGACCTGCTG 
GTGGCCTGCG TGGGCGGCGG CAGCAACGCC CTGGGAATTT TTTATCCGTT TCTTTCCGAC 
ACCGTGGAGA TGGTGGGCGT GGAGGCGGGC GGCGAAGGCC TTGACACCAA TCGCCACGCC 
GCCACCCTGA ACCGGGGGGT GACCGGCGTG CTGCACGGCT CAAAGTCCTA TGTGCTTCAG 
GACCGGTTCG GCCAGATCGC GCCGGTGCAC TCGGTTTCCG CCGGCCTGGA CTATCCGGGC 
GTGGGGCCGG AACACGCTTT TTTAAAGGAC ACGGGCCGGG TCAGATACAC GGCCATCGAC 
GATAAAGAGG CCATGGCCGC CTTTCACCTG CTCTGCCGTA CCGAGGGCAT CATTCCGGCC 
CTGGAAAGCT CCCATGCCGT TGCCTGCGTC ATCAAGGAAG CGCCCGGGCG GCCCAAAACA 
GACATTCTCA TCGTCAACCT CTCCGGAAGG GGAGACAAAG ACCTGGGGAT CGTATCATCC 
GTCATGGAAA AGGAGAAATA G

Protein sequence

MRSHVSHQTP ATARPDTTGH FEQYGGMYLA ETLMPAVLEL DEKRRQIMID PAFQKELGGL 
LADYVGRPTP LFFAKRLTAH LGGAAIYLKR EDLAHTGAHK INNTIGQALL AKWMGKNRVI 
AETGAGQHGV ATATAAALLD MTCEVFMGVE DIQRQAPNVM RMKLLGATVT PVDSGSGTLK 
DAMNEALRHW VARVRDTFYV IGSVAGPHPY PVMVRDFQRI IGDETRRQIL EVTGRLPDLL 
VACVGGGSNA LGIFYPFLSD TVEMVGVEAG GEGLDTNRHA ATLNRGVTGV LHGSKSYVLQ 
DRFGQIAPVH SVSAGLDYPG VGPEHAFLKD TGRVRYTAID DKEAMAAFHL LCRTEGIIPA 
LESSHAVACV IKEAPGRPKT DILIVNLSGR GDKDLGIVSS VMEKEK