Gene Dole_1401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1401
Symbol
ID	5694236
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	1665411
End bp	1666589
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	58%
IMG OID	641263994
Product	cystathionine gamma-synthase
Protein accession	YP_001529282
Protein GI	158521412
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGGGG ACAAAGACTG GGGAATCTCA ACCAAGGCGG TGCATGCCGG TGAGATCCGG 
TATAACGAAT ACGGGTCGGT GACCACGCCC ATTGTGCAGA CATCCACGTT TATCTTCAAG 
AATATCGACG AGATAAAGAA GCTGGCCGTG GGAGCGGTGG AACGGTTTGA ATACGGCCGG 
TACGGCCATC CCACCCAGAT CGCCGCGGAA CACAAGCTGG CCTTTCTGGA AGGGGCAGAG 
GACGCGGTGC TGTTTTCTTC GGGCATGAGC GCCATCACCA CCACCCTGTT CGGCCTGCTC 
AAGTCCGGGG ACCACATCAT CATCACCGAC GACGCCTACC GCCGCACCCT GGAGTTCTGC 
AAGGCCTGCC TGGTCAAGTT CGACATCGAG TGCACGGTGG TGAAAATGTG CGATTACGAG 
GCCATGGAAA AGGCGATCAA ACCCAACACC CGGCTCTTTT TCTCCGAGTC ACCCACCAAC 
CCCTACCTCA ATATCATGGA CCTGGAACGG TTGATCGGTA TTTTTAAAGA CAAGGGCATT 
CTGGTGGTGT CGGACAGCAC CTTTGCCACG CCGTATAACC AGAAACCCCT GGAGTACGGG 
GTGGATATCG TGATTCACAG CGCCACCAAG TACCTGGCCG GTCACAACGA CCTGCTCAGC 
GGCGTGGTGC TGGGCAGCAA GAAGCTGGTG GAGCCGGTTC GGGAATTCCT CAAAATCACC 
GGCGGGGTGA TTGATCCCAA TTCGGCCTAC CTGCTGATCC GGGGCCTGAA GACCTTTGGC 
CTGCGCATGG AGCGGCTCAA TGAAAACGGC CAAATCGTTG CCGAAGGACT GGAACGGCAT 
CCCAAGATCA GCCGGGTTTA CTATCCCGGC CTGCCCAGCC ATCCCCACCA TGACGTGGCA 
AAGGCCCAGA TGAAGGGGTT TGGGGCTGTG GTGACCTTTG AGGTGGAAGG CGACTGCGAG 
TATGTGCTCA ATTTTTTGAG CCGGCTCAAG ATCATCAACA TCGGCCCCAG CCTGGGCGGA 
GTGGAGTCGC TGATCACCCA CCCGGCCACC ATCAGTTACT ACGATAAAAC CCGGAAGGAA 
CGTCTGGCCC TGGGCATCAA GGACGGCCTG ATCCGCCTGG CCGTGGGCGT GGAAAACGCC 
GAGGATATTA TTGCCGATAT CGAGCAGGCA CTGGCGTAA

Protein sequence

MKGDKDWGIS TKAVHAGEIR YNEYGSVTTP IVQTSTFIFK NIDEIKKLAV GAVERFEYGR 
YGHPTQIAAE HKLAFLEGAE DAVLFSSGMS AITTTLFGLL KSGDHIIITD DAYRRTLEFC 
KACLVKFDIE CTVVKMCDYE AMEKAIKPNT RLFFSESPTN PYLNIMDLER LIGIFKDKGI 
LVVSDSTFAT PYNQKPLEYG VDIVIHSATK YLAGHNDLLS GVVLGSKKLV EPVREFLKIT 
GGVIDPNSAY LLIRGLKTFG LRMERLNENG QIVAEGLERH PKISRVYYPG LPSHPHHDVA 
KAQMKGFGAV VTFEVEGDCE YVLNFLSRLK IINIGPSLGG VESLITHPAT ISYYDKTRKE 
RLALGIKDGL IRLAVGVENA EDIIADIEQA LA