Gene Dgeo_0518 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_0518
Symbol
ID	4057754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	-
Start bp	545766
End bp	547097
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	68%
IMG OID	641229530
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_603989
Protein GI	94984625
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.4212
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTCCA ATACGCTGCA CTTCGAGACG CTCCAGGTCC ACGCCGGACA GCATCCCGAC 
CCTGCGACCG GTGCCCAGGC CGTGCCGATC TACGCCACCA ACGCCTATGT CTTTGAGTCG 
CCGGAACACG CCGCCGACCT GTTTGGCCTG CGGGCCTTCG GCAACATCTA CAGCCGGATC 
ATGAATCCCA CCAACGCCGT GCTGGAGGAA CGCATTGCGG CGCTAGAGGG CGGCGTAGGA 
GCGCTGGCGG TGGCGAGCGG GCACGCCGCG CAGTTCTTAG CCATCACCAC TGTCGCGCAG 
GCGGGGGACA ACATCGTCTC CACGCCCAAC CTCTACGGTG GTACGGTCAA CCAGTTCCGC 
GTTACCCTGC GGCGGCTGGG CATCGAGGTC CGCTTTACCA GCAAGGACGA GCGCCCGGAG 
GAATTCGCGG CGCTGATCGA CGACCGCACG CGCGCCGTGT ATCTGGAAAC ACTCGGCAAC 
CCGGCGCTGA ATGTCCCCGA TTTTGAGGGC ATCGCGGAGG TGGCCCACGC GCGGGGGGTG 
GCCGTGTTCG TGGACAACAC CTTCGGGGCG GGCGGGTACT ACTGCCAGCC CCTCCGCCAC 
GGCGCGGACG TGGTGCTGCA TTCGGCAAGC AAGTGGATCG GTGGGCACGG CAACGGCATC 
GGTGGTCTTC TCGTGGACGG CGGAACCTTT GACTGGGGCA ATGGCCGCTA TCCCCTTCTC 
ACCGAACCCA GCCCCTCCTA CCACGGCCTG AGCTTCTGGG AGGCGTTTGG CGAGGGGAAC 
GCGCTGGGCC TGCCCAACAT CGCCTTTATC ACCCGCGCCC GCACTGAGGG GCTGCGCGAC 
CTGGGGCCAA CGCTCGCGCC GCAGCAGGCC TGGCAGTTCC TGCAAGGGGT GGAAACCCTC 
TCGCTGCGCG CCGAGCGGCA CGCGCAAAAC GCGCTCGCGC TGGCCTCCTG GCTAAGTGGC 
CACCCGGACG TGTCACGCGT CACCTATCCG GGCCTGAGCA ACCACCCGCA CTACGACCGC 
GCCCAGACGT ATCTGCCGCG CGGGGCGGGG GCCGTGCTGA CCTTTGAGCT GCGCGGGGGA 
CGGGCGGCGG GCGAGGCATT TATTGGCGCG GTGCGGCTCG CACAACATGT CGCCAATGTG 
GGCGACACCC GCACGCTGGT GATTCACCCC GCCAGCACCA CCCACTCCCA GCTGGACGAG 
GCGGCGCAGG CGGCCGCGGG CGTGACGCCG GGACTGGTGC GCGTGTCGGT GGGGATCGAG 
CACATTGACG ACATCCGCGA GGACTTTGCG CAGGCACTGG CCACCGCGCT GGTGGACGCG 
GAGGGCGCAT GA

Protein sequence

MASNTLHFET LQVHAGQHPD PATGAQAVPI YATNAYVFES PEHAADLFGL RAFGNIYSRI 
MNPTNAVLEE RIAALEGGVG ALAVASGHAA QFLAITTVAQ AGDNIVSTPN LYGGTVNQFR 
VTLRRLGIEV RFTSKDERPE EFAALIDDRT RAVYLETLGN PALNVPDFEG IAEVAHARGV 
AVFVDNTFGA GGYYCQPLRH GADVVLHSAS KWIGGHGNGI GGLLVDGGTF DWGNGRYPLL 
TEPSPSYHGL SFWEAFGEGN ALGLPNIAFI TRARTEGLRD LGPTLAPQQA WQFLQGVETL 
SLRAERHAQN ALALASWLSG HPDVSRVTYP GLSNHPHYDR AQTYLPRGAG AVLTFELRGG 
RAAGEAFIGA VRLAQHVANV GDTRTLVIHP ASTTHSQLDE AAQAAAGVTP GLVRVSVGIE 
HIDDIREDFA QALATALVDA EGA