Gene Rcas_2040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2040
Symbol
ID	5539518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2613951
End bp	2615237
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	61%
IMG OID	640894175
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_001432146
Protein GI	156742017
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0425815
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG ACATCCGTTT CACCGGCTTC GAGACGCTGG CGCTCCACGC AGGACAGCAA 
CCCGACCCTG CCACCGGCGC ACGCGCGGTG CCGATCTATC AGACGACCTC GTATCAGTTC 
AAGGATACCG ATCACGCGGC GCGGTTGTTC GGATTGCAGG AATTTGGGAA CATCTACACC 
CGCATCATGA ACCCGACGAC CGACGTGCTT GAGCAGCGCA TTGCGGCGCT CGAAGGCGGC 
GTCGGCGCGC TGGCGCTCTC ATCGGGGCAG GCGGCGGAGA CGCTGGGTAT CCTGAATGTG 
GCAAGCGCCG GCGATAACAT CGTATCGTCG AGCGACCTGT ATGGCGGCAC TTACAATCTC 
TTCCGCCATA CATTGCCCAA ACTCGGCATT ACGACGCGCT TCGTCGATGC GCGCGATCAC 
GAGGGCTTCC GCAAAGCCAT CGATGATCGC ACCAAACTGG TCTTTCTCGA ACTGGTCGGC 
AATCCACGCC TGGATATTGT CGATCTCCAA ACGATTGCCA CTATTGCGCA CGAGCGTGGC 
GTGGCGGTGA TGGTCGACTC GACGACGGCA ACCCCCTATT TGTGCCGTCC GTTCGAGTGG 
GGCGCCGACA TTGTCATTCA TTCCGGCACG AAGTACCTGG GCGGGCATGG CACGAGCATT 
GCCGGTCTGC TGGTCGATAG CGGCAGATTC GACTGGACGA ACGGGCGCTA CCCGGAGTTC 
ACCACGCCGG ATCCGTCTTA CCACGGGCTG GTCTACACAC AGGCGTTCGG CAACCTGGCG 
TATATTCTGA AAGTGCGGGT GCAGTTGCTG CGCGACATCG GCGCATGCCT CAGCCCGTTC 
AATTCTTTCC TGCTCCTTCA GGGTATTGAA ACACTGGGGC TGCGCATGGA GCGCCATAGC 
CAGAATGCGC TGGCAGTGGC GCAGTTTCTC AAAGAGCACA GCAAGGTGGA GTGGGTGCTG 
TACCCTGGTC TGCCGGACCA CCCCAGTTAT GCCCTGGCGC AGAAATATAT GCCGAAAGGT 
CAGAGCGGCA TCCTCGGCTT TGGGATTCGT GGCGGGCGCG CGGCCGGCGC GACGTTTATC 
AATAGTCTGC GCCTCTTCTC GCACCTGGCG AATATCGGCG ATGCCAAGAG CCTTGCCATC 
CATCCCGCCA GCACGACTCA CAGCCAGTTG ACACCCGAAG AGCAGCGGCT TACCGGCGTC 
ACCGACGATT TTGTGCGCCT GTCGGTGGGC ATCGAAACGA TTGACGACAT CATCGCCGAC 
CTGGATCAGG CGCTGGCGAA GGTGTAG

Protein sequence

MSDDIRFTGF ETLALHAGQQ PDPATGARAV PIYQTTSYQF KDTDHAARLF GLQEFGNIYT 
RIMNPTTDVL EQRIAALEGG VGALALSSGQ AAETLGILNV ASAGDNIVSS SDLYGGTYNL 
FRHTLPKLGI TTRFVDARDH EGFRKAIDDR TKLVFLELVG NPRLDIVDLQ TIATIAHERG 
VAVMVDSTTA TPYLCRPFEW GADIVIHSGT KYLGGHGTSI AGLLVDSGRF DWTNGRYPEF 
TTPDPSYHGL VYTQAFGNLA YILKVRVQLL RDIGACLSPF NSFLLLQGIE TLGLRMERHS 
QNALAVAQFL KEHSKVEWVL YPGLPDHPSY ALAQKYMPKG QSGILGFGIR GGRAAGATFI 
NSLRLFSHLA NIGDAKSLAI HPASTTHSQL TPEEQRLTGV TDDFVRLSVG IETIDDIIAD 
LDQALAKV