Gene Acid345_4499 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4499
Symbol
ID	4070177
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	5340405
End bp	5341748
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	60%
IMG OID	637986538
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_593573
Protein GI	94971525
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.675979
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.356601
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAGCA ATAACGGAAA AGAAGCACCG AAACCGCATT TAGCTACGCT GGCGGTCCAT 
GGCGGCCAGG AACGCGATCC CGCTACCAAG TCGCGCGCCG TCCCCATCTA CCAGACCACC 
TCGTACCTCT TCGACGACGC CGACCACGCC GCCCGCCTCT TCGCCCTCCA GGAATTCGGC 
AACATCTACA CCCGCATCAT GAACCCCACC ACCGACGTCT TCGAGAAGCG CATTGCCGCA 
CTAGAAGGCG GCGCCGCCGG TCTTGCGACG GCCTCAGGCC AGGCCGCCGA GACGCTGACG 
ATTATCACCC TCGCCAATGC TGGCGATGAG ATCGTCTCAA CCACGTCGCT TTACGGTGGA 
ACCTACAACC TCTTCCACTA CACGTTCCCG AAGCTCGGCA TCAATGTGAA GTTCGTGGAT 
GCCGACGACT TCGACGGCCT GCGCAAGGCC ATCACGCCGA AGACGAAAGC GGTCTTTGCG 
GAAACGCTTG GCAATCCCAA GCTCGACGTG ACCGACATCG AAACGATTGC AAAGATCGCA 
CACGAGAACG GCCTTCCGTT CATCATCGAC AACACGTCGG CTTCACCCGC GCTGCTGCGT 
CCGATCGAGT GGGGCGCCGA CATCGTGATC AACTCGGCGA CGAAATTCAT CGGCGGCCAC 
GGCACCACCA TCGGCGGCAT CATCGTGGAT GCTGGCAAGT TCGACTGGAA GGCCAGCGGC 
CGCTTCCCGG ATTTCGTAAA CCCCGACCCG TCGTATCACG GTCTCAGCTT CTGGGACGCT 
TTCGGTCCGT TGGCGTTCAT CCTCAAGGCG CGCGTGCAAG GCTTGCGTGA TACCGGCGCG 
GCGCTCTCGC CGTTCAATTC GTTCCTGCTG CTGCAAGGCA CGGAAACACT GCACCTTCGT 
TTGCAGCGAC ACTCCGAGAA TGCGCTCAAA GTTGCGAAGC ATCTCGAGGA GCATCCGGCG 
ATCGAGTGGG TGAACTATCC CGGACTGAAG TCGAGCAAGT ACTACGCCCG CGCGCAGAAG 
TATCTGCCTG ATGGCCAGGG CGCGCTGCTC ACCTTTGGCA TCAAGGGCGG ATTCGAGGCC 
GGCAAGAAGC TGATCAACTC GCTGAAGTTG TTTAGCCTCG TCGCTAACAT CGGAGACTCG 
AAGTCCCTCG TCATCCATCC GTCGTCAACA ACCCACCAAC AGTTATCCGA AGCAGAACAG 
AAAGATACCG GTGTCACACC CGAGCTCGTT CGTCTCAGCG TCGGCATCGA GGACGTCCGC 
GACATCATCG CCGACCTCGA CCAGGCTCTT GAGGTTGCAA CCGGTGTCTC CAACCAACTC 
CAACCAGCAG GAAGTGCACG ATGA

Protein sequence

MSSNNGKEAP KPHLATLAVH GGQERDPATK SRAVPIYQTT SYLFDDADHA ARLFALQEFG 
NIYTRIMNPT TDVFEKRIAA LEGGAAGLAT ASGQAAETLT IITLANAGDE IVSTTSLYGG 
TYNLFHYTFP KLGINVKFVD ADDFDGLRKA ITPKTKAVFA ETLGNPKLDV TDIETIAKIA 
HENGLPFIID NTSASPALLR PIEWGADIVI NSATKFIGGH GTTIGGIIVD AGKFDWKASG 
RFPDFVNPDP SYHGLSFWDA FGPLAFILKA RVQGLRDTGA ALSPFNSFLL LQGTETLHLR 
LQRHSENALK VAKHLEEHPA IEWVNYPGLK SSKYYARAQK YLPDGQGALL TFGIKGGFEA 
GKKLINSLKL FSLVANIGDS KSLVIHPSST THQQLSEAEQ KDTGVTPELV RLSVGIEDVR 
DIIADLDQAL EVATGVSNQL QPAGSAR