Gene Ccel_3332 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ccel_3332
Symbol
ID	7311903
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium cellulolyticum H10
Kingdom	Bacteria
Replicon accession	NC_011898
Strand	-
Start bp	3875484
End bp	3876764
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	39%
IMG OID	643610235
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_002507601
Protein GI	220930692
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000160258
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAGAA AACTTAGCTT TGATACATTA CAGGTTCATG CAGGACAGGA AGTAGATCCG 
ACCACAAGGT CAAGGGCAGT GCCAATATAC CAGACATCAT CCTATGTTTT TAAGGATTGC 
GACAATGCAG CAGATTTATT TGGATTAAAG GATTCTGGTA ATATTTACAC AAGAATAATG 
AACCCTACAA CAGATGTATT TGAAAAAAGA ATCGCGGCAC TTGAGGGAGG TACAGCAGCA 
CTTGCAGTTG CATCAGGATC ATCAGCAATA ACTTATTCAG TACTTAACAT TGCTGGAGCA 
GGAGACGAAA TAGTAGCTGC CAACACCTTA TACGGAGGAA CTTATAACCT TTTTGCGGTA 
ACCTTGCCAA GATACGGAGT AAATACAATA TTTGTCGATC CCGATAACAT CCAAAACTTT 
GAAGATGCCA TTACAGAAAA AACAAAAGCT CTGTACATTG AATCAATAGG TAACCCAAAT 
GCAAATCTAA TTGATATTCA AGCTGTTGCA GACATTGCAC ATAAGCATGG TATCCCCCTT 
ATAGTTGATA ATACTTTTGG CTCACCATAT CTGGTAAGGC CTATCGACTT CGGTGCGGAC 
GTAGTTGTAC ATTCAGCAAC CAAATTTATA GGCGGACATG GAAGTTCTAT CGGTGGTGTA 
ATCATTGATG GAGGTAAATT TGACTATTCA GCGGGGGACA AATTCCCCGG ATTTACAACA 
CCTGATGAAA GCTATCATGG AGTTGTATAC AGTCAGTTAG AAGGTGTTGC CTTTATAACA 
AAAGCCAGAG TTCAACTGCT TAGAGATACA GGTGCGGCTA TCAGTCCGTT TAATTCCTTC 
CTTTTTATAC AAGGACTTGA GACACTATCT TTGAGAGTCG AAAGACATGT AAGCAATTCT 
AAAAAGATTG CAGAATACCT GGAAAAACAC TCATTGGTGG AGAAAGTAAA TTATCCAAGC 
CTGAAAGGAA ATAAATACTT TGATCTCGCT CAGAAATACT TTCCAAAGGG TTCAGGGTCA 
ATATTTACCT TTGAAATAAA AGGAGGTCAC GAATCTGCGA AGAAATTTAT AAATAGTCTG 
GAAATATTCT CATTATTAGC AAATGTCGCA GATGCAAAAT CTCTGGTAAT ACATCCTGCA 
AGCACTACTC ATTCCCAGCT TTCAGAAGAT GAGCTTTTGA AATCAGGAAT AACACCCGGA 
ACAGTAAGAC TTTCCATAGG CATTGAAGAT CCTGACGATC TTATATACGA CATAGATCAG 
GCTCTTGAAA AGAGCAGGTA A

Protein sequence

MNRKLSFDTL QVHAGQEVDP TTRSRAVPIY QTSSYVFKDC DNAADLFGLK DSGNIYTRIM 
NPTTDVFEKR IAALEGGTAA LAVASGSSAI TYSVLNIAGA GDEIVAANTL YGGTYNLFAV 
TLPRYGVNTI FVDPDNIQNF EDAITEKTKA LYIESIGNPN ANLIDIQAVA DIAHKHGIPL 
IVDNTFGSPY LVRPIDFGAD VVVHSATKFI GGHGSSIGGV IIDGGKFDYS AGDKFPGFTT 
PDESYHGVVY SQLEGVAFIT KARVQLLRDT GAAISPFNSF LFIQGLETLS LRVERHVSNS 
KKIAEYLEKH SLVEKVNYPS LKGNKYFDLA QKYFPKGSGS IFTFEIKGGH ESAKKFINSL 
EIFSLLANVA DAKSLVIHPA STTHSQLSED ELLKSGITPG TVRLSIGIED PDDLIYDIDQ 
ALEKSR