Gene Cagg_0970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0970
Symbol
ID	7268044
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	1198447
End bp	1199742
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	56%
IMG OID	643565819
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_002462324
Protein GI	219847891
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0111967
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.585496
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGATA CGCCACGCTT CACCGGTTTC GAGACGCTTG CCCTACACGC CGGTCAGATC 
CCGGATCCAA CAACCGGAGC ACGGGCAGTA CCGATCTACG CAACGACATC TTATCAGTTT 
AAGGACACCG ATCACGCAGC GCGCTTGTTC AACCTGCAAG AGTTCGGCAA TATCTACACC 
CGCATTATGA ATCCGACCAC CGATGTATTC GAGCAGCGGA TGGCCGCGCT GGAAGGTGGC 
GTGGGTGCAT TGGCGTTGTC GTCAGGGCAA GCTGCTGAGA CGTTGGCGAT TTTGAATCTG 
GCCGGGAGTG GTGATAACAT CGTCGCCTCG TCGGATTTGT ACGGTGGTAC CTATAATCTC 
TTCCGTCATA CCTTACCGCG TTTGGGTATT ACGACCCGTT TTATCGATGC CCGTGATTAT 
GATGGGTTTG CAGCGGCGAT TGATGATCGA ACAAAGGCGT TCTTTCTCGA ACTAGTTGGT 
AACCCGCGGC TCGATGTGCT CGATCTGGAG CGGATTGCGG CGATTGCACA CGAGCGAGGT 
GTACCGGTCA TTGTCGATGC AACGACGGTG ACCCCGTATC TGTGGCAGCC GATCAAGCAT 
GGTGCTGACA TTGTCATTCA CTCGGCGACG AAGTACATTG GTGGGCACGG TACCGCGATC 
GGTGGGATTA TTATCGATAG TGGTAAGTTT GATTGGGCGG CAAGTGGGCG TTTTCCCGAT 
TTCACCAACC CCGATCCGAG CTATCACGGC TTGGTGTATA CGCAGACCTT CGGCAATCTT 
GCCTATATCA TCAAGGCGCG CGTGCAAGGC CTACGTGATA TTGGTGCAGC CCTAAGCCCA 
TTCAACAGTT TCCTCTTCTT GCAAGGGCTA GAGACGTTGC CGTTGCGGAT GGAGCGGCAC 
AGCAAGAATG CGTTAGCCGT CGCGCGCTAT CTCAGCGAGC ATCCGAAGGT CGCATGGGTC 
AACTATCCCG GCTTACCGAG CCACCCGAGC TATCCGTTGG CCCAAAAGTA TCTACCGCGC 
GGACAGAGCG GGATCGTCGG GTTCGGCTTG AAGGGTGGGC GTAACGCCGG ACGAATCTTT 
ATCGAACGGT TACGCCTCTT CTCACACTTG GCGAATATCG GTGATGCCAA GAGTTTGGCG 
ATCCATCCGG CGACGACGAC GCATAGCCAG TTGACCCCTG AAGAACAGCG TCTCACCGGG 
GTGACCGACG ACTACGTGCG GCTCTCCATC GGCCTTGAAA CGATAGACGA TATTTTGGCC 
GACCTCGATC AGGCGTTGGC CGGAACACCA TCGTAG

Protein sequence

MSDTPRFTGF ETLALHAGQI PDPTTGARAV PIYATTSYQF KDTDHAARLF NLQEFGNIYT 
RIMNPTTDVF EQRMAALEGG VGALALSSGQ AAETLAILNL AGSGDNIVAS SDLYGGTYNL 
FRHTLPRLGI TTRFIDARDY DGFAAAIDDR TKAFFLELVG NPRLDVLDLE RIAAIAHERG 
VPVIVDATTV TPYLWQPIKH GADIVIHSAT KYIGGHGTAI GGIIIDSGKF DWAASGRFPD 
FTNPDPSYHG LVYTQTFGNL AYIIKARVQG LRDIGAALSP FNSFLFLQGL ETLPLRMERH 
SKNALAVARY LSEHPKVAWV NYPGLPSHPS YPLAQKYLPR GQSGIVGFGL KGGRNAGRIF 
IERLRLFSHL ANIGDAKSLA IHPATTTHSQ LTPEEQRLTG VTDDYVRLSI GLETIDDILA 
DLDQALAGTP S