Gene Athe_1190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1190
Symbol
ID	7408772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1281259
End bp	1282488
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	37%
IMG OID	643715555
Product	O-acetylhomoserine aminocarboxypropyltransferase
Protein accession	YP_002573063
Protein GI	222529181
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGTTTA ATACTTCTTT AATTCATGGA GGTATTGGTC AAAAAGAAAA TAAGGGGGCA 
ACTAACATTC CGATATACCA ATGTAATTCT TTCCAATATG AAACTGCACG TGAGTTGGAA 
GAGGTTTTTT CTGGCAAAAA GCCAGGCTTT ATATATACAA GGATTAACAA TCCCACAGTT 
GAAGCGTTTG AAAGAAGAAT AGCATTTTTA GAAGAAGGCA TTGCTGCTGT TGCCACATCA 
TCTGGCATGG CAGCCGTTGC CTTAGCAATA TTGAATTTAG TAAGAAATGG AGATGAAATT 
GTTTCAGCAA GCGGGATTTT TGGTGGCACA TATTCATTGT TCAGATCATT TGAAAACCTT 
GGTATTAAGA CAAGATTTGC AGAAGATAGC AGCCTTGAGA GCTTTGAAAA GCATATAACA 
GAGAAAACTA AAGTAATTTT TGTAGAAACA ATAGGAAATC CAAAACTGGA TGTGCCAAAT 
ATCAAACAAA TAGCTGAGCT TGCGCATGAG CATGGTATTG CACTCATTGT TGATAGCACT 
GTCACAACAC CGTACCTTGT AAAACCCATA AAACTCGGTG CTGATATAGT GGTTCATTCT 
ACATCAAAGT TTATAAATGG AAGCGGCAGC TGTATTGGCG GAGTTATAGT TGCAAGCAGC 
AACATGAAAA TTGATTATGA TAGGTATCCG CTTATTAAGG AATACAAAAA GTATGGTGAA 
TTTGCGTACA TTGCACGACT TCGAAATAAT TTGCTTAAAG ATTTTGGCGC CTGTATATCG 
CCTTTTAATG CATTTTTAAA TACAATCGGG CTTGAAACCC TCGGTGTTCG TATGCAAAAG 
ATTTGCGAGA ATGCTCTTTG CCTTGCCAAA GCCCTAAAAG AAAATAAGAA GGTTGTTTCA 
GTAAATTACC CTGGGCTTGA TGAAAGTAGT TACTTTAGAG TTGCAACAGA ACAGTTTGGA 
GGCAAATATG GAGCAATTTT GACAATACGG GTTGGAACAA AGGTGAATGC CTTTAAAGTG 
ATAGATTCAT TGCGATATGC CATAAATTCA ACCAATATAG GAGATGTAAG GACACTTGTT 
GTACATCCTG CGTCAACTAT ATATGCAAGC TTTTCTGTTG AAGAAAAAGA ATCTATGGGT 
GTTTATGAAG ATATGATAAG AATATGTGTT GGCCTTGAGG ATGTAGAAGA CATAATAGAA 
GATTTTTACC AGGCACTTGA AAAGATTTAA

Protein sequence

MRFNTSLIHG GIGQKENKGA TNIPIYQCNS FQYETARELE EVFSGKKPGF IYTRINNPTV 
EAFERRIAFL EEGIAAVATS SGMAAVALAI LNLVRNGDEI VSASGIFGGT YSLFRSFENL 
GIKTRFAEDS SLESFEKHIT EKTKVIFVET IGNPKLDVPN IKQIAELAHE HGIALIVDST 
VTTPYLVKPI KLGADIVVHS TSKFINGSGS CIGGVIVASS NMKIDYDRYP LIKEYKKYGE 
FAYIARLRNN LLKDFGACIS PFNAFLNTIG LETLGVRMQK ICENALCLAK ALKENKKVVS 
VNYPGLDESS YFRVATEQFG GKYGAILTIR VGTKVNAFKV IDSLRYAINS TNIGDVRTLV 
VHPASTIYAS FSVEEKESMG VYEDMIRICV GLEDVEDIIE DFYQALEKI