Gene Apar_0372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_0372
Symbol
ID	8413221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	427063
End bp	428343
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	50%
IMG OID	645021940
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_003179394
Protein GI	257784177
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAGA GCATCGAGAC TCGCTGCGTA CAAGGCGGTT ATCAGCCTGG TTGTGGCGAG 
CCTAGGCAAG TGCCTATCAT TCAATCAACC ACGTTCAAAT ATGACGAGTC GATGCAGCTT 
GGAGAGTTGT TCGACCTCAA AGCTGCTGGC TATTTTTATT CTCGTGTTCA GAATCCAACG 
CTTGATAATG TAGCGTCAAA GATTTGTGCT CTTGAGGGCG GCACTGCTGC AATGCTGACA 
TCCTCTGGTC AAGCAGCAAA CTTCTTTGCC GTCTTTAATA TTGCTGAGGC TGGAGATCAT 
TTTATTGCGC TTTCCACCAT TTATGGCGGC ACCTTTAACC TGTTTGCTAT CACCCTCAAG 
AAGATGGGTG TGGAGTGTAC GTTTATCTCG CCAGATGCAA CTGACGAGGA GATCAATGCT 
GCCTTTAGGT CAAATACTAA GTGCGTTTTT GGCGAGACTA TTGCAAATCC TGCACTGGTT 
GTTCTTGATA TTGAACGCTG GGCAAAGGCT GCTCATGACC ATGGTGTGCC GCTGATTGTT 
GACAATACCT TTGCTACACC TGTGAACTGT CGTCCTCTTG AGTGGGGAGC AGATATTGTG 
ACCCATTCTA CTACCAAGTA TATGGACGGT CACGGCTGTG CTGTTGGCGG TGCAATTGTT 
GATGGCGGCA ACTTTGATTG GGCTACTCAT GCAGACAAGT TCCCAGGTCT GACCCAGCCC 
GACCCTTCGT ATCACAACCT TGTTTATACC GATACCTTTG GCAACGGCGG CGCTTTTATT 
ACGAAGGCAA CTGTTCAGCT TATGCGCGAC TTTGGCTCCA TTCAGTCACC TCAGAGCGCT 
TTCTATCTCA ACCTTGGCCT TGAGTCTCTA CACGTTCGTA TGGCTCAGCA TTGCAAGAAT 
GGCCAAGCAG TTGCCGAGGC ACTTGCTAAT AACCCTAAGG TTGCCCATGT AAGCTATCCA 
GATCTTCCGG GTGATACGTA CTATGACCTG GCTCAGAAGT ACCTTCCTGG TGGGTCCTGT 
GGTGTTATCA CCGTTGATGT TGCGGGTGGT CGCGAGGCTG CCGAGAAATT CCTGGGTAAC 
CTCAAAGTCT TCTCCATTGC AACACATGTT GCAGACGCTC GTTCTTGCTG TCTGCACCCA 
GCTTCTTCAA CGCATCGTCA GCTTACTGAC GAGGAGCTTG TAGCAGCAGG TATTACTCCA 
GGTACCGTTC GCTTAAGCTG TGGTATTGAG GGCACTGAGG ACCTTATCAA CGACGTCGAG 
CAGGCACTTG CTGCTCTGTA G

Protein sequence

MSESIETRCV QGGYQPGCGE PRQVPIIQST TFKYDESMQL GELFDLKAAG YFYSRVQNPT 
LDNVASKICA LEGGTAAMLT SSGQAANFFA VFNIAEAGDH FIALSTIYGG TFNLFAITLK 
KMGVECTFIS PDATDEEINA AFRSNTKCVF GETIANPALV VLDIERWAKA AHDHGVPLIV 
DNTFATPVNC RPLEWGADIV THSTTKYMDG HGCAVGGAIV DGGNFDWATH ADKFPGLTQP 
DPSYHNLVYT DTFGNGGAFI TKATVQLMRD FGSIQSPQSA FYLNLGLESL HVRMAQHCKN 
GQAVAEALAN NPKVAHVSYP DLPGDTYYDL AQKYLPGGSC GVITVDVAGG REAAEKFLGN 
LKVFSIATHV ADARSCCLHP ASSTHRQLTD EELVAAGITP GTVRLSCGIE GTEDLINDVE 
QALAAL