Gene Amuc_2013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2013
Symbol
ID	6275754
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2445725
End bp	2447011
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	59%
IMG OID	642614072
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_001878604
Protein GI	187736492
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.024983
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.048822
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAAGA ACCATCGATT TGAAACACGC CAGATCCATG TGGGTCAGGA AAGTCCGGAT 
CCGGCCACCG ATGCGCGCGC CGTGCCTATT TACGCCACCA CTTCGTATGT CTTCAAAGAC 
TCGGAACAGG CGGCAGGCCG TTTTGCCCTG GCGGAGCCGG GCAATATTTA TAACCGCCTG 
ATGAACCCTA CCGCAGATGT TTTTGAAAAA CGCATCGCCT CCCTGGAAGG AGGGACGGCC 
GCGCTGGCCG TCTCCACCGG GGCTGCCGCT GTCACGTATG CCATCCAGAA CATCGCCCGG 
GCCGGGGACC ACATCGTTTC TTCTTCCACC GTATATGGCG GGACGTATAA TCTCTTTGCC 
AATACGCTGG CGGACGCCGG CATAGAAACC ACTTTCGTGG ATGCAAGGGA CGTTCAGAAT 
TTTTCCAGGG CCATCCGGAA CAATACCAAG GCCCTGTACG TGGAAAGCCT GGGCAACCCG 
AACTGCGACA TCGTGGATAT GGAAGCGCTG GCGGAAGTGG CGCACGCCCA CGGCATCCCG 
CTCATTGTGG ACAGCACGTT CGCCACGCCC TTCCTGTTCC GCCCCCTGGA ACACGGAGCG 
GACATCGTGG TGCATTCCGC TACCAAATTC ATCGGCGGCC ACGGCACGGT GATGGGCGGC 
GTGATTGTGG ACGGCGGTAA ATTCGACTGG ACGCAGAACG ACAAGTTCCC CGGCATCAGC 
AAGCCCAACC CCAATTACCA CGGAGCCGTG TTCGCTGAGG TATGCGGCAA TCTGGCCTAT 
ATCGTCAAAA TCCGGGCCAC CCTGCTGCGG GATACGGGAG CCACCATCAG CCCGTTCAAC 
TCCTTCCTGC TGCTCCAGGG GCTGGAAACA CTCTCCCTGC GGGTGGAACG CCATGTGCAG 
AACGCCCTGC GCGTAGCGGA CTATCTGGCC TCCCATCCCC AGGTGGAGAG GGTGAACCAT 
CCCTCCCTGC CGGACCATCC GGACCACGAC CTTTACAAGA GATACTACCC GAACGGGGGC 
GGCTCCATCT TCACCTTTGA AATCAAGGGT GGCGCGGAAA AAGCTCGCAA ATTCTGCGAA 
AGCCTGGAAC TATTCTCCCT GCTCGCGAAC GTGGCGGACG TCAAGTCCCT GGTGATTCAT 
CCGGCCTCCA CCACCCATTC CCAGATGACG GAGGAGGAAC TGAAGGCGGG AGGCATTACG 
CCATCCACCG TGCGGCTTTC CATCGGGACG GAACATATCG ACGATATTCT GGAAGATCTG 
GAACAAGGCT TCCGCGCCAT TCTCTAA

Protein sequence

MSKNHRFETR QIHVGQESPD PATDARAVPI YATTSYVFKD SEQAAGRFAL AEPGNIYNRL 
MNPTADVFEK RIASLEGGTA ALAVSTGAAA VTYAIQNIAR AGDHIVSSST VYGGTYNLFA 
NTLADAGIET TFVDARDVQN FSRAIRNNTK ALYVESLGNP NCDIVDMEAL AEVAHAHGIP 
LIVDSTFATP FLFRPLEHGA DIVVHSATKF IGGHGTVMGG VIVDGGKFDW TQNDKFPGIS 
KPNPNYHGAV FAEVCGNLAY IVKIRATLLR DTGATISPFN SFLLLQGLET LSLRVERHVQ 
NALRVADYLA SHPQVERVNH PSLPDHPDHD LYKRYYPNGG GSIFTFEIKG GAEKARKFCE 
SLELFSLLAN VADVKSLVIH PASTTHSQMT EEELKAGGIT PSTVRLSIGT EHIDDILEDL 
EQGFRAIL