Gene Amuc_1539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1539
Symbol
ID	6273671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1849845
End bp	1851008
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	60%
IMG OID	642613598
Product	homoserine O-acetyltransferase
Protein accession	YP_001878141
Protein GI	187736029
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000120571
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCTTC CTGCCGTCCA AACCAAATTC CTGGATCTTC CCAACTCCTT CTCCCTGAGA 
AATGGAGCTA CGCTGGACAA GGTTCGCGTC GCCTACGAAC AATACGGAAC CCTGACGCCG 
AATAAAGACA ACGCCATCCT GCTGTTCCAT GCTCTTTCCG GCAGCCAGCA CGCCTACGGT 
TACAATCCGG AAGTCCCGGG CATCGATTCC CTCTGGAAAC CGGAAAACCA CGAGGGCTGG 
TGGAACAGCA TCATCGGCCC CGGCAAGCCG CTGGACACAA ACTGCTTCTG CATCATCTGC 
GCCAATTACC TGGGAGGCTG CTACGGCACC ACAGGCCCCG CTACCCCCTG CCCTGCGGAC 
GGCCAGCCCT ACGGCTCCCG TTTCCCGCAT GTGGAGGCCG CAGACCAGGC ACGTCTCCAG 
GCCCTTCTGC TGGACAGCCT GGGCATAGAA CGCGTTCATC TTATGGGCCC CTCCGTGGGC 
GGACTGATCG CCCTCAGCTT CGCGTGCCAG TTCCCGGAAC GGGTCCGGAG CTTCATCTCC 
ATCGGCTCCG GTTACCGGGC TTCCATTGAA CACCGCCTGT CCCTGTTTGA ACAAATCCTG 
GCCATTGAGC TTGACCCGGA TTTCCAAGGC GGGGATTACT ACCGGGGACC GGCGCCAAAA 
AAAGGGCTGG CGTTCGCCCG TATCATCGGC CACAAATCAT TTGTTTACCA GGAGGGGCTG 
GAACAGCGCG CCAGAAAAGA GGTGGGAGGC AACTACGGCC TGCTCACGTG GATGACCCCC 
ACCCGCAGCA CGCAAAGCTA CATGCTTCAC CAGGGAACCA AGTTCGCGGA GCGCTTTGAC 
GCCAACGCCT ATATCCGTAT TGCGGATATG TGGGCGGAGT TCGACATCCG CGACCACACC 
CCGGACGGAA CATTTCAAAC CGCCCTGGAA GGCTTCCGCC GCGCAGGGAT TCCCGCGCTT 
ATCTTTTCCA TTGATACAGA CTGCTGTTTC CGCCCGGCGG AACAGCAGGA TTTCGCGGCG 
CAGCTTGAAG CCGCCCATAT TCCCACGGAG TTCCATACCA TCGCTTCCAC CAAGGGACAC 
GATTCCTTCC TGCTGGAGCC GGAGCTTTAT GCGGAACCCA TCCGGCGCAT TCTGGCGGCA 
AGGAAGCCGA AGGGGACGGC GTAA

Protein sequence

MQLPAVQTKF LDLPNSFSLR NGATLDKVRV AYEQYGTLTP NKDNAILLFH ALSGSQHAYG 
YNPEVPGIDS LWKPENHEGW WNSIIGPGKP LDTNCFCIIC ANYLGGCYGT TGPATPCPAD 
GQPYGSRFPH VEAADQARLQ ALLLDSLGIE RVHLMGPSVG GLIALSFACQ FPERVRSFIS 
IGSGYRASIE HRLSLFEQIL AIELDPDFQG GDYYRGPAPK KGLAFARIIG HKSFVYQEGL 
EQRARKEVGG NYGLLTWMTP TRSTQSYMLH QGTKFAERFD ANAYIRIADM WAEFDIRDHT 
PDGTFQTALE GFRRAGIPAL IFSIDTDCCF RPAEQQDFAA QLEAAHIPTE FHTIASTKGH 
DSFLLEPELY AEPIRRILAA RKPKGTA