Gene Amuc_2065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2065
Symbol
ID	6274745
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	2508222
End bp	2509376
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	52%
IMG OID	642614127
Product	acyltransferase 3
Protein accession	YP_001878656
Protein GI	187736544
COG category	[S] Function unknown
COG ID	[COG3274] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.393482
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACCA ACCAATCATT GAACTCCCGC GGCGGCCACA TCGCCTGGGT GGACTTTCTG 
CGTATTCTGG CCTGCTTCCT CGTTGTCCTA GCCCATTGCT GTGATCCGTT CGTTGGAAGT 
TTTGACGGTT CCTTCAACTT TAAATCCGCT GTCTTCTGGG GAAGTCTGGT ACGGCCGTGC 
GTGCCTTTGT TTGTCATGAT CTCCGGAGTG TTGCTTTTTC CCGTCACCTT GGAAATGGGC 
GCTTTTTACT CCAGGCGCCT CAAGAGGGTG CTGGTTCCGC TCATTGTCTG GTCACTGGCG 
CTTCCCTTGC TCTACTTCGG ATACTTTGCC GCAGGCGTTC AAACGGCCAG CCCCAACATC 
GTGATGGACA CTTATACTTG GAGTGCCACC GTCGGCAAGC TGTATACCTT CTTCTTCAAC 
TTCAACTATG ATACCACGCC CCTGTGGTAT GTATACATGC TGGTAGGCCT GTACCTCTTC 
ATGCCCATCA TGAGCGCGTG GCTGACGCAA GCCAGAAGGA AAGATGTGAA AATCTTCCTG 
GGCATCTGGA TATTCAGCAT GACTCTCCCC TACATCCAGA TGCTTGCTCC GGCACTGGGT 
TATGAGGGCA ATTACGGCAA CATGGGTATT CTGGGTGTTT GCGATTGGAA TCCGTACGGT 
ATGTTTTATA ACTTTTCCGG ATTCCTGGGA TACATGGTGC TGGCGCATTA CCTGACCAAA 
TACCCACTGG CCTGGAGCTG GAAAAAAACG CTGTCCATTA CTATTCCCCT CTTTTTGATT 
GGTTTTGCCG TTACGTTCTT CGGCTTTCTG GAAACACAGA AGCACTTCCC CGGCCAGTAT 
TCCAAGCTGG AAGTGCTCTG GTATTTCTCC GGAATCAATG TATTCCTGAT GACCTTTGCC 
ATCTTTGCCG TCGTCAGCCG GCTCAGAATC AAGGCTGGTC CAGTGCTGAG CAAGGTGGCG 
GCGCTTACTT TCGGCGTGTA TCTGTGCCAC TTCTTCTTTG TCCAGTGCTC CTATGACTTC 
GTGAACTTCA TCGGGCTGGG AGGGCTGCCC TCCGCCGTGA AAATTCCGTT GATGGCCTGT 
CTGGCCTCCG CTGTCTCCGC GGCGTTGGTA TGGCTGTTGA GCCTGAACAG GTGGACGCGC 
AAAAGCATCA TGTAA

Protein sequence

MNTNQSLNSR GGHIAWVDFL RILACFLVVL AHCCDPFVGS FDGSFNFKSA VFWGSLVRPC 
VPLFVMISGV LLFPVTLEMG AFYSRRLKRV LVPLIVWSLA LPLLYFGYFA AGVQTASPNI 
VMDTYTWSAT VGKLYTFFFN FNYDTTPLWY VYMLVGLYLF MPIMSAWLTQ ARRKDVKIFL 
GIWIFSMTLP YIQMLAPALG YEGNYGNMGI LGVCDWNPYG MFYNFSGFLG YMVLAHYLTK 
YPLAWSWKKT LSITIPLFLI GFAVTFFGFL ETQKHFPGQY SKLEVLWYFS GINVFLMTFA 
IFAVVSRLRI KAGPVLSKVA ALTFGVYLCH FFFVQCSYDF VNFIGLGGLP SAVKIPLMAC 
LASAVSAALV WLLSLNRWTR KSIM