Gene Amuc_1821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1821
Symbol
ID	6275762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	2210941
End bp	2212125
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	58%
IMG OID	642613885
Product	putative SAM-dependent methyltransferase
Protein accession	YP_001878420
Protein GI	187736308
COG category	[R] General function prediction only
COG ID	[COG1092] Predicted SAM-dependent methyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00015725
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGGTT TGATTATTTC TCCAAGAGCA CGCATTTTTC AAGGGCACGA CTGGGTTTAC 
GGCACGGAAG TGCGCAAAAT TTTCGGCAAT CCGCAGCCGG GGGACGTCGT GGCCCTGAAG 
GATTTCAAGG ACCGCTTTCT GGGTTCCGCC ATGTTCAATC CCCATTCCCA GATCGTCGCC 
AGGCGCTTTT CCCGCCGCAA ACAGGAACTG AACGGAGATT TCTTTTCCAG GCGCATCAGC 
CAGGCAGTAG AACTGCGCCG CCGCCGGCTT CCGGAAGAAA CTCTCACCCG GCTCGTTTGG 
AGCGAATCCG ACGGGCTTCC CGGCCTCATT GTGGACCGTT ACGCGGATTA TCTGGTCGTC 
CAGACGCTGA CGATCGCCAT GGAATGCCGC CTCCCCATCA TCCTGAATGT TTTGGAAGAC 
CTTCTTTCTC CCCGCGGGAT TATTGTCAGG AATGATTCAC CCATGCTGGC GGCAGAAGGT 
ATTTCCCCCT CCGTCCGGGT GGCACGAGGA CAGCAACCGG AACCTTTTGC CGCACGCAGC 
GGCAGCGTGC AATTCATGAT TGACCTTCAG ACGGGACAAA AAACCGGCCT GTATCTGGAC 
CAGCTTGACA ATTATGCCGC CGTGGCTCGC TTCGCCCGCG GACGCCGCGT GCTGGACTGC 
TTCTGCAACC AGGGCGGTTT CGCCCTGGCC TGCGCCCTTG CCGGTGCCTC GGAGGTAACG 
GCCGTGGACG TTTCCCAGGA TGCTATGGAC GCCGTAGCGC GGAACGCCCG CCTGAACGGA 
GTCTCCGTGC AGTGCGTCAC GGATAACGCG TTTGACTTCC TGAAAAAGGA AGCGGCCCTT 
GTCCGGGACG GAGGAGAACA CAAATGGGAT TTAATTATCC TGGATCCGCC CTCTTTTACC 
AGAAACAAAA AATCCGTGCA TGACGCCATG CGCGGATATA AGGAAATCCA CCTCCGCGCC 
ATGAAGCTTC TGGCCCCGGG AGGCATCCTT TCCACCTTCT GCTGTTCCCA CCACGCCGGA 
GCGGACCTGT TCCGGGAGAG CGTGCTTGAC GCCGCCATTG ATGCTCCGGC CACCCTGCGT 
CTGATGCAGC AACACGGCCA AAGAGCGGAT CATCCGGTTT TATTGAATAT TCCGGAAACG 
GAATACCTGA AGGGGTTCAC GTATGAACTG CTTCCCGGAA GATGA

Protein sequence

MAGLIISPRA RIFQGHDWVY GTEVRKIFGN PQPGDVVALK DFKDRFLGSA MFNPHSQIVA 
RRFSRRKQEL NGDFFSRRIS QAVELRRRRL PEETLTRLVW SESDGLPGLI VDRYADYLVV 
QTLTIAMECR LPIILNVLED LLSPRGIIVR NDSPMLAAEG ISPSVRVARG QQPEPFAARS 
GSVQFMIDLQ TGQKTGLYLD QLDNYAAVAR FARGRRVLDC FCNQGGFALA CALAGASEVT 
AVDVSQDAMD AVARNARLNG VSVQCVTDNA FDFLKKEAAL VRDGGEHKWD LIILDPPSFT 
RNKKSVHDAM RGYKEIHLRA MKLLAPGGIL STFCCSHHAG ADLFRESVLD AAIDAPATLR 
LMQQHGQRAD HPVLLNIPET EYLKGFTYEL LPGR