Gene Amuc_0227 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0227
Symbol
ID	6275302
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	283179
End bp	284420
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	56%
IMG OID	642612272
Product	hypothetical protein
Protein accession	YP_001876851
Protein GI	187734739
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCCTGT TGGCCGCTTG TTGGTATGCC GCCTTTCCGG CGGCGGAAGC TGGCGCGGGA 
GCAGTTCAGT CCCAGCCGGT TTCCGGGGGC TCTCTGCCGT CCCTGTGCCG TGTGCTGGAT 
CGCGGTCCGG TGCTGTACCG GAATGATTCC TCATGGATCA GGAAGGTGAA GCTGACGCTG 
ATTGGCCAGT ATCAGGCAGC AGCCGTCAGC CCCAATGGGG CCAATAAATT CTGCCCGTCT 
TCCGGCGGCC ATAACAACGG GTGGAGGCGC GCTTACCTGG GCGGCGACAT CCTGATGGGG 
GACGGTTCCT GGCGCCTGTC CAATCTGACG AATGTGGGGG ATTTGGAAGG CCGGCACCGT 
GAAGTGCGGG GAGAATGGAT CGGCAGCCAT ACGGAGTGGT CCCTGTATGA ACTTTATCTG 
GAAAAGACCA TGCCCGGCGT CAAGCTCAGG GCCGGGAAGC TGACGCCTCA CCTGACGTCG 
GAGTATTGCC TGGCTTCCTC CCGGATTAAA ACAGTAGAGA GATCCGCCCT GTGCAATGAA 
TTGATTCCCA TTTCCAACTG GGGGCTGGAG GCCAATTTTC AGAAGGATGC CAAGAGCCTG 
TACCATTCCT ACGGCATTTA CCTGAATGCG AACGGTACGG ATTTGAAGGA TGAGATCCAG 
TTTCATTCTG CGGACAACCT GTTTATCCTG AACGCCATGA AGTGGAAGGT GGCTTCTCCC 
ATGTGGGACA GCCAGTTTCT GGGGTACCAG TATGCCCATA ATTTTACGGA ATGGCGGGGA 
AGGAAAATTC CTTCCACGTC CGATTACTGC GGAACGGGGG CGCAGGACGT GATTTCCCTG 
AGCTGGGACG CCAGCCGCGG CGCTTTCTCC ATCATGGGAA ATTTGCTGGC GGGCGTGGGA 
ATTGTAGGCC AGCCCGGTGC AAAGAATGTG TACGGCCTGG TTCTGCAGCC CGTTTACCGG 
ATTTCCCCGC ATTTTGAGGG CGTCTTTCAA TACCAGTGTT CCTTTGGAAA CCGTTCTGTG 
AAGCTGAATA CCCGTTATGT GCCCAGCGTC ACCCATTATC CCGCATGGGT GGACAGCATG 
CATTCCTTTT ACCTGGGGCT GAATTGCTAT CTGTGTCCGG AGGCCGTCAA TGCGGTCAAG 
CTGATGCTGG CTGTAGAGTA TGTCACCAGC CATGTGGATT CGGCAACGGC CAAAGCTTTC 
AATGGATGGT CTGTTTTCGG GGCTGTCCGC TTCAAGTTCT GA

Protein sequence

MFLLAACWYA AFPAAEAGAG AVQSQPVSGG SLPSLCRVLD RGPVLYRNDS SWIRKVKLTL 
IGQYQAAAVS PNGANKFCPS SGGHNNGWRR AYLGGDILMG DGSWRLSNLT NVGDLEGRHR 
EVRGEWIGSH TEWSLYELYL EKTMPGVKLR AGKLTPHLTS EYCLASSRIK TVERSALCNE 
LIPISNWGLE ANFQKDAKSL YHSYGIYLNA NGTDLKDEIQ FHSADNLFIL NAMKWKVASP 
MWDSQFLGYQ YAHNFTEWRG RKIPSTSDYC GTGAQDVISL SWDASRGAFS IMGNLLAGVG 
IVGQPGAKNV YGLVLQPVYR ISPHFEGVFQ YQCSFGNRSV KLNTRYVPSV THYPAWVDSM 
HSFYLGLNCY LCPEAVNAVK LMLAVEYVTS HVDSATAKAF NGWSVFGAVR FKF