Gene Amuc_1957 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1957
Symbol
ID	6275053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2372975
End bp	2374396
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	58%
IMG OID	642614017
Product	membrane protein-like protein
Protein accession	YP_001878551
Protein GI	187736439
COG category	[S] Function unknown
COG ID	[COG2364] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.217761
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.00755155
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAAGATT ATCGTGTCCG GAGAAGCCTT GGAGAACATG TCCTGCGCTG CTCCGTCCTG 
ATTGCTGCGC TCTTCATCAT GTCTCTGGGC ATCGCTCTGT CCACCAAGGC AGACCTGGGA 
GTCTCCCCCA TCTCCTGCAC GCCCTATGTG CTCAGCCTGG CATTCCCTCT AACCATGGGG 
ACCGTCACCA TCCTCATGCA CCTGAGCTTT GTGGCCGTGC AGGCGGCCCT GCTGAAAAGG 
CAATTCCGTC CGGCGCATCT GCTCCAGATT CCCATAGCTT TTATCTTCGG CTTTCTGACG 
GATTTTTCCA TGTGGATCAT AGCGCCTCTG GAACCGGACG GATACCTGTG GTCCGTTATT 
CTCTGCCTGT TCAGCTGCGT GGTAATCGGA TTCGGCGTCT TTCTTCAGGT TAAGGCGGAT 
TCCGTTCTTC TGGCAGGGGA AGGCATGAGC CTGGCCTTCG TCAAACTCTT CAAATGGGAA 
TTCGGAGCCG TAAAAACCGG GATGGACTGC ACGCTCGTCT GCATCGGCCT GGCCTGTTCC 
CTCATCTTCC TGCCCGGACT GACAGGCATA CGGGAAGGAA CCGTGGTGGC CGCCGTCCTG 
GTGGGAATGA TCGTCCGTTT TTTCAACAGG CACGTCTTCT GGCCGGACAG GCTCCTGGAA 
CGGCTGGCGC GCCCCGGAGC AGCAAGCGAG CTTCCTCCGC TGGCACAAAC GGCCGCTTAT 
GCTCCGGACG CCCCTCTGGT CATTTCCATT GACCGGGAAT ACGGTTCCGG CGGCCATGCC 
ATCGGGAAAA TGCTGGCGGA AAAGCTGGGC ATCCGATTCT ACGACTCGGA ACTGGTGTAC 
CTCACAGCCT CCCGGAGCGG CCTCACTCCG GACTACATCC GCAAGCACGA ACAACAGCTT 
TCCAGCCGCT TCCTGCACGA ACTTTACGCC CAGAACTATG CCTACACGGC GGAGGAAATG 
CCCCCTGAAG ACGCCACCTT CCTGGCACAG AGCAAAGTCA TCCGGGACAT TACGGCCAGT 
CAGGCATGCG TCATCGTGGG CCGCTGCGCC AACTTCATCC TGAAAGGGAG ACCCAACCTG 
TTCAGTGTTT TCCTTCATGC GGACCGGGCC ACGCGCATGC AGCGCGTTAT TGAAAACTAT 
GGGGTAGAAC CTGGCGGGGC AGCCCGGGCC ATGGACATCA TGGACTCCCG CCGCCGCACC 
CACTGCCTGC ACTACACCGG GCAGGAACTG GGCAATGCAC GCCTCTACGA CTTGTGCGTC 
AACACGTCCG ATTACGGACT GAAACGCACG GTGGAACTGA TTCTGGAAGC CATCAATACC 
AGAACCGAAC AATCTTCCGC TGTAGAAACG GTTCCCGTCC GCTCCGCATC TTTTCCCGAA 
CCGGAAGAGG ACAGCATTCC CGGAGAAATA TCCCTCGCCT GA

Protein sequence

MEDYRVRRSL GEHVLRCSVL IAALFIMSLG IALSTKADLG VSPISCTPYV LSLAFPLTMG 
TVTILMHLSF VAVQAALLKR QFRPAHLLQI PIAFIFGFLT DFSMWIIAPL EPDGYLWSVI 
LCLFSCVVIG FGVFLQVKAD SVLLAGEGMS LAFVKLFKWE FGAVKTGMDC TLVCIGLACS 
LIFLPGLTGI REGTVVAAVL VGMIVRFFNR HVFWPDRLLE RLARPGAASE LPPLAQTAAY 
APDAPLVISI DREYGSGGHA IGKMLAEKLG IRFYDSELVY LTASRSGLTP DYIRKHEQQL 
SSRFLHELYA QNYAYTAEEM PPEDATFLAQ SKVIRDITAS QACVIVGRCA NFILKGRPNL 
FSVFLHADRA TRMQRVIENY GVEPGGAARA MDIMDSRRRT HCLHYTGQEL GNARLYDLCV 
NTSDYGLKRT VELILEAINT RTEQSSAVET VPVRSASFPE PEEDSIPGEI SLA