Gene Amuc_0247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0247
Symbol
ID	6275266
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	304260
End bp	305948
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	54%
IMG OID	642612295
Product	ribosomal protein S1
Protein accession	YP_001876871
Protein GI	187734759
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID	[TIGR00717] ribosomal protein S1

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACAA CTGAACTGGC GGAACTTATT GACAGCAAGT TCCGCGAATT GCGTGAAGGT 
TCCATTGTTA CCGGAACCAT CCAAGAAATC CGTCCCCAAG TCGTTTTGGT GGACATCGGC 
TACAAGTCCG AAGGCGCTAT TTCCATTTCC GAGTTTGAAG ACGAGGAAAT CGAAGTGGGG 
GACCAAATTG AAGTCCTTTT GGAACGCCTC GAAAACGACG AAGGCATCGT CGTCCTTTCC 
AAGGAAAAGG CCGCCCATAA GCAGAACTGG GATAAGATCG TGGGCGTGTA CCGCGATGGC 
GGCCTGGTTA AGGGTAAAGT GAAGAGCGTC GTCAAGGGCG GTCTTATGGT CAATGTTGGC 
GTGGAAGCTT TCCTGCCCGG TTCCCAGGTG GATATTATTC CTCCTCGCGA CCTGAACGAG 
TATGTTGGAA AAGTTTACGA ATTTAAGATC GTCAAGGTAA ATGACGACCG TAAAAATATC 
GTCCTTTCCC GCCGTGAGGT GATTGAAGCC GAACGCGCCG ACCAGCGCCA GCGCTTCCTT 
GAAACCGTCA AGGAAGGCGA CAAGGTGGAA GGTATCGTGA AGAATATCAC GGACTTCGGC 
GCTTTTGTCG ACCTCCGCGG CATGGACGGC CTGCTCCATA TCACGGATAT GAGCTGGGGC 
CGCGTGAACC ATCCGAGCGA AATGCTCCAT ATCGGTCAGT CCCTGGAAGT CGTGATTCTG 
GAAGTGGATC GCGAAAAGGA ACGCGTTTCC CTGGGCCTGA AGCAGATGAC AGACAACCCC 
TGGGCGGATA TCGAACGCAA ATACCCGATC AATTCCCATG TCAAGGGCCG CGTGACCAAG 
CTCCTGCCTT ACGGCGCCTT TGTGGAATTG GAAAAGGGCG TGGAAGGCCT AGTGCACGTT 
TCCGAATTGT CCTGGGTCAA GAGAATCACC CGTCCGAGCG ATGTATTGAA GCTGGACCAG 
GAAATCGAAG CCGTGGTTCT TTCCATTTCT GTGAAGGAAC AGAAGATTTC CCTCGGTGTC 
CGCCAGTTGG AAGACAATCC CTGGGCGGAT ATCGAATCCC GTTTCCCGAT TGGTACCGTC 
ATCAAGGGCC AGGTTCGCAA CCTTACTCCC TACGGCGCTT TTGTGGGACT GGAAGAAGGC 
ATCGACGGCA TGATCCACGT GTCCGATATG AGCTGGACCC GCAAGATCAA TCATCCCTCC 
GAAGTTCTCA AGAAGGGCGA CGAAGTGGAA GCCATCGTTT TGGAAATCAA GAAGGAGGAT 
CAGCGCGTCT CCCTTGGTAT CAAGCAGCTT GAGTCCGATC CGTGGGAATC CATCAATGAC 
CGCTTCAAGG TGGGCGATAT GGTGACTGGC CAGGTGGCCA AGATTGCCAG CTTCGGCGCC 
TTTGTGAATC TGGACGGCGA TATTGACGGC CTGATTCATA TCTCCCAGTT GAGCGAAGAC 
CATGTGGAAC GCGTGAAGGA TGTGATCAAG GTGGGTGATG AAATCACTGC CCGCGTGATC 
AAAGTGGACA GCATCGAACG CCGTATCGGC CTTTCCATCA AGGCCGTCAA TTACGACACC 
GAACAGCTCC GCCGCGAAAC CGCTTCCTTT GAAGCCCTCC GCCCGAGCAG CGATATGGTG 
GGTCTGGAAC ACGCCTTCAA TCTGGCTACC CGTGAAAACG AAGAGTGGAG CCCTTCTGAA 
GAGAAGTAA

Protein sequence

MSTTELAELI DSKFRELREG SIVTGTIQEI RPQVVLVDIG YKSEGAISIS EFEDEEIEVG 
DQIEVLLERL ENDEGIVVLS KEKAAHKQNW DKIVGVYRDG GLVKGKVKSV VKGGLMVNVG 
VEAFLPGSQV DIIPPRDLNE YVGKVYEFKI VKVNDDRKNI VLSRREVIEA ERADQRQRFL 
ETVKEGDKVE GIVKNITDFG AFVDLRGMDG LLHITDMSWG RVNHPSEMLH IGQSLEVVIL 
EVDREKERVS LGLKQMTDNP WADIERKYPI NSHVKGRVTK LLPYGAFVEL EKGVEGLVHV 
SELSWVKRIT RPSDVLKLDQ EIEAVVLSIS VKEQKISLGV RQLEDNPWAD IESRFPIGTV 
IKGQVRNLTP YGAFVGLEEG IDGMIHVSDM SWTRKINHPS EVLKKGDEVE AIVLEIKKED 
QRVSLGIKQL ESDPWESIND RFKVGDMVTG QVAKIASFGA FVNLDGDIDG LIHISQLSED 
HVERVKDVIK VGDEITARVI KVDSIERRIG LSIKAVNYDT EQLRRETASF EALRPSSDMV 
GLEHAFNLAT RENEEWSPSE EK