Gene Amuc_1685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1685
Symbol
ID	6275725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2046109
End bp	2048115
Gene Length	2007 bp
Protein Length	668 aa
Translation table	11
GC content	55%
IMG OID	642613744
Product	extracellular solute-binding protein family 5
Protein accession	YP_001878284
Protein GI	187736172
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0732988
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	0.758738
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGGCA GGGGGATGCC TGCCGTATTT GACGGTTTTG TGGAACGCTG GAACAGGGCC 
GTGGAACGGG AACTGCGCCG TGAATTGGCT GAAGGGGAGA GGAAGGAAAA ACTTCTGGTC 
GTTTCCCGCG GGGAAGGGGA CGGCCGGCGT TTGGCGGAAC AGGCTCGTTC CGTGGAACGC 
ATCAGGAAAA GGCTGTTATT GAAAGACCAT ATCCGCCTTC TTCCTTTGGA AGACGTTCCG 
GACGGATTGG AATGGCAAAC CGGAATGGAA GAGCCGGATG TGGGTGATCC GCGCGCCGTC 
AAGGGTGGAA AAGTCCGGCT GTGGATCAAT ACTCCGTTTC CCGGAACTTT GCGTGCTTTC 
GGGCCGGGAA GTGAAAATTT TTTCAATTAT TCCGCCATTG ACAACGTGTG GCTTCCCCTC 
GTGGGGCTTC ATCCGGAAAC CTTCCGTCCC ATTCCGGGCC TGGCGGACCG CTGGGCTTTG 
TCCGCAGACG GAAAAACCGT TTTTTATCAT CTGGATCCGG AAGCGGCCTA TTCGGACGGA 
CGCATCGTGA AAGCGCAGGA TTTTCTGCTG AACATTTGCC TCCGTACGTC CGGTTTTGCC 
CGGGATCCGT TCTGGACTAC CCTGTTCCGT TCCATGTATG ATCAGATTAC GGTATACGGG 
GATTCCGTCA TTGCCCTTAC GCTGCCGTCC CGCGGGCCGC TGCTGCCTTA CATGGCCTGT 
GCGGATTTTC ATCCGGCCCA TCCCGGTTTT TACCATGATT TCAACGCTCT GTTTCTGGAA 
CGCTACCAGT GGAAAGTCCC TCCAAATACG GGTGGCTACA TGGTTGTTCC CTCTAAAATC 
CGGATAGGAG AAAGCATTAC CCTGGCCCGC GTGAAAAATT GGTGGGCGAA GGAGAGGAAG 
TATTACCGCC ATTCCTGCAA TGCGGACCAG GTGGAACATG TGTTTGTGAA CATGGAAAAC 
AAGGCGGTTG AAATGTTCCG CCGCGGGGAA CTGGACATCA TGAACGTTCG CAAGCCGGAG 
GTGTGGGAAA CCGGGCTGGA GCTGCCGGAA GTGCACCGGG GCTATATAGA TAAATACAGC 
CTGGAAGCCA ATTACGCCTG TCCCCCGTAC GGACTGTATC TGAATTGCTC GGACAAGTTG 
TTGAAAAATC CGGATATCCG CCGCGGTCTG GCGCATTCCG TGAACATGGG CCTGGTGATT 
GATACTTTGT TCCGCGGGAA TATGAGAAGG CTCGGTTCCT ACATGGAGGG GTACGGAGAC 
CTGACTCTTC CGTTGAAAGC TCCGGAATAC AGCAAGAAAA AAGCCATGGA ATATTTTGCC 
CGCGCCGGCT ACCGGGAAAT GGGGACTGAC GGAGTGCTGA AAAATGAACG GGGAGAGCGG 
CTGGTGGTGG AACTGACGTT TGCGGATTCA TCCACCCTGA TGACCAACGT CTGTTCCATC 
CTCCGGCAGG AGGCCCTGAA GTGCGGGGTG GACCTGCGTC TGGATTCCCT TACCTACAGT 
GTCTGTTCCC GTAAGGTTTT TGAAAAACGG TATCAGGCGG CTCTATGGGC GTGGCCGCTG 
CAGACGCCGT TCCCCCGGCT GTATGAAACA TTCTCTTCCG AACTGGCGTA TGATGCCCGC 
GGAAATCCCG TAGGCAATAC GAATAATATT ATGGCCGTGT CGGACGCTGG ACTGGATGCC 
GCCCTGGATG CGGAACGCAA TGCCCCGGAT ACCGGTTCCC TGAAACTGGC CCTTCACCGT 
GCCCAGCAGC GTCTTCATGA ACTTTGCGTC TGGATTCCCG GCTGGAGGGA ACCCTACACG 
CATATCGCCT GCTGGCGCTG GATACGCTGG CCGGAATCTC CCACCCGGTT CTGTTCCCCC 
AGAATTTACA ATCCGCTGGA GTCGCATCTG TACTGGGTGG ATGAAGAAAT GAAGAAGGAG 
ACGCTGGAGG CTCGGAGCCG GGGCGTACCG TTTGAGGAAA AGCATCAAAT AATATATCTT 
GAAAGACAGG ATGGTGCCGC TCCGTAA

Protein sequence

MDGRGMPAVF DGFVERWNRA VERELRRELA EGERKEKLLV VSRGEGDGRR LAEQARSVER 
IRKRLLLKDH IRLLPLEDVP DGLEWQTGME EPDVGDPRAV KGGKVRLWIN TPFPGTLRAF 
GPGSENFFNY SAIDNVWLPL VGLHPETFRP IPGLADRWAL SADGKTVFYH LDPEAAYSDG 
RIVKAQDFLL NICLRTSGFA RDPFWTTLFR SMYDQITVYG DSVIALTLPS RGPLLPYMAC 
ADFHPAHPGF YHDFNALFLE RYQWKVPPNT GGYMVVPSKI RIGESITLAR VKNWWAKERK 
YYRHSCNADQ VEHVFVNMEN KAVEMFRRGE LDIMNVRKPE VWETGLELPE VHRGYIDKYS 
LEANYACPPY GLYLNCSDKL LKNPDIRRGL AHSVNMGLVI DTLFRGNMRR LGSYMEGYGD 
LTLPLKAPEY SKKKAMEYFA RAGYREMGTD GVLKNERGER LVVELTFADS STLMTNVCSI 
LRQEALKCGV DLRLDSLTYS VCSRKVFEKR YQAALWAWPL QTPFPRLYET FSSELAYDAR 
GNPVGNTNNI MAVSDAGLDA ALDAERNAPD TGSLKLALHR AQQRLHELCV WIPGWREPYT 
HIACWRWIRW PESPTRFCSP RIYNPLESHL YWVDEEMKKE TLEARSRGVP FEEKHQIIYL 
ERQDGAAP