Gene Amuc_2100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2100
Symbol
ID	6274555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2553762
End bp	2554910
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	57%
IMG OID	642614162
Product	aminoglycoside phosphotransferase
Protein accession	YP_001878690
Protein GI	187736578
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.624576
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCTGT CCGCCGTTTT CCACACTTCC TCCCTTCAGA AGCAAGTGGC CGCCCTGAGC 
GACGCATTCG CCATCGCAGG AGAATTCCTC CATTGCGACG TCATTAACAG CGGCCATATC 
AACATGACCT TCCGGGCCAC CTACAGGAAG CCGGACGGCA CCACCCGCCG CTACATCTTC 
CAGCGCGTGA ACGATGCCGT GTTCCCATGC CCCAGGGATG TCATGCACAA CGTGGAAAAG 
GTGACCAACC ATATCCGCTG GAAAATGTTC CGGGTGCTGA AAACGCCCTT CCGCCAGACG 
CTGAACCTGT ACTCCGCGCG GGGCGGCCGC AAATACCTGG AAATTCCCGG TTCCGGCTTC 
TGGCGCTGCT ACAACTGCAT AGAAAACACC CACACGTTCG ACGTAGCGGA CCATCCCCGC 
CAGGCTTACG AAGCAGCCCG CGCTTTCGGC GCTTTCCAAC AGCTCCTGTG TGACATGAAT 
CCGGAGGACA TCCATGAAAC CATTCCGTTC TTCCACCATA CCCGCAGGCG CTTTGACCAT 
TTGGAAAAAG CCGCGGCAGC AGACTCCCAC GGACGTCTGA ATACCTGCCG CAAGGAGCTG 
GACTTCATCC GCCGCCGTGA ACGTTATGTG GACGTGCTGC TGGATCTCCA GGAACGGGGG 
GAGCTCCCCG TCAGAATCGT CCACAACGAC ACGAAAATCA ACAACGTGAT GCTGGACAGG 
GAGACGGACA AGGCTGTCTG CGTCATTGAC CTGGACACCG TCATGCCCGG GAGCGTCCTG 
TACGACTTCG GAGACATGGT GCGCACCATG ACCTCCCCTG CGGCGGAAGA TGAAGAAAAT 
CTGGATAAAA CCTTCCTGCG CATGCCCATG TTCGAGGCCG TCGTCAAGGG ATACCTGGAG 
GCCTCCAGAG AATTCATCAC GCCGCAGGAA GTCTCCAAAC TCGCTTTTTC CGGTCTGCTT 
ATCACGCTGG AAACGGGAAT CCGCTTCCTG ACGGACTACC TGGAAGGGGA CGTTTATTTC 
AAAACGAAAA AAGAACGGCA CAATCTGCAC CGTGCCCGCA CCCAGCTCAG GCTGGTGGAA 
AGCATGGAAG AGCAAATGCC TGAAATGGAA GAATGCGTCC GGAAATGCTT CCAGACTGTT 
AACGGCTGA

Protein sequence

MPLSAVFHTS SLQKQVAALS DAFAIAGEFL HCDVINSGHI NMTFRATYRK PDGTTRRYIF 
QRVNDAVFPC PRDVMHNVEK VTNHIRWKMF RVLKTPFRQT LNLYSARGGR KYLEIPGSGF 
WRCYNCIENT HTFDVADHPR QAYEAARAFG AFQQLLCDMN PEDIHETIPF FHHTRRRFDH 
LEKAAAADSH GRLNTCRKEL DFIRRRERYV DVLLDLQERG ELPVRIVHND TKINNVMLDR 
ETDKAVCVID LDTVMPGSVL YDFGDMVRTM TSPAAEDEEN LDKTFLRMPM FEAVVKGYLE 
ASREFITPQE VSKLAFSGLL ITLETGIRFL TDYLEGDVYF KTKKERHNLH RARTQLRLVE 
SMEEQMPEME ECVRKCFQTV NG