Gene Amuc_1518 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1518
Symbol
ID	6274622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1812644
End bp	1813654
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	58%
IMG OID	642613577
Product	Endonuclease/exonuclease/phosphatase
Protein accession	YP_001878120
Protein GI	187736008
COG category	[R] General function prediction only
COG ID	[COG3568] Metal-dependent hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000454364
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.00000000880332
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATCAGGA AAACGTCAAA ACGCAGGGGA ACCTCCGTCA TTGCGGCCCT GATTGCGTTG 
TGCGCGGTGG TGGGGTACGG TTTGACGGAG TGGGCGCCGC TGGATAATGA ACCGCAGGCG 
GTTCCCTCCC GCCAGAGGGA AGAGCGGCAG ACGGTTCGGG AGAAGGTGGA AATCCCCGAC 
AAGGGGGAGC CCGTTCGTTT GCTGACCATG AACGCCGGAA ACTACTTTGT GCCGGAAGAC 
CCGAGGAGAA GCAATTTTCA GGTAAAATAC AAGCCTGTGG AAGCCCGTGA AGCCGTGGCG 
GAGCTGGTTC GCCAATCGGG GGCGGAAATC GTGGGGCTGT GTGAAATGGG CGGGGAGGCT 
GCCGTTCGTG ACTTGCAAAT GCGGCTGAAA AGAAAAGGAG TTCATTTGCC GTACAAAGTT 
CTTGTCATGC GGGACGGGGA GGACCGTGGT TTGGCCCTTC TTTCCAAATA CCGCATCGCG 
GATGACCGTT CCGTAACGGA CATGCCTGTA TCCGGAGAGG CGAAACGGAA AAAGACGATG 
CTGCGGGGCA TTCTGGACGC CACGGTCAGC ATGCCGGACG GACGGCTGTT CCGCCTGGTG 
GGCATTCATC TGAAATCACG CCTCAGCCGT GACGGTTCCG CAGAAGACAC ACGGAGAAGG 
GAAGCCTACG CCCTGCGGGA CTACCTGAAT GAAGCTCTTG CCTCTCAGGA CGGCATGCCT 
CTGCTTCTGT ACGGAGATTT TAATGACGGC CCGTCAGACA GCGCCGTGCA GGTCATCCAG 
GGGCCGGCCA AAACGGAATA CCGCCTGAAC CGTTTGAAGC CCAGGGATTC TCGTGGTGAG 
ACCTGGACCA TTTACTACGA AGACGGTGAC ACCTACCATT CCTTCGACCA TCTTTTCCTG 
AACAATACTC TGAAAAAGCG CCTCGGCCGC AAGCCTCCCA TGGGCATCCT TGACTCTCCC 
CCCTCGCTCC AGGCCAGCGA CCACCGCGGC GTGTGGGTGG AATTAAGGTA G

Protein sequence

MIRKTSKRRG TSVIAALIAL CAVVGYGLTE WAPLDNEPQA VPSRQREERQ TVREKVEIPD 
KGEPVRLLTM NAGNYFVPED PRRSNFQVKY KPVEAREAVA ELVRQSGAEI VGLCEMGGEA 
AVRDLQMRLK RKGVHLPYKV LVMRDGEDRG LALLSKYRIA DDRSVTDMPV SGEAKRKKTM 
LRGILDATVS MPDGRLFRLV GIHLKSRLSR DGSAEDTRRR EAYALRDYLN EALASQDGMP 
LLLYGDFNDG PSDSAVQVIQ GPAKTEYRLN RLKPRDSRGE TWTIYYEDGD TYHSFDHLFL 
NNTLKKRLGR KPPMGILDSP PSLQASDHRG VWVELR