Gene Amuc_1994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1994
Symbol
ID	6274124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2421413
End bp	2422462
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	58%
IMG OID	642614054
Product	serine/threonine protein kinase
Protein accession	YP_001878586
Protein GI	187736474
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0495985
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.225513
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACAAG AAACACTGGT TTACCCGCTT GCGGACAATA CTGTTCTGCA AGACAAATAT 
ACGATATTGA GCGTGCTGAA CGCCGGCGGC TTCGGCATCA CGTACCTGGC TCTGGACAAC 
CCCGGTTCCC GGTATGTCGT CATCAAGGAA TGCATGCCGG ACGCCTACGC CTGCCGGGAT 
ATGGAAACCG GCGTTGTCCA TCCCCGGAAC GAACAGACCG CCGTCAATTT TTCCCAGAGC 
GTTTCCAATT CCCGGCAGGA GGCTTCCGTC CTGTCCCAGC TCAACCATCC CGGCATTGTC 
CAGGTGTTTG ACATGTTTGA CGCCAACGGC ACCTGCTATT ACGTCATGGA GAATATCCAG 
GGACAGACCC TGTTCGACCT GATGACCACC ATGCACGCCA CCGGGCAAAC CATGGAACCG 
GCCCAGGCCA CGGATCTTCT GTTCCGCCTG CTGGACATCC TGCACTACCT TCACTCCATG 
GGTGTGTACC ATTGCGACAT CAAGCCGAGC AACATCTTCA TCCAGCCGGA CGGAACGCCC 
AAGCTCATCG ACTTCGGCGC CGTGCGCACC AAGACCCTCC AGCATCAGGG GCTCGTCCAG 
ATCACGCCCG GCTATACCCC GCCGGAATTC TACCCCGGAC GCCGGAGCGA AATAGGTCCC 
TGGTGCGATA TGTACGAACT GGGCGCCACG TTCTACGAAT TGCTCACGGG CCAGGTTCCC 
CATCCTGCGG ACCAGCGTTC CGTGGTGGAC CGCAACCCGA AAGTGACTAG TTACGCGGCC 
CTGCGGAAAA CTTATCCCAT GAACTTCCTT TCCGGAATTG ACAAAGCCCT GTCGCCGGAC 
GAACGCAACC GCTTCCATTC CGCCAAGGCA TGGAATGACT ATATCAACGC CATGGCGGCG 
GCAGGCACCC TGCAGGCCGG CGGAGTATCG AGGAAGGCTC TTCCCCAGGC CAGGAAAAAA 
TCTTCCGCAG GCACGGCTTT CCTCATCATC CTGCTCATCG CAACGGCAAT CGGCTGGGTA 
TGCTGGAAAC AGGGTCTGCT TAACTTCTGA

Protein sequence

MEQETLVYPL ADNTVLQDKY TILSVLNAGG FGITYLALDN PGSRYVVIKE CMPDAYACRD 
METGVVHPRN EQTAVNFSQS VSNSRQEASV LSQLNHPGIV QVFDMFDANG TCYYVMENIQ 
GQTLFDLMTT MHATGQTMEP AQATDLLFRL LDILHYLHSM GVYHCDIKPS NIFIQPDGTP 
KLIDFGAVRT KTLQHQGLVQ ITPGYTPPEF YPGRRSEIGP WCDMYELGAT FYELLTGQVP 
HPADQRSVVD RNPKVTSYAA LRKTYPMNFL SGIDKALSPD ERNRFHSAKA WNDYINAMAA 
AGTLQAGGVS RKALPQARKK SSAGTAFLII LLIATAIGWV CWKQGLLNF