Gene Amuc_1965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1965
Symbol
ID	6274953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2384480
End bp	2385697
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	59%
IMG OID	642614027
Product	aspartate kinase
Protein accession	YP_001878559
Protein GI	187736447
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00656] aspartate kinase, monofunctional class [TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0866474
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.000866025
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTCTTA TCGTTCAAAA ATTCGGGGGC AGCTCCGTCG GCACCATTGA CCGCATCCGC 
AATGTAGCGC GCCGCATCCA TGAAACCGCC AGGGAAGGCA ACCAGGTGGT CGCCGTCGTT 
TCCGCCATGA GCGGCGTGAC GGACAAGCTG ATCGGGCTTG CCAGGGAATT GTCTGAAACG 
CCTTGCGAAC GTGAACTTGA CGTGCTGATG GCCACCGGCG AACAGCAGTC CATCGCCCTG 
CTCTGCATGG CCCTGCATGA ACTGGGTGAA AAAGCCATGT CCTTTACGGG GGCGCAGGCC 
GGAATCACCA CCTTCGGCAG CCACACGCGG GGGCGCATCC ACAGCATTGA CCCGACGCTG 
ATGAACAAGT ACCTGCAGGA AGGCAACATC CTTATCTGCG CCGGCTTTCA GGGGGTTACG 
GAAGAAGGAA TGGTCCAGAC GCTGGGCCGC GGAGGTTCCG ACCTCTCCGC CATCGCCATC 
GCGGCCGCTC TGAAAGCGGA CGTGTGCCAG ATTTTTACAG ATGTGGACGG CGTCTATACC 
TGTGACCCCC GCGTGGTCAA AGACGCCAAG AAGATACAAA CCCTTTCATA TGACGAGATG 
CTGGAAATGG CTTCCAACGG GTCCAAGGTG ATGCAGTCGC GTTCCGTGGA ATTCGCCAAA 
AAATTCGGTG TCGTCTTTGA AGTTCGCAAC TCCATGAACA ACAACCCCGG TACAATCGTG 
CAAGAAGAAA CTCCCTCCAT GGAAGCCGTC GTCATCCGCG GCATTTCCAT TGACCGCAAC 
CAGGCCCGCG TCACCATTAC CGGCATTCCG GACCAAATCG GCTACACGGC CCAGATACTG 
GGCGCCCTGG CAGAAGCGGA AATCAACCTG GATATGATTC TGGCCAATAC TGCCCACGAC 
GGCTATGTCC GCCAGTCCTT TACGATGCCC TCCAACGAAC TGGGCCGCGC CCAAGCCGCC 
CTTAAACCGG TCATGGCCGC CCTCGGCTCC ACCGTCAAGG TGGAAACGGA AGCGGGGCTG 
GCCAAGCTTT CCCTGGTCGG CATCGGCATG CGTTCCCACT CAGGCGTGGG AGCCACCGCT 
TTCAAGGCCC TGGCGGACGC CAACATCAAG ACCGGCATGA TTTCCACCTC GGAAATCAAG 
ATTGCCGTGA TGGTGGACGA ATCCGATATT GAGGAAGCGG CCCGGGTCGT ACATAAGGCG 
TTCAACCTGG GAGCCTGA

Protein sequence

MALIVQKFGG SSVGTIDRIR NVARRIHETA REGNQVVAVV SAMSGVTDKL IGLARELSET 
PCERELDVLM ATGEQQSIAL LCMALHELGE KAMSFTGAQA GITTFGSHTR GRIHSIDPTL 
MNKYLQEGNI LICAGFQGVT EEGMVQTLGR GGSDLSAIAI AAALKADVCQ IFTDVDGVYT 
CDPRVVKDAK KIQTLSYDEM LEMASNGSKV MQSRSVEFAK KFGVVFEVRN SMNNNPGTIV 
QEETPSMEAV VIRGISIDRN QARVTITGIP DQIGYTAQIL GALAEAEINL DMILANTAHD 
GYVRQSFTMP SNELGRAQAA LKPVMAALGS TVKVETEAGL AKLSLVGIGM RSHSGVGATA 
FKALADANIK TGMISTSEIK IAVMVDESDI EEAARVVHKA FNLGA