Gene Amuc_0720 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0720
Symbol
ID	6273856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	849108
End bp	850397
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	55%
IMG OID	642612772
Product	diaminopimelate decarboxylase
Protein accession	YP_001877338
Protein GI	187735226
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0019] Diaminopimelate decarboxylase
TIGRFAM ID	[TIGR01048] diaminopimelate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00473762
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTCAT TCGCTTACAA AAACGGCACG CTCTACTGTG AAAACGTCAA CCTTCAGGAA 
CTGGCGGACA AGGAAAGCAC ACCCCTGTAC GTTTATAGCA AACAAACCAT TTTAAACCAC 
TTTCACCGCC TCAGGGAAGC TCTGGCACCG CTTAACGCGG AAGTGGCCTA CGCCGTCAAA 
GCCTGCTCCA ACATCGCCAT CCTGAACCTC ATGGCCCGCA ACGGGGCGGG ATTCGACATC 
GTCTCCGGCG GAGAACTCTT CCGTGTCCTC AAAGCCGGGG GAGATCCGTC CAAATGCACT 
TATGCCGGCG TAGGAAAAAC CGAGCAGGAA ATCCGTTATG CCCTGGCCCA GGGCATTTAT 
TGCTTCAATG TGGAATCCGA AGCGGAACTG CGGGCCATTA ACGCCATTGC CGCCTCCATG 
GGAGTCAAGG CTCCGGTGGC CGTGCGCGTC AATCCCAACG TAGAGGCGGG AACGCACAAA 
TACATTACTA CCGGCAAGGC TGAAAATAAA TTCGGCGTGG ACTTCGAACG CATTGAATCT 
CTTTATGAGA TGGCGGCCCG CGAACTTCCG AACCTTCATC TGAAAGGGTT GCAAATGCAT 
ATCGGCTCCC AGCTTACCCA GGCGAAACCC TTCCTAGAAG CCGTCAGGAA AGTCGCCCCC 
CTGGCTGCTT CCCTGAAAGA AAAACACGGC ATTGAATTTT TCTCCATCGG AGGAGGAATT 
GGCATCGTTT ACCAGGGCAC GCTGGATTCC GGCGTTCAGG AATGGTGGAA TGAGGACTGC 
GCCCAGCTCA CGCTGAGCAC TTACGCCCAG GCCGTCGTCC CCACCCTGCA ACCTCTGGGA 
TTACACATCA TTGTGGAACC GGGCCGTCTT ATCGTAGGAA ATGCGGGAGC ACTCATCACG 
CGTTGCCTGT ATGAAAAAAA CGGGAAAGCC AAAACCTTTA AAATTGTGGA TGCAGGGATG 
AACGACCTCA TCCGCCCCGC CCTCTACCAG GGCTATCATG AAATTATCCC GGTCAGAGAA 
CACCCCTCCG GATCCTGCGT CACAGCGGAT GTTGTGGGTC CCATTTGTGA ATCCGGAGAC 
TTCCTCGCCC AAAACAGGGA CATGCCGGAC GTGCGCCAGG GAGAACTCCT GGCCGTACTG 
TCCGCCGGAG CCTATGGTTT TTCCATGTCT TCCAACTACA ATTCACGGCC TATGGCGGAA 
GAAGTCCTGG TGGACGGGGA CCAATGGAAC GTCATTCGCA GCCGCCAAAG CTGGGAAGAC 
CTCATCCGGG GAGAATCCAT TCCGGAATAA

Protein sequence

MHSFAYKNGT LYCENVNLQE LADKESTPLY VYSKQTILNH FHRLREALAP LNAEVAYAVK 
ACSNIAILNL MARNGAGFDI VSGGELFRVL KAGGDPSKCT YAGVGKTEQE IRYALAQGIY 
CFNVESEAEL RAINAIAASM GVKAPVAVRV NPNVEAGTHK YITTGKAENK FGVDFERIES 
LYEMAARELP NLHLKGLQMH IGSQLTQAKP FLEAVRKVAP LAASLKEKHG IEFFSIGGGI 
GIVYQGTLDS GVQEWWNEDC AQLTLSTYAQ AVVPTLQPLG LHIIVEPGRL IVGNAGALIT 
RCLYEKNGKA KTFKIVDAGM NDLIRPALYQ GYHEIIPVRE HPSGSCVTAD VVGPICESGD 
FLAQNRDMPD VRQGELLAVL SAGAYGFSMS SNYNSRPMAE EVLVDGDQWN VIRSRQSWED 
LIRGESIPE