Gene Amuc_2104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2104
Symbol
ID	6273696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2558514
End bp	2560115
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	65%
IMG OID	642614166
Product	2-succinyl-6-hydroxy-2, 4-cyclohexadiene-1-carboxylate synthase
Protein accession	YP_001878694
Protein GI	187736582
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1165] 2-succinyl-6-hydroxy-2,4-cyclohexadiene-1-carboxylate synthase
TIGRFAM ID	[TIGR00173] 2-succinyl-5-enolpyruvyl-6-hydroxy-3-cyclohexene-1-carboxylic-acid synthase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATTCCC CCGCATCCTT CGTCAAATCC CTGCTGGCCC AATGCTGCCT GGGCGGCATT 
TGCGAGTGGG TGGTCTGCCC CGGCGCGCGC AACATGGCGC TGCTCCAGGT GCTGGCTGCC 
GCGGAGGATC TGGTGAAATG GACTCACTTT GACGAACGGT CCGCCGCCTT CTTTGCGCTG 
GGCCGCATTC AGGATATAGG GCTGCCCGTG GCCGTGGTCA CTACCTCCGG AACGGCGGCG 
GCGGAACTGC TCCCCGCCGT GGTGGAGGCC TACTACCAGC GCCGCCCCCT GCTCCTGCTC 
ACGGCGGACC GTCCGGCGGC CTGCCGGGGT TCCGCCGCTC CCCAGGCCAT CGAACAGGCG 
GATCTGTTCG GCATTTACGC ACCCACGATT GACCTGGAAA CGCCGGAAAG CCTGCCGGAA 
GACATTCTGC AAGACTGGGA TTACGCCTCA CCCCTCCATA TCAACGTGTG CCTGCCGGAT 
CCGGACCCTG CCTGGAACCC CGGCAGCTGC GACCTTTACC CGGCGGAACC TCCGGAGGAA 
AACGGATTCC GGGGCTCCCT GGCAGAACTG GCCCGGGCCC TGCGCTTCAA ATCGCGCGGC 
GGGCTGGTGG TCATGATCGG CGGCCTGGAC CCCACGGAAC AAGCCCCGGC CCGGTGGCTG 
GCCAACGAAC TGAAAGCCCC CGTGGTGGCG GACGCCACCT CCGGACTCCG GGAAGAGCTG 
GCCCATCTGG CTCTGACGGA CGCAGACGCC CTGCTGAGGG AACACCCGCC CGCCGTCCTG 
CTCAGATTAG GGGACGTGCC CGTGGCCCGC TTCTGGCGCG ACCTGGAGGA CATTCCAGCC 
ACGGAAGTCT TCTCCGTCAC CCGCACCGGC TTCTCCGGGC TGGCCCGCCC CTCCTCCGTC 
GTAACCGGAG ACCTGGAAGC CATTCTGCAT GCGCTGGGGG ATATAGATAC CGTGGGCGAC 
GTCAACGGCC TGCGCGCCAT GAACAAACGC AGGAAAGCCC TGATGGAGGA ACTGCTCATC 
ACCTGCCCGG AAAGCGAACA GGCCATGGTG CGCTCCTTCT CCTGCTTTGC CGCGGACGGA 
GACTGCATTT ACCTGGGCAA CTCCATGCCC GTGCGGTACT GGAACAGCTT CGCCCAGACG 
TCCATCCCCA CGGAAAACGT CCGCGCCAAC CGGGGCACCA ACGGCATTGA CGGGCAAATC 
TCCGGTTTTC TGGGGGTCTC CGCCCGGTGT TCCCGCTCCT GGGCTCTCGT GGGCGACCTG 
ACCGCCATGT ATGATTCCAA TGCCCTGGCA CTCCTTCCCC AACTGGACAG GGGGACCCGC 
GTCCTCGGCG TCATCAACAA CGGCGGAGGG GGCATCTTCC GCACCCTCCC GGGAGCAGAC 
GGCCAGCCGG AAACCATGAG GAAGCTGCTT GTACAACCCC ACGCCCATTC CTTCAAAGCC 
ATTGCGGAAC AATGGGGAAT GCGCTACCTG ACCATCCGCA CGGCGGAGGA CTTCGACCAG 
CTTGATTCCC TGGAGGAAAA CAGCCAGACG CTTGTAGAGC TCATCCCGGA CAGGGAGCAG 
ACGGAACAGA TCCGCCTCCG GCTGGCCAAC GCCCAGGTGT AA

Protein sequence

MNSPASFVKS LLAQCCLGGI CEWVVCPGAR NMALLQVLAA AEDLVKWTHF DERSAAFFAL 
GRIQDIGLPV AVVTTSGTAA AELLPAVVEA YYQRRPLLLL TADRPAACRG SAAPQAIEQA 
DLFGIYAPTI DLETPESLPE DILQDWDYAS PLHINVCLPD PDPAWNPGSC DLYPAEPPEE 
NGFRGSLAEL ARALRFKSRG GLVVMIGGLD PTEQAPARWL ANELKAPVVA DATSGLREEL 
AHLALTDADA LLREHPPAVL LRLGDVPVAR FWRDLEDIPA TEVFSVTRTG FSGLARPSSV 
VTGDLEAILH ALGDIDTVGD VNGLRAMNKR RKALMEELLI TCPESEQAMV RSFSCFAADG 
DCIYLGNSMP VRYWNSFAQT SIPTENVRAN RGTNGIDGQI SGFLGVSARC SRSWALVGDL 
TAMYDSNALA LLPQLDRGTR VLGVINNGGG GIFRTLPGAD GQPETMRKLL VQPHAHSFKA 
IAEQWGMRYL TIRTAEDFDQ LDSLEENSQT LVELIPDREQ TEQIRLRLAN AQV