Gene Amuc_0530 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_0530
Symbol
ID	6275284
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	622491
End bp	624524
Gene Length	2034 bp
Protein Length	677 aa
Translation table	11
GC content	60%
IMG OID	642612580
Product	transketolase
Protein accession	YP_001877149
Protein GI	187735037
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0021] Transketolase
TIGRFAM ID	[TIGR00232] transketolase, bacterial and yeast

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTGA TCCGCTCATA TTGCCCGGGC ATGAATCTTG ACCTTCTCCA AAAAGCCGCC 
AACCAGGCGC GGGGACTCGC CATGGATGCC GTTCACGACT GCGCATCCGG CCACCTGGGC 
CTGCCGCTGG GGTGCGCCGA AATCGGGGCC GTCCTGTTCG GCGATTTGCT CAACATCTGC 
CCTTCGCAGC CCCGCTGGCT CAACCGTGAC CGCTTCATTC TTTCCGCCGG ACACGGCTCC 
ATGTTTCTTT ACGGCTGGCT CCACCTGTCA GGATTCAACA TCGGCATTGA AGATATCAAG 
AATTTCCGCC GCAAAGGTTC CATCACGCCC GGCCACCCGG AATTCCGGGA TACGGAGGGT 
GTAGAATGCA CCACGGGACC GTTGGGCCAG GGCATTGCGA ACGCCGTAGG CTTCGCCCTC 
TCCGCCAGGC GCGCGGCTGC CCGGTTCAAC AGGCCCGGCA TGGATATCTT CACCCAGCAC 
GTCTTCTGCC TCACGGGAGA CGGCTGCCTG CAGGAAGGCG TCGCCCGGGA ATCCCTCGCC 
CTGGCCGCCG TGCTCAAGCT GGATAACCTT ATTCTCATTT ACGATTCCAA CGACATCACG 
CTGGACGCTC CCGCGGAACG CACCCAGCTC ACAGATCCGC GCGCCGTATA CGAAGCCCTG 
GGCTGGGATG TGCGCCAGAT TGACGGGCAC GATATCAGGG CCATTGAGTC AGCGGTTGAA 
GCCGCCAAAA ACGCCAAAAA CGGGAAACCC CAGCTCATCA TTGCCAAAAC GGTCATCGGC 
AAGGGCATTC CCGGCATTGA AGGCACCACA AAAGGCCATG GGGAAGGCGG AGCCAAGCTT 
CAGGAAGAAG CGCACGCCAA CTGGGGAATT CCCGCCGGAG AACGCTATTA CGTCTCCGAA 
GACGTCCGTA CCGCTTTCGC AAACCTGAAA GCCCAACGGG AAAAAGATTT CAATGCCTGG 
AACGCCATGT ATGAACAATG GCGCCGGGCT TATCCGGAAC TGGCAGAGGA ACTGGACGCA 
GGCATCAACG CCTGCTCCTG CGGCGTCAAT CCGGCAGACT CGGACAAGGC AATACCGCCC 
TTCCCGCAGG ACTATGGCGA TGCTACCCGT TCGGCCGGAG CCGTTGCCAT CAACGCCATC 
GCTAAAGCGA ATCCCTGCTT CCTGACCACC AGCGCAGACC TTTACAGCTC CAATAAAAAC 
TACCTTTCCG GCGCAGGAGA CTTCTCTGCG GAAACCCCGG AAGGGCGCAA CTTCTGGTTC 
GGCATCCGCG AACACGCCAT GGCCGCCATC TGCAACGGCA TTGCCTACGA CGGCCTGTTC 
CGCGTAAGCG CCGCCACTTT CTGCGTCTTC GTAGACTACA TGCGCGCCTC CATCCGTGTA 
GCCGCCCTCA GCGGACTCCC CGTCACCTAT ATTCTGACGC ATGACTCCGT AGCCGTGGGA 
GAAGACGGCC CCACCCACCA GCCGGTGGAA ACAATTTCCG GCCTCCGTGT CATTCCGAAC 
CTGGATGTCA TCCGCCCGGC GGACCCGGAA GAAACCGCAG GAGCCTGGAT GGCCGCCATG 
CAGCGTGCCG ACGGCCCTAC CGCCCTCATC CTGACCCGTC AGAAAGTGGC TACGCTGAAC 
GGAATCCCCG TTGAAACGCG CCGGGAAGGC GTGCTGAAAG GCGCCTACAT CGCCCGGAAA 
GAACAGGGAG CCTTGAAAGC CATTATTCTT GCCAGCGGTT CCGAACTGGA ACTGGCTCTG 
AAAGCGGCGG AAAAAACAGG GGAAGGAATC CGGGTCGTCT CCATGCCAAG CTTCTGCCGC 
TTTGACGCGC AGCCTGCCGA ATACCGGGAA AGCGTGCTTC CCTCCTCCTG CATGAGGAGA 
GTTTCCGTAG AAGCCGGAGT CACGGACCTC TGGTGGAAAT ATCTGGGCTG CCAGGGGGAA 
GCCGTGGGCA TCAACCGTTT CGGCTTCTCC GCTCCCGGAA CACAGGTGCT GGAAGAACTC 
GGCATGAATG TGGACAACGT CGTTGCCGCC GTCCACAAGG TTCTGGCCAA ATAA

Protein sequence

MKLIRSYCPG MNLDLLQKAA NQARGLAMDA VHDCASGHLG LPLGCAEIGA VLFGDLLNIC 
PSQPRWLNRD RFILSAGHGS MFLYGWLHLS GFNIGIEDIK NFRRKGSITP GHPEFRDTEG 
VECTTGPLGQ GIANAVGFAL SARRAAARFN RPGMDIFTQH VFCLTGDGCL QEGVARESLA 
LAAVLKLDNL ILIYDSNDIT LDAPAERTQL TDPRAVYEAL GWDVRQIDGH DIRAIESAVE 
AAKNAKNGKP QLIIAKTVIG KGIPGIEGTT KGHGEGGAKL QEEAHANWGI PAGERYYVSE 
DVRTAFANLK AQREKDFNAW NAMYEQWRRA YPELAEELDA GINACSCGVN PADSDKAIPP 
FPQDYGDATR SAGAVAINAI AKANPCFLTT SADLYSSNKN YLSGAGDFSA ETPEGRNFWF 
GIREHAMAAI CNGIAYDGLF RVSAATFCVF VDYMRASIRV AALSGLPVTY ILTHDSVAVG 
EDGPTHQPVE TISGLRVIPN LDVIRPADPE ETAGAWMAAM QRADGPTALI LTRQKVATLN 
GIPVETRREG VLKGAYIARK EQGALKAIIL ASGSELELAL KAAEKTGEGI RVVSMPSFCR 
FDAQPAEYRE SVLPSSCMRR VSVEAGVTDL WWKYLGCQGE AVGINRFGFS APGTQVLEEL 
GMNVDNVVAA VHKVLAK