Gene Amuc_1747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1747
Symbol
ID	6274647
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2126764
End bp	2128119
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	53%
IMG OID	642613810
Product	cytidyltransferase-related domain protein
Protein accession	YP_001878346
Protein GI	187736234
COG category	[I] Lipid transport and metabolism [M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG0615] Cytidylyltransferase [COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID	[TIGR00125] cytidyltransferase-related domain [TIGR01518] glycerol-3-phosphate cytidylyltransferase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACGG TTATTACTTA CGGAACCTTT GATTTGCTGC ACACGGGGCA CGTGAATCTG 
CTGAAGAGAG CCCGGAAACT GGGGGACCGG CTCATCGTCG GCGTGACTAC GGACAGTTAC 
GACCAGAGCC GCGGCAAGCT GAATGTCATG GAGAGCCTGG AGGAACGCAT GGAAAATGTG 
CGGAAAACCG GTCTGGCGGA TCTCATTATT AAGGAAGAAC TAGAAGGGCA GAAGATTCAT 
GACATACGGA AGTACGGGGC GGATGTTTTT GTGATTGGCT CCGACTGGTC GGGGAAATTT 
GACTATCTTC GCGATTATTG TGAGGTGGTT TACCTGGAAC GCACCAAGGG CGTTTCTTCA 
ACAGACCTCC GTTCCGCCCG GAATCCCATT GTATATATGG GAATTGCAGG TCACGGGCGC 
ATAGCGGGCC GTTTTCTCCG GGAGTCCAAA TATGTCAGCA ATATTGAAAT AACAGCCGTT 
TTCGGAAGGA ATGAGGAGAA AGTCCGCCGT TTTGCAGAGT TCCACGCTCT GCTGGAATAT 
TATACGGAAT ACGAACAGTT TCTGGACCGG GTTCATGCCG TTTATATTGC CGTCCCCCAT 
CATCTCCATT ATGAAATGGC CAGGAGGGCC CTGTTGCGGG GGAAGCATGT ATTGTGCGAG 
AAGCCTCTTG CCCTTGCCCG GGAGGAGGCG GAAGAGCTGT TCCGGCTGGC CGAAGAGAAA 
GGAGTCGTTT TGCTGGAAGC CCTTAAAACT GCGTTTTGTC CGGCTTTCCA GCAACTGACC 
AGTTTGGCGG GGAGCGGCAT TATTGGTTCC ATCAAGGCGG TGGACGCCAC GTTTACCAAG 
CTGATAGAGG ATGAGGCTGC CAGGGAGTAT GACCCCATGC AGGCCGGAGG CGCCTGGACG 
GAACTGGGTT CCTATCCCGC CTTTGTCATT GGGAAGCTTC TGGGAACCGA GCCCCGCAGG 
ATTCGTTTTG TTACTTGCAG AAAGCCTCAT ACGGGCGTGG ACGTGTTCAC GCGCGCGGAA 
TTTCTTTATT CCAATGCAGT AGCCACCGCC ACGGCAGCCA TAGGAGCCAA GCAGGAAGGG 
GACTTGTGCA TTACCGGAAC GGAGGGGTAT ATTTATGTGC CGGCGCCTTG GTGGAAGACG 
GAGATGTTTG AAGTGCGGTT TGAGGATGCC CGGCTCAACA GGAAATATTT TGCCAATTTT 
GAAGGGGATG GGCTGCGTTA TGAACTTGGC GCGTTTTTGC GCCTGATTCA TGGCTGCCAG 
CACGGCAACC GTCTTTTGAC CCGTGAGGAT TCCGTGTTCA TGGCTGATGT TGCCTCCCGT 
TTCAGGAGAG GGTATTGCGT GGAAGAGATC AGTTAG

Protein sequence

MKTVITYGTF DLLHTGHVNL LKRARKLGDR LIVGVTTDSY DQSRGKLNVM ESLEERMENV 
RKTGLADLII KEELEGQKIH DIRKYGADVF VIGSDWSGKF DYLRDYCEVV YLERTKGVSS 
TDLRSARNPI VYMGIAGHGR IAGRFLRESK YVSNIEITAV FGRNEEKVRR FAEFHALLEY 
YTEYEQFLDR VHAVYIAVPH HLHYEMARRA LLRGKHVLCE KPLALAREEA EELFRLAEEK 
GVVLLEALKT AFCPAFQQLT SLAGSGIIGS IKAVDATFTK LIEDEAAREY DPMQAGGAWT 
ELGSYPAFVI GKLLGTEPRR IRFVTCRKPH TGVDVFTRAE FLYSNAVATA TAAIGAKQEG 
DLCITGTEGY IYVPAPWWKT EMFEVRFEDA RLNRKYFANF EGDGLRYELG AFLRLIHGCQ 
HGNRLLTRED SVFMADVASR FRRGYCVEEI S