Gene Amuc_1115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1115
Symbol
ID	6273958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1333195
End bp	1334292
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	57%
IMG OID	642613166
Product	integrase family protein
Protein accession	YP_001877722
Protein GI	187735610
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATATTCG GAATGGCGAG ACATGGAAAA AACCAGAAGG AATATCTGGC TGCGGAAATG 
TTATTGAAAG GTAGCGGATT GAATATGCTG GATGCTGCCA GCCTCGCAGT AGAGCTGCTG 
AGCCTGTGCG GAGGCAGCCG CAGCATGCGC CGGGCCAGAA AGGCAATTTT TCTGGGTGCT 
GAGGAATTGA GGAAAGGGGA AAGGACGGTT TCCTTTTCCG CCGCCGTGGA AGAAATGCTG 
AAGGCGAAGC GTAATCTTCG CCCTACGACG TTGCGCGATA TCAGGTATTT CACCGGAGCT 
TTGATGCGGA GGTGTCCGGA ATTGAAAGGT TTTCCGGTCC GGAAGCTGAC GCCGGAGCAT 
TGCGCCCATT TTCTGGAGGC TGCTTTTACA TCCCACAGGC AGCGTTACAA GGGCCGGGCG 
GTGATGAGCG GCGTTTTGTC CTTTTCCCTG CGGCGCGGAT GGTGCGGGGA AAATCCTGTC 
GCCCGTGTGG ACTCTCCTTC GTTTCGTGAA CGGACGATTG CCATTTTGGC TCCGGAAGAG 
ATAGGAAGCC TTCGGACGGT GGTGGAAGCT CCGGAATTTC GTGACTGCGC TCCGGCTGTT 
TGGGTAATGT TGTACGCCGG AATCAGGCCG GGGGAGGTGG TGCGCCTCCA TTGGCGTGAT 
GTGGATTTGG AGGAGAGGGT CATTTCCGTA AGGTCCCGAA CCAGTAAAAC GGGGGGAATC 
AGGCATGTCA CCATTCATGC TGTGCTCTGG CGGCTTCTGG CGGGATACGG AGCAGGGGGG 
CCGGCCGGAC TGTTATGTCC TCCCAATTGG CCGGTGCGCT GGAGGCTGCT CCGGAAAAAA 
GCCGGATGGG GGCTGCACAA CCGCTTTGGA GAATGGAGTG CGGACGCGCT GAGGCATACT 
TATGCTTCCT ATCACGCCAA ATGGTTCAGG GATTTTTCCC TGCTTCAGCT GGAGATGGGG 
CATCGTTCCT CCTCCCTGTT GCGGGAGCGG TACCTGAACA TGGAAGGGGT GAGCCGCGAC 
AGGGCACGCC TTTTCTGGGA AGCGCCGGAA CATGGCTGGA ACAACAAAAC CGGCATTGCA 
GGAACGGACT TTCTATGA

Protein sequence

MIFGMARHGK NQKEYLAAEM LLKGSGLNML DAASLAVELL SLCGGSRSMR RARKAIFLGA 
EELRKGERTV SFSAAVEEML KAKRNLRPTT LRDIRYFTGA LMRRCPELKG FPVRKLTPEH 
CAHFLEAAFT SHRQRYKGRA VMSGVLSFSL RRGWCGENPV ARVDSPSFRE RTIAILAPEE 
IGSLRTVVEA PEFRDCAPAV WVMLYAGIRP GEVVRLHWRD VDLEERVISV RSRTSKTGGI 
RHVTIHAVLW RLLAGYGAGG PAGLLCPPNW PVRWRLLRKK AGWGLHNRFG EWSADALRHT 
YASYHAKWFR DFSLLQLEMG HRSSSLLRER YLNMEGVSRD RARLFWEAPE HGWNNKTGIA 
GTDFL