Gene Amuc_1330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1330
Symbol
ID	6275839
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	1606901
End bp	1607980
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	59%
IMG OID	642613386
Product	DNA-directed DNA polymerase
Protein accession	YP_001877935
Protein GI	187735823
COG category	[L] Replication, recombination and repair
COG ID	[COG0389] Nucleotidyltransferase/DNA polymerase involved in DNA repair
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.64899
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.124466
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAGA GAAAAATCAT CCATGTGGAT ATGGATGCCT TTTACGCATC CATAGAACAG 
CGGGACCATC CCGAATACCG CGGCAAGCCC ATCGCCGTAG GCAGGCCGGA AATGCGCGGC 
GTGGTGGCGG CGGCCAGTTA TGAGGCGCGC CGTTTCGGAG TGCGTTCCGC CATGCCTTCC 
ATGAAGGCTC TCAAGCTTTG CCCCCATCTG ATTTTCACCC GCAACCGCAT GGATGTGTAC 
AAGGCCGTCT CCGCGCAGAT ACACGCCATT TTCCACCGTT ACACAGATCT GGTGGAACCC 
CTTTCCCTGG ATGAAGCCTT TCTGGACGTC ACGGAAAACA AGCCGGGCAT TCCGCTGGCC 
GTCGACATTG CGAGGAGGAT TAAGAAGGAA ATCCGCCGGG AACTTCACCT GACGGCCTCC 
GCCGGCGTTT CCTACAATAA ATTCCTGGCA AAAATCGCTT CCGATTACCG TAAGCCGGAC 
GGGCTGTTCA CGATCCATCC ATCCCGGGCG GAAAAATTCA TCGCGGCACT TCCCATTGAA 
GCTTTCTGGG GAGTCGGGCA CGCCACCGCC GAACGCATGC GCGCCCTTTC CATCACCAAC 
GGGGCGCAGC TCCGGGCACG GGACAAAGAC TTCCTGGTAA GGCATTTCGG CAAAACAGGA 
GCCATCTTCT ACAACTTCGC CCGCGGTGTG GACGACCGCC CTGTGGAACC TTCCCGCATG 
CGCAAATCCG TGGGTTGTGA AGAAACCTAC CGGGAAAACG TCACCAGGGC GGAAGCGCTG 
GAACAACGCC TCCCCCTGCT GGCGGAAGAA CTCGCGGGGC GGCTGGCCCG TTCCGGCTTC 
CGGGGAAACA CCCTTACCCT GAAGGTTAAG TTCCCGGACT TTGTCCAGAA GACCCGCTGC 
GCGACCGTTC CGGAAATCCT GACGGAGAAA GAAGGAATTC TCCCCCTGGC CCGCACCCTG 
ATGGAAGAAC TGGATTCCGG GGACCGTACA TTCCGCCTTC TGGGGCTGTC CGTCTCCCAT 
CCCCAGGAAG AACAGCGGCA GGGCATCTGG GAACAGCTCT GGCTGGAGCT GGAGTATTAA

Protein sequence

MNQRKIIHVD MDAFYASIEQ RDHPEYRGKP IAVGRPEMRG VVAAASYEAR RFGVRSAMPS 
MKALKLCPHL IFTRNRMDVY KAVSAQIHAI FHRYTDLVEP LSLDEAFLDV TENKPGIPLA 
VDIARRIKKE IRRELHLTAS AGVSYNKFLA KIASDYRKPD GLFTIHPSRA EKFIAALPIE 
AFWGVGHATA ERMRALSITN GAQLRARDKD FLVRHFGKTG AIFYNFARGV DDRPVEPSRM 
RKSVGCEETY RENVTRAEAL EQRLPLLAEE LAGRLARSGF RGNTLTLKVK FPDFVQKTRC 
ATVPEILTEK EGILPLARTL MEELDSGDRT FRLLGLSVSH PQEEQRQGIW EQLWLELEY