Gene Amuc_1095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_1095
Symbol
ID	6274007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	1306359
End bp	1308284
Gene Length	1926 bp
Protein Length	641 aa
Translation table	11
GC content	61%
IMG OID	642613146
Product	heavy metal translocating P-type ATPase
Protein accession	YP_001877702
Protein GI	187735590
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2217] Cation transport ATPase
TIGRFAM ID	[TIGR01494] ATPase, P-type (transporting), HAD superfamily, subfamily IC [TIGR01512] heavy metal-(Cd/Co/Hg/Pb/Zn)-translocating P-type ATPase [TIGR01525] heavy metal translocating P-type ATPase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000123465
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.000000122053
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCACGG AACATTCCCA CGAACATTTT CCGGAAGGTG CTTCCTGTTG TTCCGGAAGC 
TGCGGTTCTG GAAGCTGTTG CTGCTCCGGA GACGCCATCG GGCCTGTTCC CGCCGTGCTG 
GGCATTGCCC TGTTCATCAG TGCGCTGGCG GCGGGCGGCG ATTCCCTGGC CGGTATGGCC 
GCCTACGTGG GCTCCTACCT GCTGATAGGC TGGGATGTAC TGAAGGCCGC CTTTCTGGGG 
ATGATGCGCG GCCGCGCCAT CAATGAAAAT TTTCTGATGA GTATTGCTTC CCTGGGGGCG 
ATGTTCCTGG GGGATTATTC CGAGGCGGTG GGGGTGATGC TGTTCTACCG CGTGGGAGAG 
TACCTTCAGG AACGTGCGGT GGGCAGCTCC CGCCGGTCCG TAAGCGAACT GATGAGTCTG 
AGGCCTGAGG CCGTCCATGT GAAAAAAGCC GGAGCCGTAG ATGACGTTCC TCCTTCCGAG 
GTTCTGCCCG GCTCCCTGAT TGAAGTGCGC CCCGGCGAAC GCGTTCCGTT GGACGGTGTG 
GTAACGGGAG GCTGCTCCGT GCTGGATACC TCCGCCATGA CCGGGGAATC CCTGCCGGTG 
GAAGCCGGAT CCGGAAGCTC CGTGCTGGCG GGGTACATCA ACGGGCAGGG TGTGCTGGAA 
GTGTGTACGG AGCGGGACTG GCGGCATTCC GCCCTGGCGC GGGTCCAGGA ACTGGTGGAA 
GCCGCATCAG GCCGCAAATC CCCTCTGGAG GGGAGGCTGT CCTCATTTTC CCGCATTTAT 
ACGCCGCTGG TGATTTCCAT AGCCGCTCTG GTATTTTTGC TTTATCCCCT TGTGACGGGC 
GGAAGCTGGG CGGACGGTCT GTTCCGCGCC CTGGTCCTGC TGGTGATTTC CTGCCCCTGC 
GCGCTGGTGC TGTCCATCCC GCTGGGCTTT TTTGCCGGAA TAGGGAGAGC GGCGCGGCAG 
GGGATTTTGC TGAAAGGGAG CAACTATCTG GATGCCCTGC GGAAGGTGAA GACGGTGGTG 
TTTGACAAAA CCGGAACCTT GACGGAAGGC GTTTTTTCCG TGGATGAAGT GCTTCCCCGT 
GACGGCGTTT CCCCGGAGGA ACTGCTGTAC TGGGCGGCCC ATGCGGAACT CTCCGCCTCC 
CATCCGCTGG GGCGTTCCAT TGTGAAGGCA TATGAAGGGA CTCTGTTTCC GGACCGCGTG 
GCGGAACTGG TGGAGGTGAC GGGCGGCGGC GTTTCAGCCC GCGTGGAAGG GAGACCGGTT 
CTGGTGGGGA AAAAGTCTTT TCTTCAAGAG GCCGGCGTAA GGACGGAGGA GGGAGAAGAC 
CGTGGCGTGA CCGTTTATGC GGCGTTGGAC GGCATACTTC TGGGATGCCT CCGCCTGTCT 
GACCGCGTCA AGCCGGGAGC GGAGCGTGCG GTGCGGAAAT TGAGGGAACT GGGCGTTTCC 
AACCTGGTCA TGCTGACGGG GGATTCTTCT TCCGCCGGAA CGGAAGTGGG GCTTAAGCTG 
GGGATGGACG GGGTATTCTG CGGGCTGATG CCTGCCGGCA AGCTGGAGCA TGTGCGCCGG 
CTGAAACCTG AAACGGGGCT GCTTGCCTTT GTGGGGGACG GTATGAATGA CGCCCCTTCC 
CTCGCTGCTG CCGACATCGG AATTGCCATG GGCGGCGTAG GGTCCGATAC GGCTCTTCAG 
GCGGCTGACG TAGTGGTGAT GAAGGGAGAT CCTTTGGCTG TTCCGCTGGG GATGATGCTT 
TCCCAAGCCA CAGAGCGCAT CATTGTGCAG AACATCGTTC TTATTTTGGG CGTCAAAATT 
CTGGTCATGG TGCTGGGTAT TCTGGGGCTG GCTGGGATGT GGGCCGCCGT GATGGCGGAT 
GTGGGCGTCT GCCTGCTTGC GGTGGGCAAC TCCATGCGTA TTTTCCGGGT GAAGCTGGAC 
ATGTGA

Protein sequence

MSTEHSHEHF PEGASCCSGS CGSGSCCCSG DAIGPVPAVL GIALFISALA AGGDSLAGMA 
AYVGSYLLIG WDVLKAAFLG MMRGRAINEN FLMSIASLGA MFLGDYSEAV GVMLFYRVGE 
YLQERAVGSS RRSVSELMSL RPEAVHVKKA GAVDDVPPSE VLPGSLIEVR PGERVPLDGV 
VTGGCSVLDT SAMTGESLPV EAGSGSSVLA GYINGQGVLE VCTERDWRHS ALARVQELVE 
AASGRKSPLE GRLSSFSRIY TPLVISIAAL VFLLYPLVTG GSWADGLFRA LVLLVISCPC 
ALVLSIPLGF FAGIGRAARQ GILLKGSNYL DALRKVKTVV FDKTGTLTEG VFSVDEVLPR 
DGVSPEELLY WAAHAELSAS HPLGRSIVKA YEGTLFPDRV AELVEVTGGG VSARVEGRPV 
LVGKKSFLQE AGVRTEEGED RGVTVYAALD GILLGCLRLS DRVKPGAERA VRKLRELGVS 
NLVMLTGDSS SAGTEVGLKL GMDGVFCGLM PAGKLEHVRR LKPETGLLAF VGDGMNDAPS 
LAAADIGIAM GGVGSDTALQ AADVVVMKGD PLAVPLGMML SQATERIIVQ NIVLILGVKI 
LVMVLGILGL AGMWAAVMAD VGVCLLAVGN SMRIFRVKLD M