Gene Amuc_2030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2030
Symbol
ID	6275502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	+
Start bp	2463586
End bp	2466693
Gene Length	3108 bp
Protein Length	1035 aa
Translation table	11
GC content	58%
IMG OID	642614091
Product	transporter, hydrophobe/amphiphile efflux-1 (HAE1) family
Protein accession	YP_001878621
Protein GI	187736509
COG category	[V] Defense mechanisms
COG ID	[COG0841] Cation/multidrug efflux pump
TIGRFAM ID	[TIGR00915] The (Largely Gram-negative Bacterial) Hydrophobe/Amphiphile Efflux-1 (HAE1) Family

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0107983
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.000143133
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTGCGG ACCTGTTTAT CAAACGCCCC AAATTCGCCA TCGTCATCGC CATCCTGATG 
ATGCTGGCTG GCGGCATCTG CCTGAACCAG CTCCCCATTG CGGAGTATCC GGAAATCGCG 
CCCACCAGCA TCAACGTGCA GGCCACCTAT ACGGGTGCCA GCGCCCAGGT AGTGATGGAA 
ACGCTGGCCT CCCCCATTGA GGAAGAACTC AACGGGTTGG AAAACCTGCT CTATTTCTCC 
TCCAAGTCAG ATAACACCGG CGGGTATTCC CTGTCCCTGA CGTTCAAGAG CGGCACGAAT 
TCGGACATCA ACATGGTGAA CGTTCAGAAC GCCTTGAAAC GGGTGGAATA CAAACTTCCC 
AAGGAGGTGA CGGACCAGGG CATCAAGATC AAGAAACGCT CCTCTGACAT CCTGGGATTC 
TTCGCTTTCC GGTCCACCAG CATGAGTTCC CTGGAGCTGA ACAACTTCGT CAAGACCAGG 
GTGAAGGATG AGGTTGCCCG CGTACCGGGA ATCTCTGCCG TCAACCTGAT GCCGGAAAAG 
AATTACAGCA TGCGCATCTG GCTGGACGCC CTGCGCATGT CCGCCCTGAA TATCACGCCG 
GATGACGTTT CCAATGCCAT CAAGGCGCAG AACGTTCAGG CCGCGGCCGG CTCCATCGGC 
TCGGAAGGGG AAAACAACTT CATCCAATAC AAGGTGAACG TCACCGGACG ACTGCAGACC 
GTGGAGGAAT TCAGCAAGAT TATCGTCCGC ACGGGCCAGG ATGGCCACGT TACCCGGCTG 
GACGACATTG CCCGCATTGA GCTGGGCGCG GAAACCTACA CGGGCAGCAG CCGCAACAAC 
GGGGAAGACT CCGTGAACAT GGCTGTGTAC CGCCTGGATG ACGCCAATGC CCTGGAAGCC 
ATGAACGGCG TGAAAGACAC GCTGGAGAAG CTGGAAAAAC GTTTTCCGGA AGGTGTGAGC 
TACGTCGTGA GCTACGACCC CACGCAATAC ATTTCCGCCA CCATGGCGGA AATCGTGGAA 
ACGCTTGTCA TCGCCCTGAT TCTGGTGGTG GGCATCACGT ACCTGTTCCT GCAGGACTGG 
CGTGCCACGC TCATTCCGGC GCTCGCCATT CCCGTCTCCC TGATAGGCAC CTTCGCCATC 
CTGCTGCCCC TGGGCTTTTC CATCAATGTG CTGACCATGT TCGGCCTTAT TCTAGTAATC 
GGGTCCCTGG TGGACGACGG CATCATCGTA GTGGAAAATA CGATGCGCAT TCTGGAGACG 
GAGGATCTCT CGCCGGAAGA AGCCACCAGG AAGAGCATGC ACCAGATTAC AGGCGCCATC 
ATCGCCACCA CGCTGGTGAC GGTCGCCATT TACGTGCCCA TCGCCTTCTT CGGCGGCATG 
GTAGGGAACA TTTACATGCA ATTCTCCGTA ACCATGTGCG TGGCCCTCTG CCTTTCCGCC 
ATCAATTCCC TGACGCTCAG CCCCGCGCTG TGCGTTCTGC TGCTGAAAAG GAAGCAAAAG 
AAACAGAGCA GGTTCAGCCT CTTCCGCCCC TTCAATGTCT CTCTGGAATG GGCGCGCAAA 
AGCTATATCA AATGCGCCGG CATCATGGTG CGCCGCGCGT GGCTTACGCT GATTCTGCTG 
GCCGCTGTCC TGGTCGGCAA CTGGAAACTG TTTGAGACCG TACCCAAATC CTTCCTTCCT 
CCGGAAGACA AGGGCACCGT TTTCTGTGAT ATCCAGCTGG CCCCTGGCGC CACGCTGGGC 
CGTACGGAAC AGGCCATGCG CAGTGCGGAA CAGAAGCTGA TGAGCATCCC CGGCGTGCGC 
CAGGTTTCCT CCACTTCCGG ATTCAGCTTC ATGGGCGGCA ACGGGGAAAA CCTGGGCATG 
TGCATCGCCC AGCTTGACCC CTGGGACAAA CGCAAGACGC CGGAGCTTTC CCTGGATTCC 
ATCATGCAGA AAGCTTCCAT CCTGTGTGAT GAAATTCCGG CGGCCAAGGC CACCGTGTTC 
AGCCCGCCCG CCATCATGGG GCTGGGCCTG ACGGGCGGCG TCTCCTTCAT GCTCCAGGCC 
AGCGGGGAGG AAACTCCCAA GGACCTGGAA CGAGTGACCA ACGACCTGCT GGACAAAATC 
AACAAACTGC CGGGAACCAT GTACGCCCGC AGCGCGTATG AGGCGAACAC CCCCCAGCTT 
TTCCTGAACA TCGACCGTGA AAAGGCGCAG AGCATGCACG TGCCCGTCAG CCGCATCTTC 
ACGACGCTTC AAAGCAAGCT GGCCTCCATG TACATCAATG ATTTCAACCT GATCGGCTAC 
ACGTTCAAGG TGAAGATGCA GTCCGCGGCA GAGGACCGCA CCACCATCAA TGACATCATG 
AACACCTACA TTCAGAACGA TCAGGGCCAG ATGGTGCCTC TCAGCTCCGT AGCCACCCTG 
TCTTACATGG TGGGGCCGCG GCAAATATCC CGTTTCAACC AGCTCATGTC CGCAGAAGTG 
ACCGCCCAGG CAAAACCCGG CGTCAGCAGC GGCGAGCTGA TGAACCAGAT TGAGGCTATT 
CCGCTGCCGG AAAATTACTC CATCACCTGG ACGGACATGA GCTATCAGGA ACGGCAGAAC 
GATGGGAAAA TCGTCCTGCT GATGGGTATG GCCCTGCTCT TCGGCTACCT GTTCCTGGTG 
GCGCAATATG AAAGCTGGAC GGTTCCCATT TCCGTCATTG TCTCCGTCTC CGTCGCCCTG 
TTGGGCGCTT TGCTCGGCCT GATTATCTGC AACACGCCCC TGAGCATTTA CGCTCAGCTC 
GGCCTGGTGA TGCTGGTGGG CCTGGCCGGG AAAAACGCTA TTCTGATGGT GGAGTTCTCC 
AAAATGGAGC GGGAGCGCGG CGTTCCCATC CAGGAAGCCG CCCTGGAAGG AGCCCGGCAG 
CGCTTCCGCG CCGTGATGAT GACGGCCATT TCCTTCATCA TCGGGGTATT CCCCATGGTC 
ATCGCCTCCG GAGCGGGCGC GGCAAGCCGC AAAGCCATTG GCATCTCCAC CTTCTACGGC 
ATGATTCTCG CAACAGTAGT GGGCATTCTG TTCATTCCGG CCCTGTACGC CATGTTCCAG 
CGTTACCGCG AATGGGTGAA AGGCCTGTTT GCCAGAAAGG CGGAATAA

Protein sequence

MIADLFIKRP KFAIVIAILM MLAGGICLNQ LPIAEYPEIA PTSINVQATY TGASAQVVME 
TLASPIEEEL NGLENLLYFS SKSDNTGGYS LSLTFKSGTN SDINMVNVQN ALKRVEYKLP 
KEVTDQGIKI KKRSSDILGF FAFRSTSMSS LELNNFVKTR VKDEVARVPG ISAVNLMPEK 
NYSMRIWLDA LRMSALNITP DDVSNAIKAQ NVQAAAGSIG SEGENNFIQY KVNVTGRLQT 
VEEFSKIIVR TGQDGHVTRL DDIARIELGA ETYTGSSRNN GEDSVNMAVY RLDDANALEA 
MNGVKDTLEK LEKRFPEGVS YVVSYDPTQY ISATMAEIVE TLVIALILVV GITYLFLQDW 
RATLIPALAI PVSLIGTFAI LLPLGFSINV LTMFGLILVI GSLVDDGIIV VENTMRILET 
EDLSPEEATR KSMHQITGAI IATTLVTVAI YVPIAFFGGM VGNIYMQFSV TMCVALCLSA 
INSLTLSPAL CVLLLKRKQK KQSRFSLFRP FNVSLEWARK SYIKCAGIMV RRAWLTLILL 
AAVLVGNWKL FETVPKSFLP PEDKGTVFCD IQLAPGATLG RTEQAMRSAE QKLMSIPGVR 
QVSSTSGFSF MGGNGENLGM CIAQLDPWDK RKTPELSLDS IMQKASILCD EIPAAKATVF 
SPPAIMGLGL TGGVSFMLQA SGEETPKDLE RVTNDLLDKI NKLPGTMYAR SAYEANTPQL 
FLNIDREKAQ SMHVPVSRIF TTLQSKLASM YINDFNLIGY TFKVKMQSAA EDRTTINDIM 
NTYIQNDQGQ MVPLSSVATL SYMVGPRQIS RFNQLMSAEV TAQAKPGVSS GELMNQIEAI 
PLPENYSITW TDMSYQERQN DGKIVLLMGM ALLFGYLFLV AQYESWTVPI SVIVSVSVAL 
LGALLGLIIC NTPLSIYAQL GLVMLVGLAG KNAILMVEFS KMERERGVPI QEAALEGARQ 
RFRAVMMTAI SFIIGVFPMV IASGAGAASR KAIGISTFYG MILATVVGIL FIPALYAMFQ 
RYREWVKGLF ARKAE