Gene Amuc_2036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amuc_2036
Symbol
ID	6273735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Akkermansia muciniphila ATCC BAA-835
Kingdom	Bacteria
Replicon accession	NC_010655
Strand	-
Start bp	2472372
End bp	2473766
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	59%
IMG OID	642614097
Product	MATE efflux family protein
Protein accession	YP_001878627
Protein GI	187736515
COG category	[V] Defense mechanisms
COG ID	[COG0534] Na+-driven multidrug efflux pump
TIGRFAM ID	[TIGR00797] putative efflux protein, MATE family

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000288761
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.0000000485587
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGGAAGGGA ATAAAAAAAT GAATAAGACG TGGAATTTGA AGGAAATGAA AAAGTTGATA 
CCGCTGGCCC TTCCGGTGCT GGTGGTCAAC CTCTCCATTG TGGGCATGGG GGCGGTGGAC 
GCTATTGTGG CCGGGCGCGC CGGCGTGACG GACATGGCCG CCGTGGCCCT GGGGTCTTCC 
GTGTACCTGC CCGTGGCTCT CTTCGCCTGC GGCGTGTTGA TGATCATCGG CCCCGTAATT 
GCCAACATGC GGGGGAAAAG CCATGAAAGC CGCGTGGGCT ACATGACCAA CCACGGCCTG 
TGGCTGGCGT TCATGCTCAG TCTGGTTTCC ATGCCGGTCA TTTATGTGTT GAGAAATGTG 
TTCGGCTGGA TTTCCGATGA CGCCGCCATG TGCCAGATGG CCTCCGCCTA CATGTTCGCC 
ATTATGTGGG GCCTTCCCGC CAACCTGGGG TTCGTGGCCC TGAAGAGCCT GAACGAAGGC 
TCCAACATGA CACGTCCCGC CATGTACGTG GGATTGTGCG GCCTGTTGCT CAACATTCCC 
CTGAACTACA TGTTCGTCTT TGGCATGTAC GGTTTTCCCC GCATGGGTGG AGCGGGGTGC 
GGTGCGGCCA CGGCAGTCAT TTTCTACATT GAATTCCTGC TGATGTTCCT GCTGGTTTAC 
TTCAATCCCA AGCACAGGCC GTACCGCAGG CACATCATTT CCTGGCGGCG GCCTACGCCT 
TCCGTCATCA CGCACCTGGT GCGGCTGGGC GTGCCTATAG GCGTTTCCCA GCTGTGCGAG 
GTGATGCTCT TCTGCGCGGC GGCTCTGGTG CTGGCTCCGC TGGGAGAGAC GCAGGTGGCT 
AGCCACCAGA TTGCCGGGAA CGTGGGCGGC CTGGTGTTCA TGCTCCCGCT TTCCGTAGGG 
CTGGCGGCTT CCATCCGCGT GGCGTACCAT CACGGCAGGA ATGACCTGGC AGGCACCAGA 
TCCGCCATTC TGTCTTCCTA TGTGCTGGTG CTCACCATCT GTCTGTGCAC CTTTGGAGGC 
ATCACCCTGT TCCGCGAGCA GATCGTGCAC CTGTACAATG ACTCGGAGCT GATTGTCAGC 
ACGGCTTCCG TCCTGCTGGT TCTGGCGGCG GCCTACCAGC TTCCGGACTG TTTGCAGGTG 
CTTTCCGTCG GGGTTCTGAG AGGATTCCGG GATACGGCGT CCATTACCTT CATTACGTTT 
TTCTCTTATT GGATGGTAGG ATTTCCGGCG TGCTACATCC TTGCCCGTAC GGACTGGATT 
GTCCCGGCCA TGGGAGCGCG GGGCATCTGG ACGGGATTCA TCATCGGCCT GGCAGTAGCG 
GCGGTGCTGC TGCTCTGGCG CGTAAGGCGC ACTACCAGGC GGGAATTTTC CCTGATGAGG 
CAGGCGGGGG AATAA

Protein sequence

MEGNKKMNKT WNLKEMKKLI PLALPVLVVN LSIVGMGAVD AIVAGRAGVT DMAAVALGSS 
VYLPVALFAC GVLMIIGPVI ANMRGKSHES RVGYMTNHGL WLAFMLSLVS MPVIYVLRNV 
FGWISDDAAM CQMASAYMFA IMWGLPANLG FVALKSLNEG SNMTRPAMYV GLCGLLLNIP 
LNYMFVFGMY GFPRMGGAGC GAATAVIFYI EFLLMFLLVY FNPKHRPYRR HIISWRRPTP 
SVITHLVRLG VPIGVSQLCE VMLFCAAALV LAPLGETQVA SHQIAGNVGG LVFMLPLSVG 
LAASIRVAYH HGRNDLAGTR SAILSSYVLV LTICLCTFGG ITLFREQIVH LYNDSELIVS 
TASVLLVLAA AYQLPDCLQV LSVGVLRGFR DTASITFITF FSYWMVGFPA CYILARTDWI 
VPAMGARGIW TGFIIGLAVA AVLLLWRVRR TTRREFSLMR QAGE