Gene Nmul_A0688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0688
Symbol
ID	3784065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	789801
End bp	792974
Gene Length	3174 bp
Protein Length	1057 aa
Translation table	11
GC content	56%
IMG OID	637810770
Product	hydrophobe/amphiphile efflux-1 HAE1
Protein accession	YP_411387
Protein GI	82701821
COG category	[V] Defense mechanisms
COG ID	[COG0841] Cation/multidrug efflux pump
TIGRFAM ID	[TIGR00915] The (Largely Gram-negative Bacterial) Hydrophobe/Amphiphile Efflux-1 (HAE1) Family

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.67862
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTCCC GCTTTTTTAT CGATCGTCCA ATTTTCGCAT CCGTCCTGTC CATCATTATT 
GTGGTGGTGG GACTCGTTGC GCTGAGAAAC CTCCCAATTG CGCAGTTTCC GGAAATCACG 
CCGCCCATGG TGCAGATCGA TGCCGATTAC CCCGGGGCGA GCGCGGAAGT TGTTGCGGAA 
TCTGTCGCGC GCCCCATCGA GGTCCAGCTT CCAGGTATCG ATAATCTTCT TTATTACGAA 
TCCACTAGCT CGAACGACGG GCACATGACC ATGAAGCTCA CGTTCGAGAT CGGAACGGAC 
GTGGATATCG CGCAGGTCCA GACGCAGAAC AGGCAGCGCC TAGCCGAACC GCAACTTCCG 
GACGAAGTCG TGCGCCAGGG TATAACCGTG AAAAAAACGT CGCCTGATCT TCTGGCGGTC 
ATTGCCCTGA GTTCTTCCGA CCCGCGGCAC GATACCATTT ACCTCTCGAA TTATGCCTTG 
CTGCGGGTTC TCGATAACGT CAAGCGTCTT CCGGGCGTAG GAGATGCCAT TATCTTCGGC 
AGCCAGAATT ACTCCATGCG GCTGATCCTG GATCCTGTCC GCATGGCGCA ACTGGACCTC 
ACTCCCACCG ATATCGCGGC GGTGGTCCGC GAGCAGAACC GGGATTTTCC CGCCGGCAGG 
ATAGGACGGG AGCCTTCGCC GAAAGGAACG GAGCTTACCA TCCCGGTCAT TACCCAGGGC 
CGCATGAGCG AAGTGAAGGA ATTCGAGGAT ATGATCGTAA GGGCGTATCC CGACGGTTCC 
ATGGTGCGAT TGCGGGATGT AGCGAGAGTG GAGCTGGGTG CGCAATCGTA TGATCTGGAA 
GGGAGATGGA ACGGAAAGCC CAACACCTTT CTTCTGACCT TTCTGGCCCC CGGCGCCAAC 
GCGCTCGATA CGGTTCACCG GGTACGCCAG GAAATGGACA AGCTCGCGCG CAGTTTCCCC 
GCCGGCGTCT CCTACGACAT ACCCTATGAC ACTACCATAT TCATCGAAGT TTCCATCAAG 
GAAGTCCTGA AGACGCTGGT CGAAGCAACG CTTCTTGTCA TACTGGTCGT TTTTGTTTTT 
CTGCAAAGCT GGAGGGCAAC GATCATTCCA GCGGTCGCGG TTCCTATTTC ACTGATCGGA 
ACCCTGGCCG GAATGGCAGC GCTTGGATTT TCAATCAATA CCCTTACCCT GTTCGGCATG 
GTGCTTGCCA TCGGGATCGT GGTGGATGAT GCGATCGTGG TGGTGGAAAA TGTCGAGCGG 
CATATGCGGG AGGGGTTGCC GCCCAGGGAG GCGGCCAGGG TGGCCATGGA TGAAGTGGCG 
GGCCCCGTCA TTGCCATCGT CCTGGTGCTG GGCGCGGTGT TTGTTCCAGT CGCTTTTCTG 
GGCGGAATCA CCGGTGAATT GTACAAACAG TTTGCGATTA CCATTGCCCT GTCCGTCGCG 
ATATCGGGTT TTGTGGCGCT TACCCTGAGC CCCGCGCTCT GTGCGCTTAT TCTCAAGCCG 
GGGCATGGGG AGCCCGCAAA GTACTGGAAG CTGTTCAACC GCTCGTTTGA CTGGATGCAG 
ACACGCTATA CAAATGGCGT CGGAATGGTA TTGAAACGAT CCATGATCGC TCTCTGTATT 
TTTGCCGTGA TGATATTCGT CCTCCTTGGC TTGTTCAGAA CGATCCCGGG CAGCTTTCTC 
CCGGAAGAAG ACCAGGGCTA TTTCATTACC GTTGTCCAGT TGCCGGACGG AGCCTCCAAG 
GAACGCACGA TTGATGTATT GAGCAAAGTA GAGCAATACT TCCTGTCGAT TCCCGCGGTA 
CACTCAACGG ATGCGCTGGC CGGCCAGAAC TTCGTGTTCG GCACGCGGGG AGCGAATCAG 
GCGACGATGT TCGTTCCGCT GCAGTCTTGG GACACGCGCA AGAGTGCCGG GGAGCATGTC 
ACCGGCCTTA TCGCATCCGC CTTCCAGGAG TTTGCAAAGA TACCGGAAGC ACTGATTCTT 
GCCTTCAATG CCCCATCCAT CAGAGGCCTG GGTTCCACCG GGGGTTTTTC CCTGCAGGTA 
CAGGATCCGA GCGGGGGCGA TTTCAAAGAG TTTGCCGAGA TTACGCAGAA ATTCGTCGCC 
AAGGCTGTGG AACATCCTGC TATCGCTGCT GCCAGCACCA ATTTTCGCGT CAGTGCCCCC 
CGGCTTTATG CCCGCGTTGA CCGGGAACGC GCCAAAGCGC TGGGCGTGCC GATTTCCGAA 
GTCTTCGACA GCATGCAGGC TTATTTCGGC AACCTGTATA TCAACGACTT CGTGAAATAT 
GGTCGTATCT ATCGCGTCCA GACGGAAGCG CAGCCTCAGT ACCGATCAAG GCCGGAGGAT 
ATCGAGAAAA TTTACGTGCG TGCGCGGAAC GACAAGGGCC ACGTCATGAT TCCACTGAAT 
TCGGTGATCA CCACCGAATT CACCAGCGGA CCTGATCCCG TCACCCACTT CAACGGATTC 
AATTCCGCAC TCGTGCTGGG CGGCGCCGCT TCCGGCTACA GCTCGGGGCA GGCCCTCGAT 
GCGCTGGAAC AGATCGCAGA TGAGATATTG GCGCCAAAAG GTTATACGAT CGACTGGAGT 
GGAATATCCT TTCAGGAGCG CCAGGCAGGA GGGAAATCGG TTCTGGTATT CGCCTTCGCC 
CTGCTCATGG TCTTTCTGGT GCTGGCCGCC CTTTACGAAA GCTGGTCAGT TCCGCTCGCG 
GTGATTCTTG CAATTCCGTT CGGAATTTTA GGCGCATTAC TGGCTATCTG GGTTCGCGAA 
TTGACCAACG ACATCTATTT CCAGATCGGG CTGGTGACAT TGATCGGATT ATCCGCGAAG 
AACGCCATCC TGATCGTGGA ATTCGCCAAT CAGCGTTATG CGAACGGGGA GCCTTTGCTC 
GACGCGGCGA TGGAGGCCGC CCGGCTACGT TTCCGTCCCA TTATCATGAC CTCCATGGCT 
TTTATCCTGG GGGTGTTTCC GCTGGTGATC GCTTCCGGCG CAGGGGCCGC CAGCCGGAAT 
TCCATCGGGA CGGGTGTTTT CGGGGGGATG CTGGCTGCGA CCTTTCTTGC CATCTTTTTC 
GTACCTCTCT TTTTCGTAGT AATAAGAAAA ATGACGCATC GGCGCGGACA GCCAGAGGTT 
CGAGCATCCC ATGCGGCGCC GGATAATTCT CCTTCCACCG TCGAAGACGA ATAA

Protein sequence

MSSRFFIDRP IFASVLSIII VVVGLVALRN LPIAQFPEIT PPMVQIDADY PGASAEVVAE 
SVARPIEVQL PGIDNLLYYE STSSNDGHMT MKLTFEIGTD VDIAQVQTQN RQRLAEPQLP 
DEVVRQGITV KKTSPDLLAV IALSSSDPRH DTIYLSNYAL LRVLDNVKRL PGVGDAIIFG 
SQNYSMRLIL DPVRMAQLDL TPTDIAAVVR EQNRDFPAGR IGREPSPKGT ELTIPVITQG 
RMSEVKEFED MIVRAYPDGS MVRLRDVARV ELGAQSYDLE GRWNGKPNTF LLTFLAPGAN 
ALDTVHRVRQ EMDKLARSFP AGVSYDIPYD TTIFIEVSIK EVLKTLVEAT LLVILVVFVF 
LQSWRATIIP AVAVPISLIG TLAGMAALGF SINTLTLFGM VLAIGIVVDD AIVVVENVER 
HMREGLPPRE AARVAMDEVA GPVIAIVLVL GAVFVPVAFL GGITGELYKQ FAITIALSVA 
ISGFVALTLS PALCALILKP GHGEPAKYWK LFNRSFDWMQ TRYTNGVGMV LKRSMIALCI 
FAVMIFVLLG LFRTIPGSFL PEEDQGYFIT VVQLPDGASK ERTIDVLSKV EQYFLSIPAV 
HSTDALAGQN FVFGTRGANQ ATMFVPLQSW DTRKSAGEHV TGLIASAFQE FAKIPEALIL 
AFNAPSIRGL GSTGGFSLQV QDPSGGDFKE FAEITQKFVA KAVEHPAIAA ASTNFRVSAP 
RLYARVDRER AKALGVPISE VFDSMQAYFG NLYINDFVKY GRIYRVQTEA QPQYRSRPED 
IEKIYVRARN DKGHVMIPLN SVITTEFTSG PDPVTHFNGF NSALVLGGAA SGYSSGQALD 
ALEQIADEIL APKGYTIDWS GISFQERQAG GKSVLVFAFA LLMVFLVLAA LYESWSVPLA 
VILAIPFGIL GALLAIWVRE LTNDIYFQIG LVTLIGLSAK NAILIVEFAN QRYANGEPLL 
DAAMEAARLR FRPIIMTSMA FILGVFPLVI ASGAGAASRN SIGTGVFGGM LAATFLAIFF 
VPLFFVVIRK MTHRRGQPEV RASHAAPDNS PSTVEDE