Gene Nmul_A2106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2106
Symbol
ID	3784677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2399177
End bp	2400592
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	58%
IMG OID	637812194
Product	Outer membrane efflux protein
Protein accession	YP_412791
Protein GI	82703225
COG category	[M] Cell wall/membrane/envelope biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1538] Outer membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.343125
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTTTC ATGCGTTGTT CATCATCAGC CGGTGTGTGC GTGTGGGAGC CATGCTTGTC 
CTTGCGATGA CTTGCTTGCC CTCAGCAGGT GCTGACAGTT CCTTTACGGG CATCCGCACG 
CTTGAGGACG CGCACTCTCC CAGTGCTGCC GGCCCTGAGG TCAAGAGCAA TCTCACCCTG 
CGGGATGCGG TGCGGCTTAC GCTTCAGCAC AACCCCGAAC TGTCCTCCTT CGATAAGGAG 
ATGCGCGCTC TGGAGGGTGT TACGTTGCAG GCCGGGTTGT TGCGCAACCC TCAGTTGTCG 
GTGGACGTCG ACAATGCCGG AAACATGGGA GGCGTAAGTG GACAAGGAGC CATCAAGCAA 
AATGTCGAGC AGCAGGATTT GATCATTCGC ATCAGCCAAT TGGTCGAGTT GGGAGGAAAA 
CGTGCAGCGC GGGTAAATGC TGCGTCGCTC GGGCAGGCAC TGGCGGGCAA GGACTTCGAA 
ACCAAACGGC TCGAACTCGT GGCACGGGTA GCGAACGTAT TTACAGAGGT GCTGGCGGGG 
CAGGAGCAGT TGCGGCTGGC CGAGGAGAGT CAGCAGCTGG CTCAGCGCGT GGTGGATACT 
GTCAAGCGCC GGGTGCAGGC GGGAAAAGTG CCGCCCATAG AAGAGACTAA AGTGGGAGTA 
GCATTTTCCA CGACGCGAAT TGCCCTGGGC CAGGCGCAAC GCGAGCTGGC CGCCGCGCGC 
AAACGCCTTG CGCTGCTATG GGGTGACAAT TCGCCCCAGT TTGGGGAAGC GCTAGGAGCT 
CTGGAATCGA GGATCGTCCT GCCCGATTTG GCCGCATTGA CCGAGCGAGT CTTGTCGAGT 
CCCATGGCGG ATCGCGCCAG AAAAGGCATA GAACATCGCC AGGCGCTGCT CGAAGTGGAG 
CAATCCCGCC GCATTCCCGA TATCACCCTT GCGGGCGGCA TGATCAAGCA TTGGGAATCA 
GGGGGAACGA CTGCGATCGT AGGCGTCTCC ATGCCGCTGC AATTCTTCGA CCGGAACCAG 
GGAAACCTGC GGGAAGCCTA TCAACGCCTG GATAAGGCAC AGGATGAGCA AGCCGCGACC 
GACCTGCGCC TCAAGGCGGA ACTGGTACAG GCCTACGAAT CGTTGACCGC AGCCGAGAAC 
GAGATATCGA TATTGCGCGG GGAGATATTG CCTGCGGCCC GAAGTGCTTT CGATGTGACG 
AACAAGGGTT ATGAGCTCGG CAAATTCGGC TTTCTTGAAG TGCTCGACGC ACAGCGCACC 
TTGTTTCAGA ACCAGGTTTT ATATGTGCGT GCGCTCGCCA ATTACCACCG CCTTGTCAAT 
GAAATCGAAC GTTTGATTGC AGCCCCCCTC GATGGGAGGG CGAGACAGGA CACCGATGAA 
CCGGCCTATA CCGATTTTAC GGATGATAAG GAGTAG

Protein sequence

MNFHALFIIS RCVRVGAMLV LAMTCLPSAG ADSSFTGIRT LEDAHSPSAA GPEVKSNLTL 
RDAVRLTLQH NPELSSFDKE MRALEGVTLQ AGLLRNPQLS VDVDNAGNMG GVSGQGAIKQ 
NVEQQDLIIR ISQLVELGGK RAARVNAASL GQALAGKDFE TKRLELVARV ANVFTEVLAG 
QEQLRLAEES QQLAQRVVDT VKRRVQAGKV PPIEETKVGV AFSTTRIALG QAQRELAAAR 
KRLALLWGDN SPQFGEALGA LESRIVLPDL AALTERVLSS PMADRARKGI EHRQALLEVE 
QSRRIPDITL AGGMIKHWES GGTTAIVGVS MPLQFFDRNQ GNLREAYQRL DKAQDEQAAT 
DLRLKAELVQ AYESLTAAEN EISILRGEIL PAARSAFDVT NKGYELGKFG FLEVLDAQRT 
LFQNQVLYVR ALANYHRLVN EIERLIAAPL DGRARQDTDE PAYTDFTDDK E