Gene Nmul_A1641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1641
Symbol
ID	3785583
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1879350
End bp	1880789
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	54%
IMG OID	637811729
Product	Outer membrane efflux protein
Protein accession	YP_412333
Protein GI	82702767
COG category	[M] Cell wall/membrane/envelope biogenesis [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1538] Outer membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATCCCG GAGTACTAGT TGATCGTGAG CAAGTTGATG TGCTTAATCT TCTGAGCAAT 
GTGCTGCCTG CAGTACGAAT TGCTCTGGGG ATCATGCTGT TTTCGAGTAT ATCGGCAATG 
CTTCATGCAG CTTCTTTCAC GGTTCAGGCA GAACCTGCAA AAGAGGAATT TTCCATCACC 
GAACAGCAAG CGATCGCACT GTTCTATCAG CGCAACCTCG GCTTGATCGC AGCCAGCCTC 
AACATCGATA ACGCCAGGGC CCAGGAAATC ATCGCCGCAG CGATTCCCAA TCCGGTATTC 
AGTTTTACAG TTCACGAACT GGCCCCAAAG GCATTCGCGC CGGAAAGCCG TCACCTGGCA 
GTCCCCGCGT ATTTACCGCA GATTCAGCAG CTCATAGAAA CGGCCGGAAA ACGGCGTTTA 
CGGATAGAAA GCAGCGAGCT GGCTACCGAG GCTGTGAACT TCGACGTGCA AGACGTTGCA 
CGCGTGCTCA CAAACACCGT GCGGCGCAGT TTTTACAACC TCCTGTTGGC CCAGAAGACG 
ATCAAGGTTG CACGGGATAA CCTCGAGCAT TACCGGGAAA TTCTGAGGGT AAACGAAATA 
CGGCTCAAGG TAGGCGATGT TGCGGAGATG GATTTCGTTC GTATCGAGGT TGAAAGCCTC 
AAGGTTCAAA GCGATCAGGA TCAGGCAAGG GCTGCATTGA ATCAGGCACG GGCCGACCTG 
CTATTGCTGC TGGGCTGGCC TGAAAACAGC ATAGAAATCA ATGCCGCCGA AACCTGGCCT 
CAAGCAACGC CCGAGATTGC GCTGGCGACG CAGGATCAAT TGGTTGAACG CGCGCTGGAA 
CGACGTCCGG ATATGCGCGC TGCAAGGATA CGCATCGCCC AGGCGCGAAA AGTGCTCACA 
CTCGCGCAAC GGCAGGTTAT TCCCGATGTG ACAATAAGCG CGTTCTACGA TCGGGATCAG 
GGTAACCAGT TTCCGCGTAC TGGCGGCGTG GGTATCAGCA TACCAATCCC TTTGTTCTAC 
CAGCAAAAAG GTGAAATTTC CCAGGCTCGC GTAGGTTTGA CTTCCAGCGA ACTGGCATTA 
AGGCAGGCCG AGTATGACGT GCGCGCTGAA GTCATGAAGG CCTCGGCAGC TTGGCAAAGC 
GCCGACGCCA TAGCCCGGCG CTTTGAAACT TACGTGGTCA AAAAAATCGA GGCATTGCGC 
AAGGCACAGG AAATTGCTTA TCAAAAAGGG GCAGTGGGAG TGCTGGATCT GATCGATGCT 
GAGCGAAGCT ATCGGACAAT TATGCTGGAT TATTATGCCG CGCTGGCAAA CCGCAGCAAA 
GCCTGGGCTG ATTTGCTGAT GGCATATGGC GAGGAAACCG GAAATCCGCG CTATCAATCC 
GGCAGCAACC AGGATGATTG GCGGTCCGCG CGTTCCCACC GGGTGAATTT CGGTAAATAA

Protein sequence

MYPGVLVDRE QVDVLNLLSN VLPAVRIALG IMLFSSISAM LHAASFTVQA EPAKEEFSIT 
EQQAIALFYQ RNLGLIAASL NIDNARAQEI IAAAIPNPVF SFTVHELAPK AFAPESRHLA 
VPAYLPQIQQ LIETAGKRRL RIESSELATE AVNFDVQDVA RVLTNTVRRS FYNLLLAQKT 
IKVARDNLEH YREILRVNEI RLKVGDVAEM DFVRIEVESL KVQSDQDQAR AALNQARADL 
LLLLGWPENS IEINAAETWP QATPEIALAT QDQLVERALE RRPDMRAARI RIAQARKVLT 
LAQRQVIPDV TISAFYDRDQ GNQFPRTGGV GISIPIPLFY QQKGEISQAR VGLTSSELAL 
RQAEYDVRAE VMKASAAWQS ADAIARRFET YVVKKIEALR KAQEIAYQKG AVGVLDLIDA 
ERSYRTIMLD YYAALANRSK AWADLLMAYG EETGNPRYQS GSNQDDWRSA RSHRVNFGK