Gene Nmul_A1232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1232
Symbol
ID	3785571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1415331
End bp	1416374
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	52%
IMG OID	637811317
Product	periplasmic solute binding protein
Protein accession	YP_411927
Protein GI	82702361
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0803] ABC-type metal ion transport system, periplasmic component/surface adhesin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAAGCT TCATAAGCAC CTTAAAGCCT GATCGATCTT CAGCCAAAGC GCGACACCAT 
TTCTCATCGA CAAAAAAAAC AGCCGTGCAG CTTCGTCAGA TTGCCCTTCC ATTTCTACTG 
CTTCTGTTAG TGCAACCGCC ACCTTCCCAT GCCGGAAATG CGGCCAAAAG GCTCTTTATC 
GTCACAACCG TGGCGCCCAT CACGAATATC GTCCGCAATG TGAGCGGGGA TTATGCAAAT 
GTGACTGGAA TTGTTCCCGA TGGAACCGAT TCTCACACCT TCGAGCCGGT TCCCGCAGAT 
GCAAAGCTGC TGGAAACGGC CGATATCATT ATTGCCAATG GCCTCGATCT CGAGTTGCCC 
ACCCTGAAGC TGGCGGAAAA GATCACGAAA GGAAGAGTAC GGATTCTCGA GCTGGGAAAC 
CGTATCTTGC GCAAGGAGGA TTGGCAGTAT GATTTCAGCT TTCCCCGCGA GCGTGGCCAT 
CCCAATCCTC ATCTCTGGCC CAATATCGCG CTGGCAATGC GTTATGTCGA AGTCGTGCAG 
GACGAGCTCA TCGCGCTCGA TCCCGTACAC AAGGAAGGAT ACATGGCAAA TGCATCGATG 
TATCTGGGCA AGCTGCGTAA CCTGGATAAG GCAACCTTTG CTTGCGTAAA GACCATTCCG 
GAGAAAAATC GCAAGCTCGT GACTTATCAT GACTCCTTTG CGTACTTCGC TCCCCGGTAT 
GGGATGAAGA TCATTGCGGC GGTTCAACCC TCCGATTTTT CGGAACCCGG ACCACGAGAG 
GTAATCCGCA TCATAAAGCA GATCAGAAAC GAGAATGTAC CTGCTATTTT TGGCTCGGAA 
GTTTTCCCCA GCAAGATCAT GGAGCAGATC GCCCGCGAGA CGGGCGTCAA GTTCATAGAT 
CAGCTTTCCG ATGATGCGCT GCCCCCACCT CCGGAAAACT CTTTCATCGG CATGATGGCG 
AACAACATGA GGATAATGAC GGCAGCACTC GGCGGGAATC CGGGCTGCAT GGCAGATGTC 
GACACGAGCA ATATCAAGTA CTGA

Protein sequence

MVSFISTLKP DRSSAKARHH FSSTKKTAVQ LRQIALPFLL LLLVQPPPSH AGNAAKRLFI 
VTTVAPITNI VRNVSGDYAN VTGIVPDGTD SHTFEPVPAD AKLLETADII IANGLDLELP 
TLKLAEKITK GRVRILELGN RILRKEDWQY DFSFPRERGH PNPHLWPNIA LAMRYVEVVQ 
DELIALDPVH KEGYMANASM YLGKLRNLDK ATFACVKTIP EKNRKLVTYH DSFAYFAPRY 
GMKIIAAVQP SDFSEPGPRE VIRIIKQIRN ENVPAIFGSE VFPSKIMEQI ARETGVKFID 
QLSDDALPPP PENSFIGMMA NNMRIMTAAL GGNPGCMADV DTSNIKY