Gene Nmul_A0979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0979
Symbol
ID	3786579
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1139170
End bp	1140270
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	55%
IMG OID	637811062
Product	extracellular solute-binding protein
Protein accession	YP_411674
Protein GI	82702108
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCCTC CACGACTCCT TTTTTTTCTG CTGGCATCAC TGCTCACGTT CGCCGCGGGA 
TGTACTCCCC CGAATCCGGA TGCGGGCAAC AGCGGCAAAA ATGTCCTGCA CCTGTTCAAC 
TGGAATAACT ACATCGCGCC GGAAACCGTT GCGCGCTTCG AGAAATCCTG TAAGTGCGAC 
CTGTCGCAGG ATTATTATGC CGACAACGAG GAAATGCTGG CGAAGCTCGC GGCGGGAGCC 
ACCGGTTATG ATGTTATCGT TCCCACGGGC AATGCGATCG ACACCCTCAT CCGCCAGGGA 
GCGCTGCGGC CGCTGGATAA ATCGCTCCTG CCCAATTTCA GGAATATCAA TCCTGCCTAT 
CTCGATACGG CCTTTGACCC CGGTAACATA TACTCGGTCC CCTACGCCTA CACGCTCTCT 
CTGCTCGGTT TCAACAAGGA GAAGATCGAG CAGCTTGGTC TGCCGACTGA TACCTGGGCA 
ATCATCTTCG AACCCAAATA TCTGGAAAAA ATCAGGGGAC GGGTGACCGT GCTCGACAGC 
CAGCGCGAGC TGATGGCCGC CGCGCTCAAG TATCTGGGCT ATTCCGTGAA CGATACGGAT 
GAGAGGCATT GGCAGGAGGC CGCCGCTCTG ATCGTGCGCG CCAAACCCTA TTGGGCGGCC 
TTCAGCAATA CCAGCTACAT CAAGGAACTG GCAGTGGGTA ATCTGTGGGT GGCGCACGGT 
TATTCCAATG ACATGTTCCA GGCGGCGCTC GATGCCCAGA AAACCGGGCG GAAATTCACG 
ATCAGCTATT CGACGCCCAA AGAGGGAGCA GTGCTGGCAG TGGATAGCAT GGTTCTGCAC 
AAAAGCGGGA AACGCCCCGA TCTTGCTCAC CAGTTCATCA ATTTCATGCT GGATGGAAAG 
AATTCCGCCG AACTCACCAA TCTCATCGGC TCGGGCAATC CCAATCTCGA TGCTTTGCAA 
TACATCCAGC CAGAAATTGC AAGCAACAAG GCCATTTTTC CCGATCCGGA ACTGATTGCC 
CGGCTTGAAA TGCTGCGCGA TCTCGATCGC AAGCAGCGGC GACTGTTGAG CCGCTTGTGG 
ACAGAAATTA AACTGCGATA A

Protein sequence

MNPPRLLFFL LASLLTFAAG CTPPNPDAGN SGKNVLHLFN WNNYIAPETV ARFEKSCKCD 
LSQDYYADNE EMLAKLAAGA TGYDVIVPTG NAIDTLIRQG ALRPLDKSLL PNFRNINPAY 
LDTAFDPGNI YSVPYAYTLS LLGFNKEKIE QLGLPTDTWA IIFEPKYLEK IRGRVTVLDS 
QRELMAAALK YLGYSVNDTD ERHWQEAAAL IVRAKPYWAA FSNTSYIKEL AVGNLWVAHG 
YSNDMFQAAL DAQKTGRKFT ISYSTPKEGA VLAVDSMVLH KSGKRPDLAH QFINFMLDGK 
NSAELTNLIG SGNPNLDALQ YIQPEIASNK AIFPDPELIA RLEMLRDLDR KQRRLLSRLW 
TEIKLR