Gene Nmul_A2236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2236
Symbol
ID	3784937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2539020
End bp	2540294
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	53%
IMG OID	637812324
Product	hypothetical protein
Protein accession	YP_412920
Protein GI	82703354
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATACA TCAGCAAAAT CCGCTCGGGG ATATACCGGA AATACTTCAG CACTATGCTG 
GCATTAAGTT TTCTGTTTTT GCTGCCCGAG GCATTCGCGA TGAATGGTCA TATTGCGGAT 
GGTCCCAAGT GGGTTATCGA TGACACCAAG TGGTTTACTC TCGGCATCGG TTTCCGTGGT 
TCGGGCGTAT GGGTCGAAAA CAGGGATACC GGTAATTTCC AGAGCGGTTT CAGCATCGAC 
AATGCCCGTG TCTATCTCAA CGGACAGATC CACAAGTATG TCAAATTCGA AAGCTACACC 
GAATGTACTT TCTGCAATAA CACCCATCCC GAGGATACCC CCAGGATGTC CTACAACGTT 
CTGGCCGCAA TCGGAAAGGT CGAGATCAAC CGCTTTGTCA ATTTCTGGGG TGGGCGCATG 
CTGGTGCCCA CGGAGCGGGG CGAATTGAGT GCCCCTTTTT ATCACGCGAC ACACGATGCC 
ATCAAAACGC CGTTCTTCCC CCAAGGATTC AGTACTAAAT TCGGCAGCCT CGGCGCAGGC 
CGGTATGGAC ATGATGACGG TGGGACCTTC TGGGGGAGCG TCGAGCCCGG CTTCATCAAA 
GGCACCTTGG GCTACGCGCT CGGCGTGTAC AGGGGCTTGC AGTCATCCAC GGCAGCGCGC 
ATGGGACCCA ATCAGGGGGA TAGTGTGGCA TGGGCCGGGC GTCTTACCTA CAATTTCCTG 
AACCCCGAGC CGAATCCGGG TTATTACACC CGTAATACCT ACTTCGGCCA GGCTGGCGAC 
ATTCTGGCGC TCGCGGCCGG TACTTCATAT CAAAAGGATG GTGCCGGATC GTTTGCGCAT 
CCCAGCGATT TCCTGGGTCT CGTCGGCGAT GTCCTGTTTG AAAAGGTCCT GCCAAAAAAT 
ATGGGTGTAG TTACCGTCAA CGGTGATTAC AAGCAATTCT ATGCCAATTA CTCGCCGCTG 
GCCTTTGCCG ATCCGGACTG CTTCTGCATA TTCGACGGAA AATCATGGGG TGTCACCGGG 
CTCTACCTGC TTCCCGTCAA GGTAGGGATC GGGCAATTTC AGCCTTATGG GAGATTTACC 
AGAGTTCAGC CTGACAACAG CAGCAAACGG GAAGAAATCG AGGCTGGGGT GAATTATGTC 
ATCAGCGGCT TCAACGCCCG TATTTCAGCG TACTACCAGC ACGGTGATCT TCGCACCAAA 
GGCATCAACT ATGCGCCGGA TGTAACAGGT GACAAGGTCG ATGTTTTTAA ACTGGCATTC 
CAGCTGCAAA TGTGA

Protein sequence

MKYISKIRSG IYRKYFSTML ALSFLFLLPE AFAMNGHIAD GPKWVIDDTK WFTLGIGFRG 
SGVWVENRDT GNFQSGFSID NARVYLNGQI HKYVKFESYT ECTFCNNTHP EDTPRMSYNV 
LAAIGKVEIN RFVNFWGGRM LVPTERGELS APFYHATHDA IKTPFFPQGF STKFGSLGAG 
RYGHDDGGTF WGSVEPGFIK GTLGYALGVY RGLQSSTAAR MGPNQGDSVA WAGRLTYNFL 
NPEPNPGYYT RNTYFGQAGD ILALAAGTSY QKDGAGSFAH PSDFLGLVGD VLFEKVLPKN 
MGVVTVNGDY KQFYANYSPL AFADPDCFCI FDGKSWGVTG LYLLPVKVGI GQFQPYGRFT 
RVQPDNSSKR EEIEAGVNYV ISGFNARISA YYQHGDLRTK GINYAPDVTG DKVDVFKLAF 
QLQM