Gene Nmul_A1237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1237
Symbol
ID	3785576
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1422290
End bp	1423714
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	49%
IMG OID	637811322
Product	hypothetical protein
Protein accession	YP_411932
Protein GI	82702366
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAATA CTAAAAATTC CTGCATGATT GTGCAACCGA TTATCAGTCG GGTAACAAAA 
GAAACTTTGG TAATGAAGAA CTTCATGCAA AGAGCAGATA AGGTACGAAA TAATGAATCG 
GCACCGGTCG AGGTGCGCCC GCGGAAACTT TTCTGCAAGC CACGGAAATT TCTCGTTCAT 
GTTTGCAGCG TATCGCTTGC GATACTGGCG CTGATTATGG ATTCCCTGTT TCTCTCCTCG 
TGGGCGCAGG CAGCAGAAGT CACGCTTCCA AAAGGTCCAA AGTATGCAAT CGACGAAACT 
AAGTGGGTGA CGCTTGGAAT AGGTTTCCGT GGAACCGGGC TATGGGTGGA AAATCCTGCC 
ACGGGTAATC TCAGGAGCGG CGATTTCAGC ATTGATAATG CCCGTTTTTA CTTGAATGGG 
CAGATACATC AGTACCTCAA GTTCGAAGTC AATACGGAAT GTTTTTTCTG CAACAACACC 
CATCCCGGGG ATAATCCGAA GATGTCGTAC AACGTACTCG ATGCGATCGG AAAATTTGAG 
CTCAACCGTT ATTTCAACAT CTGGGGGGGC CGTATGCTGG TGCCGACCGA ACGGGGCGAA 
CTGAGCGGTC CTTTTTTTCA ATCAACACAT GACGCCTTCA AGACACCTTT TTTTTCCCAG 
GATTTCAGTA CCAAATTTGG CAGCGGTGGA GCTGGACGCT ATGGACGCGA CGATGGAGGC 
ACATTCTGGG GAAGCCTTGA ACCTGGCTTC ATCAGCGGTA CTCTGGGATA TGCTGTCGGT 
GTCTACCGCG GAGTCCAGTC ATCCCGTAGC GCCGGCCCCA ATCAGGGCGA TGACGTATTA 
TGGGCTGGCC GTTTCACATA TAACTTCTTG AATCCAGAAA AGAATCCTGG TTACTATACC 
AGCAGCACCT ATTTTGGCAA GGCCGGCGAT ATTCTCGCGC TTGCATTCGG CGTTTCATAC 
CAGAAAAATG GCGCCGGCTC CTTCGCGCAT CGAAGTGATT TCCTGGGACT GGTCGGGGAC 
GCCCTTTTTG AAAAAGTGCT ACCCCGGAAC ATGGGTGTAA TCACCGCAAA TGGTGAGTAC 
AAGCAGTTTT ATGCCAACTA TTCACCTGCG GCGTTTCAAG ATCCAGATTG CTTTTGCATG 
TTCGATGGTA AATCGTGGAC AGTCACCGGG CTTTATCTCC TGCCCATGAG GATCGGTATT 
GGCCAGTTTC AACCCTATGG CCGATTCACA AGTATCCAGC CAAATAACAG CAGCAACAGG 
GAAGAAATTG AAGCGGGTGT CAACTATATC ATTGACGGTT TCAATGCTCG AATTTCAGCG 
TACTACCAAC ACGGGGATCT ATTCACCAAA CGGCTGAACT ATGCGCCGGA TGTGGCTGGC 
GAGAAAGTTG ATGTATTCAA GCTGTCGTTT CAACTGCAAA TGTAG

Protein sequence

MMNTKNSCMI VQPIISRVTK ETLVMKNFMQ RADKVRNNES APVEVRPRKL FCKPRKFLVH 
VCSVSLAILA LIMDSLFLSS WAQAAEVTLP KGPKYAIDET KWVTLGIGFR GTGLWVENPA 
TGNLRSGDFS IDNARFYLNG QIHQYLKFEV NTECFFCNNT HPGDNPKMSY NVLDAIGKFE 
LNRYFNIWGG RMLVPTERGE LSGPFFQSTH DAFKTPFFSQ DFSTKFGSGG AGRYGRDDGG 
TFWGSLEPGF ISGTLGYAVG VYRGVQSSRS AGPNQGDDVL WAGRFTYNFL NPEKNPGYYT 
SSTYFGKAGD ILALAFGVSY QKNGAGSFAH RSDFLGLVGD ALFEKVLPRN MGVITANGEY 
KQFYANYSPA AFQDPDCFCM FDGKSWTVTG LYLLPMRIGI GQFQPYGRFT SIQPNNSSNR 
EEIEAGVNYI IDGFNARISA YYQHGDLFTK RLNYAPDVAG EKVDVFKLSF QLQM