Gene Nmul_A1520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1520
Symbol
ID	3786106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1739314
End bp	1740297
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	55%
IMG OID	637811608
Product	heat shock protein DnaJ-like
Protein accession	YP_412215
Protein GI	82702649
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATTCA AGGATTACTA CAAAATCATG GGGGTTCCCC GCGACGCCTC ACAGGATGAC 
ATCAAGCGCG CCTACCGGAA ACTGGCGCGC AAATATCATC CCGACGTCAG CAAGGATCCG 
CAAGCGGAAG CCCGCTTCAA GGAGTTGGGT GAGGCCTATG AAGTCCTCAA AGATCCGGAG 
AAGCGCGTAG CATATGACCG CCTTGGCACA AACTGGAAAG CCGATCAGGA ATTTCGTCCT 
CCCCCGGATT GGAATGCCGG CTTCGAGTTT TCACAACAGG GATTTACAGG AGCAGATGCC 
GCCCAGTTCA GCGAATTTTT CGAATCCCTG TTTGGGCGCA GTTTTCGTGC CGAGCAAGCG 
AGACGCGGAG GAGAGACTCA TGGGGGTCCC GGTGGAGCTT TCTTTCATGC ACCTGGCGAG 
GATCGGTATG CCAAAATAAT GATCGATCTG GAAGATTCAT ATCACGGCGC TACCCGCACC 
ATCTCGCTGC AAGTACCAGA GGTCGATGCA GAAGGACATG TATCGACGCG CGAACATAAG 
TTGAACGTGG TTATCCCCCG TGGTATCCGG CCCAGGCAAT ACATTCGTCT TGCTGGCAAG 
GGTGCGCCGG GCCATGGTCA GGGAAAGGCG GGCGATCTGT ATCTGGAAAT CGAGTTTCGC 
TCTCATCCCA TCTATCGAGT AGACGAGCAC GACGTCTATC TTGACCTCCC GGTAGCCCCC 
TGGGAGGCGG CGTTAGGCGC AACGATAACT GTTCCCACTC CGGAAGGAAT GGTTGACCTG 
AAAATACCTG CTGATTCCAC TACCGGACGG AAGCTGCGAC TCAAAGGACG CGGTATTCCC 
GGCAAAATAC CGGGTGACTT CTATGTTGTA TTGCGCATTG TGCCACCGCC TGCCACCGAT 
GAAAGTGATA AGGCCTTTTA TCGCAGCATG GCGGAGCAAT TCAAATCGTT CAACCCGCGG 
GCCAAACTGG GAGTGCAGGC ATGA

Protein sequence

MEFKDYYKIM GVPRDASQDD IKRAYRKLAR KYHPDVSKDP QAEARFKELG EAYEVLKDPE 
KRVAYDRLGT NWKADQEFRP PPDWNAGFEF SQQGFTGADA AQFSEFFESL FGRSFRAEQA 
RRGGETHGGP GGAFFHAPGE DRYAKIMIDL EDSYHGATRT ISLQVPEVDA EGHVSTREHK 
LNVVIPRGIR PRQYIRLAGK GAPGHGQGKA GDLYLEIEFR SHPIYRVDEH DVYLDLPVAP 
WEAALGATIT VPTPEGMVDL KIPADSTTGR KLRLKGRGIP GKIPGDFYVV LRIVPPPATD 
ESDKAFYRSM AEQFKSFNPR AKLGVQA