Gene Nmul_A1960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1960
Symbol
ID	3784983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2253733
End bp	2254827
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	58%
IMG OID	637812048
Product	ADP-ribosylation/crystallin J1
Protein accession	YP_412647
Protein GI	82703081
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1397] ADP-ribosylglycohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGACC CTACCATACA GAATCGCGCT GCCGGCGCCG TCATGGGCGC TTTTATCGGG 
GATGCCCTGG GCCTCGGTCC TCACTGGTAC TACGATCTGG CAGTGCTCCG GCGTGACTAC 
GGCGACTGGA TCACGACTTA TACCGATCCC AAGCCCGGCC GCTACCACAG TGACCTCAAG 
GCAGGCCAAC TGTCACAGAC GGGTATCATT CTCCGGCTCA TGCTGCGCTC GCTCGTCGAG 
CGCGGCGGCT ATGACGAAGC GGATTTCTGC CAGCGGATGG ATGAGGAAAT ATTCCCATTT 
CTTAACGGCA TGCCCGTGAA CGGCCCTGGC GGCTATACCC AGCAGTCGAT TCGAGACACC 
TGGCGCAAGC GTGTTCAGGA GAATCAGCCA TGGGGCCAAA CGGGAGGTCA GGCCGATACC 
ACTGAAGCAA TAGGTCGCAC GCTGGCCCTG GCGGTCCGTT ACGCCTTTCA GCCACAAGAG 
ATGGCGGCCG TTGTCTCCAG CAATACCCGG CTTACCCAGA TCGACGGTAC TGTGGTTACC 
CTGACTGTCG CGTACGGATC GGTACTGAGT CTCCTGGTAC AGGGACACCA GCTCAACAGG 
AGTCTTTCCG GCAAGCTCAT GCGATTGGCA AGGGCGGGAA AATTGCCTTT TCATACGATG 
GCACATACCG ACTTGCAGCC GCCCCAAGAA GACCTTCCCT GCGAAAGTGG ATATTCCGTC 
TCTCCGGACG CTCTGCTCAC ACCCTCATAT ATAGCGGCAG CTGCGCTAGA CCCGGATATC 
CGGATAGAAC CGGCATGGAA AGTCTCCATC GTTTATGGCA TGACCTGTGC CATTTATCAT 
CAGCTTCCCG CAGCCTATCA TCTCACTGCC CGTTTTCCGA ATGATTTCGA ATCGGCTGTG 
CTCCACGCAG TGAATGGCGG TGGCGAAAAC CAGGCGCGTG CCGCTTTGAC CGGTGCGCTC 
GTTGGAGCCC AGGTCGGTCT GTCGGGAATA CCCCGGCGCT TTCTCGATGG CCTGTATGAA 
GGCGAGGCAC TCCAGAGCCT TGCGATGGAT CTGGGATCGA AAGTGGGGAC TTCAATCGGC 
GAGGGAAAAA GCTGA

Protein sequence

MSDPTIQNRA AGAVMGAFIG DALGLGPHWY YDLAVLRRDY GDWITTYTDP KPGRYHSDLK 
AGQLSQTGII LRLMLRSLVE RGGYDEADFC QRMDEEIFPF LNGMPVNGPG GYTQQSIRDT 
WRKRVQENQP WGQTGGQADT TEAIGRTLAL AVRYAFQPQE MAAVVSSNTR LTQIDGTVVT 
LTVAYGSVLS LLVQGHQLNR SLSGKLMRLA RAGKLPFHTM AHTDLQPPQE DLPCESGYSV 
SPDALLTPSY IAAAALDPDI RIEPAWKVSI VYGMTCAIYH QLPAAYHLTA RFPNDFESAV 
LHAVNGGGEN QARAALTGAL VGAQVGLSGI PRRFLDGLYE GEALQSLAMD LGSKVGTSIG 
EGKS