Gene Nmul_A1065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1065
Symbol
ID	3784885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1232624
End bp	1233610
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	54%
IMG OID	637811149
Product	pseudouridine synthase, RluD
Protein accession	YP_411760
Protein GI	82702194
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.901288
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGGGAAA TCATAGGGGA GGAGAGCAAA GGGCAGCGTA TTGATAATTT TTTAATCAAA 
CGCTTGAAAA ACGTGCCCAA AAGTCACGTC TACCGGTTGT TGCGCAGCGG GCAGGTGCGC 
ATCAACAGCA AGCGCGCCCC CCCGGACTAC CATCTCCAAT CCGGAGATAT TGTTCGCATA 
CCCCCGGTGA GAACGGTGGA AAAATCGGCG CTGCCCCCGA AGAAATTGAG CAAACCGGGT 
TTTATTGCAT TCCAGGTTTT GTTCGAGGAT GATGCACTGA TTGCTGTCAA CAAGCCTCCG 
GGAGTTGCGG TGCATGGTGG AAGCGGCATA AGTTTCGGCG TGATAGAGCA ATTGCGCGCT 
CAACATCCTG ACTGGAGATT TCTGGAGCTC GCACATCGCC TGGACAGGGA AACTTCTGGC 
GTGCTGCTCC TTGCCAAGAA CCGGGCGGCA CTTGTAGAGT TGCATCGGCA ACTCCGCATG 
GGAGAGGTGG AAAAACACTA CCTGACCCTG GTCAAGGGCA GGTGGCGTAA TGGGCGGCAG 
AGTGTCAGGC TGTCGCTCAG GAAATATCTG ACACCCGGCG GCGAACGGAG GGTAGCGGTG 
GAAAAGGATG CAGATGAAAA AAAAGGTGGA ATGAGCGCTC ATACCGTTTT CATCCTGCGG 
GAATCATGGC AGAGCTTCAG CCTGCTGGAG GCTGAACTGA AAACCGGGCG TACGCATCAG 
ATTCGTGTGC ACCTTGCCTA TCTCGGTTTC CCTATAGCGG GAGACGACAA ATATGGCGAT 
TTTGTCTTGA ATAAGGATAT TGCCCGGCGT GTTCCTGGTT TGGGACGGAT GTTTCTCCAT 
GCTTGGGCGG TCGAATTCAC GCATCCCGTC ACGCATGAGA AACTTCGTCT TGAAGCGCCC 
CTGCCGGACG ATCTGCAAAA ATTTCTGGAT GTGATGAATA ACCCCGATAA ACCACCGAAG 
CTTCCGGCGG AAAGGACATT CTCCTGA

Protein sequence

MREIIGEESK GQRIDNFLIK RLKNVPKSHV YRLLRSGQVR INSKRAPPDY HLQSGDIVRI 
PPVRTVEKSA LPPKKLSKPG FIAFQVLFED DALIAVNKPP GVAVHGGSGI SFGVIEQLRA 
QHPDWRFLEL AHRLDRETSG VLLLAKNRAA LVELHRQLRM GEVEKHYLTL VKGRWRNGRQ 
SVRLSLRKYL TPGGERRVAV EKDADEKKGG MSAHTVFILR ESWQSFSLLE AELKTGRTHQ 
IRVHLAYLGF PIAGDDKYGD FVLNKDIARR VPGLGRMFLH AWAVEFTHPV THEKLRLEAP 
LPDDLQKFLD VMNNPDKPPK LPAERTFS