Gene Nmul_A1976 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1976
Symbol
ID	3785000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	2273070
End bp	2274026
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	58%
IMG OID	637812065
Product	pseudouridine synthase, RluD
Protein accession	YP_412663
Protein GI	82703097
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAACTGA TCATTCCCGA CCATTGCGCC GGCCTCCGGC TGGATCAGGC CCTGGCGCAA 
CTATTGGCCG AATGGTCTCG CAGCCGGCTG CAATCTTGGA TTCTGGAAAA GAGGGTAAGC 
GTAGATGGCG CATGCAGCCT TCCCCGGCAG AAAGTGTGGG GTGGGGAAAA GATCGTACTC 
TCTCCCGCAC GCGATCCTGC TGAAACTGCG CATGAGCCGG AAGCCATTGC GCTGGATATT 
GTCCATGAAG ATCACGCCAT CATTATCATC GATAAGCCCG CGGGGCTCGT CGTCCATCCC 
GGCAGCGGAA ACTGGCAGGG CACCCTGCTC AATGCATTGC TGCACCATTC CCCTCAATTA 
AGCGGCATAC CGCGCTCCGG TATCGTTCAC CGTCTGGACA AGGAAACCAG CGGTCTCCTG 
GTAGTGGCAA AAACCCTGGA AGCCCAAACC AGCCTGGTGC GCCAGTTGCA AAAGCGCACG 
GTCAAACGGG AGTATCTGGC GCTGGTCTGG GGCAGCGTTT CCTCCCACGG AAGGGTTGAC 
GCTCCGGTCG GCCGCCATCC GGTACAGCGG ACCAGAATGG CAGTAGTCGC GAGTGGCAAG 
GAAGCGCGCA CACGTTACGA GGTATTGGAG CAATTCACCG ATTGCACCTT GCTCCGGTGC 
GGACTGGAGA CAGGGCGCAC CCATCAGATA CGCGTGCACA TGCAGTCTCT CGGCCATCCC 
CTGGTGGGAG ATCCGTTGTA TGGCGGCAAA GCAAAAAAAG GCAGCAGTGC GACGATGCAG 
TTGGCTGCTT TTCCCCGGCA GGCGTTGCAT GCCCACAAGC TGGAATTGAC GCATCCGCAG 
AACGGCCAGA GAATGGGATG GGAAGCGCCA TTGCCGGAAG ACATGAGCAA CCTGCTGCTG 
ATGCTTCAGA AAGCGCGTGA TAAAGAATCC CATGCAATTC CAGCCATGAT CAAATGA

Protein sequence

MELIIPDHCA GLRLDQALAQ LLAEWSRSRL QSWILEKRVS VDGACSLPRQ KVWGGEKIVL 
SPARDPAETA HEPEAIALDI VHEDHAIIII DKPAGLVVHP GSGNWQGTLL NALLHHSPQL 
SGIPRSGIVH RLDKETSGLL VVAKTLEAQT SLVRQLQKRT VKREYLALVW GSVSSHGRVD 
APVGRHPVQR TRMAVVASGK EARTRYEVLE QFTDCTLLRC GLETGRTHQI RVHMQSLGHP 
LVGDPLYGGK AKKGSSATMQ LAAFPRQALH AHKLELTHPQ NGQRMGWEAP LPEDMSNLLL 
MLQKARDKES HAIPAMIK