Gene Nmul_A0988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0988
Symbol	ubiB
ID	3786588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	1146418
End bp	1147932
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	56%
IMG OID	637811071
Product	putative ubiquinone biosynthesis protein UbiB
Protein accession	YP_411683
Protein GI	82702117
COG category	[R] General function prediction only
COG ID	[COG0661] Predicted unusual protein kinase
TIGRFAM ID	[TIGR01982] 2-polyprenylphenol 6-hydroxylase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTTTCT TCCGTCTTCT CAAAATACTC GCCGTCTCAT TCCGTTTCGG CCTCGACGAA 
TTCTTCCTGA GCCACGAACG TCTGCGCCTA CTGCGGCCTG TCGTCAGAAC GGCAACGTTC 
TGGCGTAAAC TGGATCGTGC GCGGGGCGAA CGTCTCCGCC TCGCCCTGGA GGCTCTGGGT 
CCCATCTTCG TCAAGTTCGG CCAGATGCTC TCTACCCGGC GGGATCTTCT GCCGCCCGAT 
ATCGCCGACG AACTGGCGAA ACTACAGGAT CAGGTTCCAC CATTTCCCTC CAGCATTGCC 
CTCAAGACAC TGGAAGAGGT CTACGGAAAA CCCGTCAACG AAGTTTTTCT GCTGTTCGAT 
GTGGAGCCGG TAGCAAGCGC GTCCATTGCC CAGGTTCATC TGGCAGTGCT GCATGATGGT 
ACGGAAGTCG CAGTCAAGGT GCTGCGTCCC GGCATCGCGC CTGTGATCGC CCATGATATC 
GCGCTGATGG ACACAGGCGC TCTTTTGCTC GAAATAGTCT GGCCGGATGC CAAGCGGCTC 
AAGGTACGGG AAGTTGTGAC TGAATTCGCC CGTCATCTCG ATGACGAACT GGATCTCATG 
CGCGAAGCCT CCAATTGCAG CCAGTTGCGG CGCAATTTCC TGGATTCTCC CCTGCTTCTG 
GTTCCGGAAG TCTACTGGGA TTACTGCTAT TCGAGCGTCA TGGTGATGCA GCGCGTCAAA 
GGCACGCCCA TCAGTCATGT CACAGCCTTG CGGGAGCAGG GCGTGGATAT TCCGCGACTT 
GCCCGCGTCG GCGTGGAAAT CTTTTTCACC CAGGTATTCC GCGATGGCTA TTTTCATGCC 
GACATGCATC CGGGAAACAT CTTTGTCGGC AAGGACGGCC GGTATATCGC TGTCGACTTC 
GGCATAATGG GAACCCTTAC CGACGAAGAC AAGAATTATC TCGCGCAGAA TTTCCTGGCT 
TTCTTCCGCC GTGACTACAA GCGTGTGGCG GAAGCGCACG TGGAGGCGGG ATGGGCGCCG 
AAAAACACGC GAGTCAATGA TTTCGAAACC GCTATCCGGG CAGTATGCGA ACCTATTTTC 
GACAAGCCCT TGAGCGAGAT TTCATTTGGG CGGGTATTGC TGCGGCTGTT TCAAACGTCG 
CGCCAGTTCA ATGTCGAAAT CCAGCCGCAG CTCGTGATGC TGCAAAAAAC CCTGCTCAAT 
ATCGAGGGGC TGGGGCGGGA CCTCGACCCT AATCTCGACC TGTGGACGAC AGCCAAGCCG 
TACCTGGAAA ACTGGATGGC GGAGCAGTTG GGCTGGAGAG GGCTCAGCCG CCGCCTGCGC 
AAGGAAGCCA CGAGTTGGGC GGTAATCATG CCCCAGTTTC CCCGCCTGAT GCATCATGCC 
CTGACGGAAA TACGTACCAG CGCTCTGGAA GAAAAGATGG ACCAGTTCAT CCTGGAGAAA 
AAACGTGAGA CCCGGCGCCT CACCATCTTC ATCGTATTAC TGATCATAGT GATACTGTGG 
CATCTGGGAA AATAA

Protein sequence

MRFFRLLKIL AVSFRFGLDE FFLSHERLRL LRPVVRTATF WRKLDRARGE RLRLALEALG 
PIFVKFGQML STRRDLLPPD IADELAKLQD QVPPFPSSIA LKTLEEVYGK PVNEVFLLFD 
VEPVASASIA QVHLAVLHDG TEVAVKVLRP GIAPVIAHDI ALMDTGALLL EIVWPDAKRL 
KVREVVTEFA RHLDDELDLM REASNCSQLR RNFLDSPLLL VPEVYWDYCY SSVMVMQRVK 
GTPISHVTAL REQGVDIPRL ARVGVEIFFT QVFRDGYFHA DMHPGNIFVG KDGRYIAVDF 
GIMGTLTDED KNYLAQNFLA FFRRDYKRVA EAHVEAGWAP KNTRVNDFET AIRAVCEPIF 
DKPLSEISFG RVLLRLFQTS RQFNVEIQPQ LVMLQKTLLN IEGLGRDLDP NLDLWTTAKP 
YLENWMAEQL GWRGLSRRLR KEATSWAVIM PQFPRLMHHA LTEIRTSALE EKMDQFILEK 
KRETRRLTIF IVLLIIVILW HLGK