Gene Nmul_A1151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1151
Symbol
ID	3784207
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1328140
End bp	1329267
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	59%
IMG OID	637811236
Product	NAD(P)(+) transhydrogenase (AB-specific)
Protein accession	YP_411846
Protein GI	82702280
COG category	[C] Energy production and conversion
COG ID	[COG3288] NAD/NADP transhydrogenase alpha subunit
TIGRFAM ID	[TIGR00561] NAD(P) transhydrogenase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.325327
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATATAG GAATACCGGC AGAGACCCGT GGGGGAGAAA CCCGGGTTGC CGCCACGCCG 
GAGACGGTCA AGAAATTTAC CGCCAAAGGT TTGCATGTCG TTCTGGTGCA GTCGGGCGCG 
GGTGCGGGCG CGAGCATAGC GGATGAGGAA TACCAGGCTG CCGGCGCAAG TATCGTGACC 
GATCCCGGCG AACTGTATGG GCAATCTCAG ATCGTGCTCA AGGTGCGGGC CCCCGAAGCG 
TCTGAACTCG CATTGATGCG CAAGGATGCC GTATTGGTTG GACTGCTTTC TCCACATCAG 
GCCGAGGGTA TCGAAGTGCT TGCCGCTCAC GGTATAACCG CTTTTTCGAT GGAGAAACTG 
CCGCGTATTT CGCGTGCCCA GAGCATGGAT GTGCTGTCGT CACAGGCCAA CATCGCCGGA 
TACAAGGCGG TGATCATGGC AGCCAATATC TACCAGAAAT TTTTCCCCAT GCTGATGACA 
GCGGCGGGTA CGGTAAAGGC GGCGAGAGTA CTGGTTCTGG GCGCAGGAGT GGCGGGATTG 
CAGGCCATTG CCACCGCCAA ACGGCTGGGG GCGGTAATCG AAGCATTCGA TGTGCGCCCG 
GCAGCCAAGG AACAGGTGGA AAGCCTGGGC GCCAAGTTTG TCGAGGTTGC GCTCAGCGAC 
GAGGAAAAGG CGCAAGCGGA AACCGCAGGT GGATACGCGC GGGAAATGTC GGAGGATTAC 
AAACGCCGCC AGGGCGAACT GGTGCACCAG CGCGCCTCTG CAGCCGACAT CATCATTACG 
ACGGCGCTGA TTCCCGGCCG TCCGGCCCCC GTGCTGATCC GGGAAGAAAC GGTGCAGGCG 
ATGAAACCGG GTTCCGTCAT TGTCGACCTG GCGGTTGAAG CCGGTGGCAA CTGTCCCTTG 
TCTGAATTGA ACAAGGTCGT CGTGAAACAT GGCGTGCATC TCGTCGGCAT TGCCAATCTG 
CCCGGACTGG TAGCCGCCGA TTCCAGCGCC CTGTATGCGC GCAACCTGAT GAATTTCGTG 
AACCTGATGC TCGATGCAAA GACAGGCGAA CTCAACATAA ATCGTGAAGA CGAAATCATC 
GCCGGAACCT TGGTATGCGC CAACGGGGAA GTCATCGGGA AAACCTGA

Protein sequence

MHIGIPAETR GGETRVAATP ETVKKFTAKG LHVVLVQSGA GAGASIADEE YQAAGASIVT 
DPGELYGQSQ IVLKVRAPEA SELALMRKDA VLVGLLSPHQ AEGIEVLAAH GITAFSMEKL 
PRISRAQSMD VLSSQANIAG YKAVIMAANI YQKFFPMLMT AAGTVKAARV LVLGAGVAGL 
QAIATAKRLG AVIEAFDVRP AAKEQVESLG AKFVEVALSD EEKAQAETAG GYAREMSEDY 
KRRQGELVHQ RASAADIIIT TALIPGRPAP VLIREETVQA MKPGSVIVDL AVEAGGNCPL 
SELNKVVVKH GVHLVGIANL PGLVAADSSA LYARNLMNFV NLMLDAKTGE LNINREDEII 
AGTLVCANGE VIGKT