Gene Nmul_A0466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0466
Symbol
ID	3786013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	518270
End bp	519664
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	56%
IMG OID	637810542
Product	glucose-6-phosphate 1-dehydrogenase
Protein accession	YP_411166
Protein GI	82701600
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0364] Glucose-6-phosphate 1-dehydrogenase
TIGRFAM ID	[TIGR00871] glucose-6-phosphate 1-dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGAAAAA CCAATGACTA CACCAAGCCA TCCGATGCAC TGGTGCTGTT TGGGATAACG 
GGTGACCTCG CTTATAAAAA GATCTTTCCG GCGCTGTACG CGATGATCAA AAAGGGCATG 
CTCGATGTGC CGCTGGTCGG TGTCGCCTCG ACACCCTGGA GTCTCGATCA ACTCAAGGAA 
CGGGCGACCC AGTCCATCAG CGACTCCGGA AAGATTGATG ACAAACGGGC GCTGGATCAC 
CTCCTTTCCC TGCTGCGATA TGTGCGTGGA GACTACAACA ACCTCGATAC GTTCAAGGCA 
CTCAAACAGG CTCTGGGAGA TGCACGTCAT CCCGTGCACT ATCTCGCCAT CCCCCCTCTT 
CTTTTCGAGA ATGTCATAAG AGGTCTTGGT GCGCTCGATC TGGCCGCAGG CGCGCGCGTC 
ATTGTGGAAA AACCTTTTGG ACGGGATCTT GAGTCAGCAC GTGAACTGAA CCGTATTGCA 
CGCTCCGTGT TCCCCGAGGA AGCGATATTC CGTATCGACC ATTTTCTCGG AAAAGAGGCG 
ATCATGAATA TTCTTTATTT CAGATTCGCC AATTCATTTC TGGAACCGAT ATGGAATCGT 
AATTATGTAG CCAGCGTGCA GATCACATTG GCTGAGGAAT TCGGGGTTGA AGAACGAGGC 
GCATTTTACG AATCCGCCGG CTGCCTGCGC GACGTGATCC AGAATCATCT TTTCCAGATT 
GTTGCGCTGC TGGCCATGGA ACCTCCCGCT TATCGCGGTC TCGGAACGGT CCAAAGCGAA 
AAAATCAACA TATTTCACGC CATGCGCCCC CTTGTACCCG AGGACCTGGT GCGGGGACAA 
TATGTGGGCT ACCGTCAGGA ACCGGGTGTG GCGGAGGACT CCGATGTCGA GACATTCTGC 
GCCCTGCGGC TTTTCATCGA CTCCTGGCGC TGGGAAGGGG TCCCCTGGTA TCTGCGTTCC 
GGCAAGTGTC TGGCCAAGAC TGCTGCGGAG GTCCTTGTCC AGCTGAAGCC GCCGCCGCAA 
AAGCTTTTTG CCGATTCGGC AAGCGCCGCA TGTGATGCCA ATTATCTCAG GTTCCGCCTT 
TCTCCCGTCT CAGCGGTTGC CATTGCAGCG AGAGTCAAGC ATCCCGGAAA AGAGTTCAAA 
GGCGATCAGC AGGAGTTGTG CCTGGTCGAG GAGCACTTCG GGCGCGAATC GCCTTATGAA 
CGTCTCCTGC ATGATGCAAT GATTGGTGAC GACACCCTGT TTACCAAGAG GGAAGCGGTG 
GAGGCATCCT GGACAGCACT CGATCCTGTG CTCAAGACAT ATCCTCACGT TCTGCCCTAC 
GAGCGCGGCA GTTGGGGCCC CGCCGCAGCC GACGCGCTGA TCGAGGCGGA TGGCTGCTGG 
CACAATCCGG GATAG

Protein sequence

MRKTNDYTKP SDALVLFGIT GDLAYKKIFP ALYAMIKKGM LDVPLVGVAS TPWSLDQLKE 
RATQSISDSG KIDDKRALDH LLSLLRYVRG DYNNLDTFKA LKQALGDARH PVHYLAIPPL 
LFENVIRGLG ALDLAAGARV IVEKPFGRDL ESARELNRIA RSVFPEEAIF RIDHFLGKEA 
IMNILYFRFA NSFLEPIWNR NYVASVQITL AEEFGVEERG AFYESAGCLR DVIQNHLFQI 
VALLAMEPPA YRGLGTVQSE KINIFHAMRP LVPEDLVRGQ YVGYRQEPGV AEDSDVETFC 
ALRLFIDSWR WEGVPWYLRS GKCLAKTAAE VLVQLKPPPQ KLFADSASAA CDANYLRFRL 
SPVSAVAIAA RVKHPGKEFK GDQQELCLVE EHFGRESPYE RLLHDAMIGD DTLFTKREAV 
EASWTALDPV LKTYPHVLPY ERGSWGPAAA DALIEADGCW HNPG