Gene Nmul_A0472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0472
Symbol
ID	3784889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	527769
End bp	528785
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	57%
IMG OID	637810548
Product	ketol-acid reductoisomerase
Protein accession	YP_411172
Protein GI	82701606
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0059] Ketol-acid reductoisomerase
TIGRFAM ID	[TIGR00465] ketol-acid reductoisomerase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGTTT ATTACGATAA AGACGCCGAC TTGTCGCTCA TTCGGGACAA GAAAGTCACC 
ATTGTCGGCT ACGGGTCGCA AGGTCACGCC CACGCCAACA ATCTGAGCGA TTCCGGCGTG 
GCGGTAACAG TTGGCCTGCG CAAGGAAGGT GCTTCCTGGG GCAAGGCGGA AAAGGCCGGG 
CTTACCGTCA AAGAGGTGGC TGAATCGGTA AAGGATGCAG ACGTCGTGAT GGTCCTGCTG 
CCCGATGAGC AGATTGCTGA TGTATATGCG ACTGAAATCG AACCCAACCT CAAGAAAGGT 
GCTACTCTTG CCTTTGCCCA TGGCTTCAAT ATTCATTATG GCCAAGTAGC GCCCAGGGAA 
GATCTGGACG TCATCATGAT CGCTCCCAAG GGGCCGGGAC ACCTGGTACG CTCCACCTAC 
CTCCAGGGCG GGGGTGTGCC TTCACTTATT GCAGTGCACC AGGACAAGTC CGGCAGGGCA 
CGTGACCTGG CGCTCTCCTA TGCGGCTGCC AACGGCGGCA CCCGTGGCGG AGTGATCGAA 
ACCAATTTCC GCGAGGAAAC CGAAACCGAT CTTTTCGGCG AACAGGTCGT GCTGTGCGGT 
GGTCTGACCG CCTTGATTCA GGCCGGCTTT GAAACCCTGG TGGAAGCCGG CTACGCCCCG 
GAGATGGCCT ATTTCGAATG TCTGCACGAA GTCAAGCTGA TCGTCGACCT GATCTATGAA 
GGCGGCATCG CCAACATGCG CTACTCCATT TCCAACAACG CCGAGTATGG GGATATTTCG 
CGCGGTCCCC GTGTGATCAC CGACGCCACC CGTGCCGAAA TGCGCAAGAT TCTCCGCCAG 
ATTCAGACAG GGGAATATGC CCGCGAATTC ATCCTTGAAA ATCGCGCCGG CGCACCCATG 
CTCAAAGCCA GCCGCCGTCT CGCATCCGAG CACCAGATCG AACAGGTGGG CGCCAAACTG 
CGCGATATGA TGCCCTGGAT CAAAAAGAAC AAGCTGGTCG ATCAGGCGAA AAATTAG

Protein sequence

MNVYYDKDAD LSLIRDKKVT IVGYGSQGHA HANNLSDSGV AVTVGLRKEG ASWGKAEKAG 
LTVKEVAESV KDADVVMVLL PDEQIADVYA TEIEPNLKKG ATLAFAHGFN IHYGQVAPRE 
DLDVIMIAPK GPGHLVRSTY LQGGGVPSLI AVHQDKSGRA RDLALSYAAA NGGTRGGVIE 
TNFREETETD LFGEQVVLCG GLTALIQAGF ETLVEAGYAP EMAYFECLHE VKLIVDLIYE 
GGIANMRYSI SNNAEYGDIS RGPRVITDAT RAEMRKILRQ IQTGEYAREF ILENRAGAPM 
LKASRRLASE HQIEQVGAKL RDMMPWIKKN KLVDQAKN