Gene Nmul_A1292 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1292
Symbol
ID	3784329
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1485371
End bp	1486390
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	58%
IMG OID	637811379
Product	Short-chain dehydrogenase/reductase SDR
Protein accession	YP_411987
Protein GI	82702421
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACCAG AAGACAACGC CAATGCCGCA CGGCGCCAGT TTGTGGGCGG CATGACAACC 
GGCCTTGCCG CAGCATTTGT CTACCCGGCC TTCGCTCAGC AAGGGCAGCA AGCAAACCCT 
TCCGGCTCCC TGCAAGGGCC CGGCCAGTCC CGTAAGCAGG ATCCGAGAAC GCAATATCCT 
ATTCCCCCCT TTCCCCAGCA AAAACAGGAG CCTCCCGGCC TTGTAAGCAA GATGATGCCG 
CGGCCTGATC ACGGCGAGAC AACCTACAAG GGTTCGGGGC GGCTAGTGGA TAGAAAGGCG 
CTTGTGACCG GTGGAGATTC GGGCATTGGA CGCGCCGCCG CCATCGCCTT TGCGCGTGAG 
GGAGCCGATG TCGCGATTAA TTATCTCCCG GTCGAGGAGT CCGATGCTCG TGAGGTCGTG 
GAAATCATCC GGGCAGAAGG GCGAAAGGCG GTCGCGATTC CTGGCGATAT CAGGGATGAG 
AATTTTTGCT CCAGGCTTGT CGCCAACGCC GTCCGGGAGC TGGGCGGACT GGATATCCTT 
GTCAACAATG CGGCCATGGC TGTCGCACAG CCCTCTATCG TTGATCTCAC GACAGAACAG 
TTCGATTCGA TCTTCAAATG CAACGTCTAT GCCATGTTCT GGATCACCAA GGCGGCCATG 
CCGCACCTTA AGCCCGGAGC GGCCATCATC AATACAAGTT CTGTTGAGGC TTACACTCCA 
TCCGATGCGT TTCTCGACTA CGCCCAGACA AAGGCGTGCA ATGTTGCTTT CACGAAATCA 
CTGGCGAAGC AGTTGGCCAA CAAGGGTATC CGGGTGAATG CGGTGGCGCC GGGACCATTC 
TGGACACCGT TGCAGACGGC TGGATGGGCG GATCTCAGCA GGTTGGGCAA GGAGACTCCG 
CTTGGCAGAC CCGGTCAACC AGCGGAACTG GGTCCCCTGT ATGTTTTCCT TGCATCACAG 
GAATCAAGCT ATGCAACCGG ACAGGTGTAC GGCGCTTCAG GGGGGGAAGG GCAGCCCTAA

Protein sequence

MKPEDNANAA RRQFVGGMTT GLAAAFVYPA FAQQGQQANP SGSLQGPGQS RKQDPRTQYP 
IPPFPQQKQE PPGLVSKMMP RPDHGETTYK GSGRLVDRKA LVTGGDSGIG RAAAIAFARE 
GADVAINYLP VEESDAREVV EIIRAEGRKA VAIPGDIRDE NFCSRLVANA VRELGGLDIL 
VNNAAMAVAQ PSIVDLTTEQ FDSIFKCNVY AMFWITKAAM PHLKPGAAII NTSSVEAYTP 
SDAFLDYAQT KACNVAFTKS LAKQLANKGI RVNAVAPGPF WTPLQTAGWA DLSRLGKETP 
LGRPGQPAEL GPLYVFLASQ ESSYATGQVY GASGGEGQP