Gene Nmul_A1917 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1917
Symbol
ID	3784155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2206306
End bp	2207418
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	56%
IMG OID	637812003
Product	aspartate-semialdehyde dehydrogenase
Protein accession	YP_412604
Protein GI	82703038
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0136] Aspartate-semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01745] aspartate-semialdehyde dehydrogenase, gamma-proteobacterial

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.661095
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGAG TGGGTTTTAT CGGTTGGCGT GGCATGGTAG GGTCGGTTCT CATGCAACGT 
ATGCGGGAAG AAAATGATTT TGCATTGGTC GAGCCAACTT TCTTTTCCAC TTCGCAGAAG 
GGCGGCAAAG CACCGGACAT CGGCCAGGAG GCTCCGCCGC TGAAGGACGC GAATGATATA 
GGCGAGCTCA AGTCCATGGA CATTCTGATT TCCTGTCAGG GAGGGGATTA TACCGGCGCG 
ATTTTTCCCC GGCTGCGGGA AGCAGGCTGG CAGGGTTACT GGATCGATGC AGCCTCCACG 
CTGCGGATGA AAGATGATGC TGTCATCATA CTGGACCCGG TCAACATGCC CGTTATCGAA 
CAGGCTCTGC ACGATGGGAT AAAGAATTAT ATCGGAGGCA ATTGCACCGT CAGCCTGATG 
CTGATGGCCA TGAACGGGCT CTTCAAAGAA GAACTGGTGG AATGGATGAG CGCCATGACT 
TATCAGGCAG CTTCCGGCGC CGGGGCGCAG AACATGCGGG AATTGCTTCT GCAAATGGGC 
GAAGCCCATC GCGTGGCGAA AAATCTGCTG GATGACCCTG CGGCCGGAAT ACTCGACATC 
GACCGTGAAG TGGCGGGAAC ACTTCGTGAT GAAAATTTTC CAACCGAGAA TTTCGGTGTG 
CCGCTTGCAG GCAGTCTCAT CCCCTGGATA GACAGGGATT TGGGCAACGG GCAGACACGG 
GAAGAGTGGA AGGGGCAATC CGAGACAAAC AAAATACTGG GGCGTGGTGA ACGAACGGTT 
CCCGTGGACG GTATCTGTGT GCGTGTAGGG GCCATGCGTT GCCACAGCCA GGCGCTGACC 
GTGAAGCTGA AGAAGGATGT TCCGCTGGAT GAGGTGGAAG ACGTGCTTGC CGCTTCGAAC 
AGTTGGGTAA GGGTCGTTCC CAATGAGCGG GAGCATACCT TGAAAGAGTT GACTCCCGCT 
GCGGTTACCG GCAAGCTGAC AATACCGGTT GGCCGGTTGC GCAAGCTTGC CATGGGCGGC 
GAGTATCTTT CTGCATTCAC TGTGGGAGAC CAGTTGCTTT GGGGGGCCGC AGAGCCGCTG 
CGCAGAATGC TCAGAATTCT GGTGGCGGCC TGA

Protein sequence

MKRVGFIGWR GMVGSVLMQR MREENDFALV EPTFFSTSQK GGKAPDIGQE APPLKDANDI 
GELKSMDILI SCQGGDYTGA IFPRLREAGW QGYWIDAAST LRMKDDAVII LDPVNMPVIE 
QALHDGIKNY IGGNCTVSLM LMAMNGLFKE ELVEWMSAMT YQAASGAGAQ NMRELLLQMG 
EAHRVAKNLL DDPAAGILDI DREVAGTLRD ENFPTENFGV PLAGSLIPWI DRDLGNGQTR 
EEWKGQSETN KILGRGERTV PVDGICVRVG AMRCHSQALT VKLKKDVPLD EVEDVLAASN 
SWVRVVPNER EHTLKELTPA AVTGKLTIPV GRLRKLAMGG EYLSAFTVGD QLLWGAAEPL 
RRMLRILVAA