Gene Nmul_A1043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1043
Symbol
ID	3785170
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1206513
End bp	1207736
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	55%
IMG OID	637811127
Product	argininosuccinate synthase
Protein accession	YP_411738
Protein GI	82702172
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATGTCG CTCAGATTAA AAAAGTAGTC CTGGCATTTT CCGGCGGTCT GGATACGTCG 
GTAATCCTGA AGTGGCTGCA GGATACCTAC CGGTGCGAAG TTGTCACCTT CACCGCTGAC 
ATTGGCCAGG GGGAGGAGGT GGAACCTGCC CGTGCAAAGG CGAAGCAGCT TGGCGTGAGG 
GAAATCTTCA TCGACGACTT GCGCGAAGAA TTCGTACGCG ATTTCGTCTT TCCCATGTTT 
CGGGCCAATA CCCTTTATGA AGGGGAGTAC CTGCTCGGCA CCAGCATCGC ACGCCCGCTG 
ATTGCCAAGC GCCAGATCGA AATCGCGCGA GAAACCGGTG CGGACGCCGT GTCGCACGGC 
GCGACCGGGA AAGGCAATGA TCAGGTGCGC TTTGAACTCG GTTACTATGC GCTTCAACCG 
GATATCCGGG TGATTGCGCC GTGGCGCGAA TGGGACCTTA CATCCCGGGA AAAGCTTCTG 
AAATACGCGG AGCAGCACGG CATCCCGGTG GAAATGAAGA AAAAGGAAGG CTCTCCCTAC 
AGTATGGATG CCAACCTTCT GCATATTTCG TATGAGGGAC GTATTCTCGA AGACCCTGCG 
CAGGAGCCGG AAGAGTCGAT GTGGCGGTGG AGTGTTTCGC CGGAAAAAGC TCCGGATAGT 
CCCGAATATC TCGACCTCGA ATTCAGGCAG GGCGATATCG TTGCATTGGA TGGGGAAGAG 
CTTTCGCCGG CGCGCCTGCT CGCCAGACTC AATGAACTGG GGGGCAAGCA CGGGATAGGG 
CGCCTGGATC TGGTCGAAAA CCGGTATGTC GGTATGAAGT CCCGCGGGTG CTACGAGACT 
CCCGGCGGCA CGATCATGCT GCGTGCCCAC CGGGCCATGG AGTCCATTAC ACTGGACCGT 
GAAGTCGCAC ATTTGAAAGA CGAGCTTATG CCACGCTATG CCGAACTGAT TTACAACGGC 
TATTGGTGGA GTCCCGAACG CAGAATGATG CAGACGATGA TCGATGCGTC ACAGGCGCAT 
GTGAACGGCT GGGTGCGGGT GAAGCTCTAC AAGGGTAATG TGATTGTCGT GGGGAGAGAC 
TCGAAAACAG ATTCGCTGTT TGATCCCCAT ATTGCAACCT TCGAGGATGA CCAGGGTGCG 
TACAATCAGA TGGATGCTGC CGGTTTCATC AAGTTGAATG CACTCAGGAT GCGGATTGCC 
GCCAATTTAA GAAATCGCAA ATAA

Protein sequence

MNVAQIKKVV LAFSGGLDTS VILKWLQDTY RCEVVTFTAD IGQGEEVEPA RAKAKQLGVR 
EIFIDDLREE FVRDFVFPMF RANTLYEGEY LLGTSIARPL IAKRQIEIAR ETGADAVSHG 
ATGKGNDQVR FELGYYALQP DIRVIAPWRE WDLTSREKLL KYAEQHGIPV EMKKKEGSPY 
SMDANLLHIS YEGRILEDPA QEPEESMWRW SVSPEKAPDS PEYLDLEFRQ GDIVALDGEE 
LSPARLLARL NELGGKHGIG RLDLVENRYV GMKSRGCYET PGGTIMLRAH RAMESITLDR 
EVAHLKDELM PRYAELIYNG YWWSPERRMM QTMIDASQAH VNGWVRVKLY KGNVIVVGRD 
SKTDSLFDPH IATFEDDQGA YNQMDAAGFI KLNALRMRIA ANLRNRK