Gene Nmul_A0216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0216
Symbol
ID	3784593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	230469
End bp	231764
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	54%
IMG OID	637810288
Product	glutamate--cysteine ligase GshA
Protein accession	YP_410916
Protein GI	82701350
COG category
COG ID
TIGRFAM ID	[TIGR02049] glutamate--cysteine ligase, T. ferrooxidans family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTACGC CCCACCTTGA TACTGCCTTG AGCGGCCCCA TTCTTGATCT TGAAAGATGC 
ATCCTCAATG CCATGCCTTC GATCGAGCAA TGGTTGCGCA ATGAATGGCA GACGCATGCT 
GCGCCTTTTT ACTGCTCCGT GGATTTGCGC AATAGCGGGT TCAAGCTGGC GCCCGTCGAT 
ACCAACCTGT TTCCAGGCGG CTTCAATAAT CTAAACCGCG AATTCATGCC CTTGTGCGTC 
CAGGCGATGA TGGCGGCAAT CGATAAAATC TGTACCGGCG CGCGCAGCGT ACTGCTGATT 
CCGGAAAGCC ACACGCGCAA TATTTTTTAT TTGCAAAATC TGGCGGCCTT GCACGCAATC 
ATGCGGCATG CCGGCATTCA TGTCCGTATC GGAACGCTGC TCCCTGAGAT CACCGCACCC 
ACTGCGCTCG ACCTGCCCGG TGGAAACAAG CTCACGCTCG AACCCATTCA GCGGAAGGGC 
AATCGGGTCG TTCTGGAAGA TTTCGATCCT TGCGTCGTGC TTCTCAATAA CGACCTTTCC 
ACCGGCACCC CGGCCGTCCT GCAGAATCTC GAGCAGACGG TCATTCCTCC CCTGCATGCG 
GGATGGACCA GCCGGCGGAA ATCCCATCAT TTCACTGCCT ATGATAACGT TTCGCAGCAG 
TTTGCGAGCC TGATCGGTAT TGACCCGTGG CTTATCAATC CTTATTTCGC TTCCTGCGGA 
AAAATCAATT TTCGCGAGAA AAAGGGTGAA GACTGCGTGG CCAATACGGT GGATGAAATC 
CTGCACCAGA TCCGGGAGAA ATATGCCGAG TATGGAGTCA GGAAAGATCC CTTCGTGATC 
GTAAAGGCCG ACGCCGGTAC GTACGGAATG GGGATAATGA CTGTAAAAGA TGGCGCGCAA 
GTACGTACAC TCAGCCGGAA ACAGCGCAAC AAGATGGCGG TCGTAAAAGA AGGATTGGAG 
GTGACCGACA TCATGGTGCA GGAAGGGGTT TATACGTTTG AGAATGTCGA CGATGCGGTG 
GCGGAGCCCG TCATCTATAT GATCGATCGC TATGTCGTCG GTGGTTTCTA CCGGGTGCAT 
ACCGAGCGGG GCGTTGACGA GAATCTCAAC GCCCCCGGTA TGCATTTTGT ACCCCTGGCA 
TTCGAAGATA CCTGTCTGCT ACCGGATCGG GAAGCGCAGC CGGGTTGCAG CGCCAACCGG 
TTTTATGCTT ATGGCGTCAT AGCCAGGCTC GCTTTACTGG CGGCTGCACA AGAACTGGAA 
AAAAGTGAGG CGAGAATCGA AGCGATCATG GCTTAG

Protein sequence

MPTPHLDTAL SGPILDLERC ILNAMPSIEQ WLRNEWQTHA APFYCSVDLR NSGFKLAPVD 
TNLFPGGFNN LNREFMPLCV QAMMAAIDKI CTGARSVLLI PESHTRNIFY LQNLAALHAI 
MRHAGIHVRI GTLLPEITAP TALDLPGGNK LTLEPIQRKG NRVVLEDFDP CVVLLNNDLS 
TGTPAVLQNL EQTVIPPLHA GWTSRRKSHH FTAYDNVSQQ FASLIGIDPW LINPYFASCG 
KINFREKKGE DCVANTVDEI LHQIREKYAE YGVRKDPFVI VKADAGTYGM GIMTVKDGAQ 
VRTLSRKQRN KMAVVKEGLE VTDIMVQEGV YTFENVDDAV AEPVIYMIDR YVVGGFYRVH 
TERGVDENLN APGMHFVPLA FEDTCLLPDR EAQPGCSANR FYAYGVIARL ALLAAAQELE 
KSEARIEAIM A