Gene Nmul_A2456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2456
Symbol	argS
ID	3786413
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2805737
End bp	2807533
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	55%
IMG OID	637812547
Product	arginyl-tRNA synthetase
Protein accession	YP_413137
Protein GI	82703571
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0018] Arginyl-tRNA synthetase
TIGRFAM ID	[TIGR00456] arginyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCCGGAG CCCGTTATAA TAGCGGCTGT GTAACAGCCG AGAAGGTTGT CGTGATTCCC 
CCTGTTCAGC CTGACTTCAA ATCCCACTTT ACCGATATCC TGCGCAATGC CCTGAATGAG 
AGGGGATTGG CGGACCTGAA TCTGGATATA GAATTTGCCC GGCCGCGGCA GTCAAGTCAC 
GGCGATTATT CCTGCAACCT GGCGATGCAA CTGGCCAAGC CATTGCGTCA AAAGCCGCGC 
GACATTGCGC AATCTCTTGC CACCGCATTC TCCGCATCCC CTTATCTGGA AAAAGTGGAA 
ATTGCAGGCG CGGGTTTTAT CAACCTGTTT CTCACCACCT CGGCCAAGCA GCAGTTTTCG 
CGATATGTGC TGGAGAGCGG TGAGAAGTTC GGTCACAGCA GCATGGGGGC AGGGGAAAAA 
ATCCAGGTTG AATTCGTTTC AGCCAATCCC ACGGGCCCGT TGCATGTGGG ACACGGCAGA 
GGCGCGGCAT TTGGCGCAAG CCTTGCCAAC GTGCTCGCCG CCGCAGGCTA TTCGGTGACG 
CGCGAGTATT ACATTAACGA CGCCGGCCGC CAGATGGATA TTCTGGCGCT TTCCACTTGG 
CTGCGCTACC TGGAACTGAA CGGCGTCGCC TCAGCTTTTC CGCCCAATGC CTATCAGGGG 
GAGTATGTGC GCGACATGGC AAGGCTGATT CATAAAGCCC ATGCCGGACG CTATGTGCAT 
GAGCCGGAAC TGCTGTTTGA TCGCGTTGCC GGAGCGGAAG CGGACACGGA GGCTGCCCTT 
GATGGATTGA TTGCCAACGC GAAAAAGCTG CTGGGGCAGG ATTATGCCTA CATCCATAAC 
TTCGTTCTGA ATGAGCAATT GGGGGATTGC CGCAACGATC TGATGGAATT CGGCGTCACC 
TTCGACATCT GGTTTTCCGA GCAATCCTTA TTCGACAGCG GAGGGGTGGC CCAGGCTGTT 
CACCTGCTCG AAGAAGGCAA TTACCTGTAT CAGCAGGATG GCGCCAAATG GTTCCGCTCC 
AGTCATTTCG GTGACGAAAA GGATAGGGTG GTGCAGCGCG AAAACGGGCA GTTCACCTAT 
TTTGCCTCTG ATATTGCCTA TCACCTCAAC AAATTCTCAC GCGGATTCGA CCGCGTGATC 
GATATCTGGG GCGCGGACCA TCACGGCTAC ATTTCCCGGG TGAAAGGCGC CATGCAGGCA 
TTGGCGCTCG ATCCCGAGAA ACTTGAAATT GCTCTGGTGC AGTTTGCCGT GCTTTACCGT 
GATGGCAAGA AGGTGCCGAT GTCCACCCGG GCGGGAGAAT TTGTCACCTT GCGGGAGTTG 
CGTCAGGAAG TGGGAACCGA TGCGGCGCGC TTTTTTTACG TATTACGCAA GAGCGATCAG 
CATCTCGATT TCGACCTGGA CTTGGCAAAG TCGCAAAGCA CCGATAACCC GGTGTATTAC 
GTGCAATATG CGCATGCAAG GGTTTGCAGC GTGCTGGAAC AGTGGGGGGA AGACCCAGGC 
ATGCTGGTTA CAGCCGACAC TTCTGCATTA ACCGGCGCTG CGGAACTCTC CCTGTTGCAG 
AAGCTGATCG ACTATCCCGA AACGGTCGAA GCCGCAGCGA GGGAATTCTC TCCCCACCTG 
ATTGCCTTTT ACTTGAAGGA ACTGGCAGGG GAGTTCCACA GTTACTATAA TTCTACTCGT 
TTCCTGGTGC CGGAGATGAC GGTCCGCCTT GCAAGATTGG CGCTTGTGGC GGCGGTCAGA 
CAGGTATTGA ATAACGGTCT TAAACTATTG GGCGTGAGCG CGCCAGCTAA AATGTGA

Protein sequence

MAGARYNSGC VTAEKVVVIP PVQPDFKSHF TDILRNALNE RGLADLNLDI EFARPRQSSH 
GDYSCNLAMQ LAKPLRQKPR DIAQSLATAF SASPYLEKVE IAGAGFINLF LTTSAKQQFS 
RYVLESGEKF GHSSMGAGEK IQVEFVSANP TGPLHVGHGR GAAFGASLAN VLAAAGYSVT 
REYYINDAGR QMDILALSTW LRYLELNGVA SAFPPNAYQG EYVRDMARLI HKAHAGRYVH 
EPELLFDRVA GAEADTEAAL DGLIANAKKL LGQDYAYIHN FVLNEQLGDC RNDLMEFGVT 
FDIWFSEQSL FDSGGVAQAV HLLEEGNYLY QQDGAKWFRS SHFGDEKDRV VQRENGQFTY 
FASDIAYHLN KFSRGFDRVI DIWGADHHGY ISRVKGAMQA LALDPEKLEI ALVQFAVLYR 
DGKKVPMSTR AGEFVTLREL RQEVGTDAAR FFYVLRKSDQ HLDFDLDLAK SQSTDNPVYY 
VQYAHARVCS VLEQWGEDPG MLVTADTSAL TGAAELSLLQ KLIDYPETVE AAAREFSPHL 
IAFYLKELAG EFHSYYNSTR FLVPEMTVRL ARLALVAAVR QVLNNGLKLL GVSAPAKM