Gene Nmul_A2376 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2376
Symbol	hisS
ID	3784967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2702469
End bp	2703728
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	59%
IMG OID	637812465
Product	histidyl-tRNA synthetase
Protein accession	YP_413057
Protein GI	82703491
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCACTA GGGGGATTCA GGCTGTACGC GGGATGAACG ACATCCTGCC CGATCAGATT 
GACCGGTGGG AGTTCTTCGA GCAAAGTGTC CGCGACTGGA TGGCGGCTTA TGGCTACCGC 
AATATCCGTA TGCCGATAGT CGAGCAGACC GACCTGTTTG TGCGTTCCAT CGGTGCGGTC 
ACAGATATCG TCGAGAAAGA GATGTACACC TTCGTGGATC ATCTCAACGG CGAGAGCCTG 
ACACTGCGGC CGGAAGGAAC CGCGTCCTGC GTGCGTGCGG TGCTTGAGCA TAATCTGCTC 
TATTCCGGCC CGCAACGGCT ATATTATTCG GGTGCGATGT TCCGCCACGA GCGTCCGCAA 
AAAGGACGTT ACCGGCAATT CCATCAGGTC GGCGCCGAAG CTCTGGGGTA TGGCGGACCC 
GACATCGATG CCGAGCTCAT CATCATGGGC GCCGACTTGT GGAAGCGGCT CGGCGTTTCC 
GGGGTGCGGC TCGAAATCGG GACGCTTGGC AGTGCGGAGT CGCGCTCGGT GCACCGTACC 
CGCCTGATCG ATTACCTGCA GCGGCATCTA TGCAAGCTGG ATGAAGATGC ATCCAGGCGC 
CTGCACAGCA ATCCCCTACG CATACTCGAC AGCAAGAATG CGGGGATGAG AGAGATTATC 
GAGGGCGCTC CGCGGTTACT GGATGACCTG GACGAGGACT CTCTCATTCA TTTTGAACGC 
TTGCAGCAAA TCCTGCGCGA GCAGGGGGTC GACTTCGAGA TCAACCCGCG GCTGGTACGG 
GGGCTGGATT ATTATAATCG CACCGTATTC GAGTGGGTTA CCGACAAGCT GGGGGCGCAG 
GGAACCGTCT GCGCAGGTGG ACGTTATGAC GGACTGGTAG AACAGGTTGG CGGCAAGGCT 
ACCCCCGCAT GCGGATTTGC CCTGGGCGTG GAACGAGTGC TGGCACTGGT GATGGACAGT 
ATCATCCCTC AGGCTCCTCC TGATGTCTAT GTGGTTCACA AGGGCGATGC CGCGGCCGGG 
TTTGCCTGGA AAACGGCAAG ACACTTGCGG GATCGTGGGT TCCAGGCAAT TCTGCATTGC 
GGAGAGGGCA GCTTCAAGGC GCAGATGAGA AAAGCCGACG CCAGCGGAGC GCGTTTTGCG 
ATCATCATCG GAGATGATGA AGCGCAAGCC GGCGAAATAA GCATCAAGCC GCTGCGGGAA 
GCGGCGGAGC AGGTCCGGGT AGGCCTTGCG GAAGCTGCCG ACCTGCTGAA AAGGGCCTGA

Protein sequence

MPTRGIQAVR GMNDILPDQI DRWEFFEQSV RDWMAAYGYR NIRMPIVEQT DLFVRSIGAV 
TDIVEKEMYT FVDHLNGESL TLRPEGTASC VRAVLEHNLL YSGPQRLYYS GAMFRHERPQ 
KGRYRQFHQV GAEALGYGGP DIDAELIIMG ADLWKRLGVS GVRLEIGTLG SAESRSVHRT 
RLIDYLQRHL CKLDEDASRR LHSNPLRILD SKNAGMREII EGAPRLLDDL DEDSLIHFER 
LQQILREQGV DFEINPRLVR GLDYYNRTVF EWVTDKLGAQ GTVCAGGRYD GLVEQVGGKA 
TPACGFALGV ERVLALVMDS IIPQAPPDVY VVHKGDAAAG FAWKTARHLR DRGFQAILHC 
GEGSFKAQMR KADASGARFA IIIGDDEAQA GEISIKPLRE AAEQVRVGLA EAADLLKRA