Gene Clim_0295 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0295
Symbol	hisS
ID	6353812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	331922
End bp	333214
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	53%
IMG OID	642667924
Product	histidyl-tRNA synthetase
Protein accession	YP_001942368
Protein GI	189345839
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.000190773
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGCACT ATCAGGTAGT CAAAGGCGCG AGAGATATTT TCCCCGATGA AATATTGCAA 
TGGAAACATG TCGAAGGGGT TATTCACAGG CTTGCCGCAC TATACGGTTT CAATGAAATC 
AGAACCCCGG TTTTTGAATA CACCGAGCTT TTTCAGCGCA GTATCGGTTC CTCCACCGAT 
ATTGTCGGTA AGGAGATGTT CTCTTTTCTG CCTGACCCCT CCGGGCGCTC GATCACCCTT 
CGTCCTGAAA TGACCGCAGG CGTTATGAGG GCTGCATTGC AGAAAAATCT GCTTGCGGCT 
GCTCCGGTGC AGAAGCTCTA CTATATCAGC GAACTTTTCC GCAAGGAACG GCCTCAGGCC 
GGCCGGCAAA GGCAGTTCTC CCAGTTTGGA GCGGAACTGC TCGGGGTCTC TTCTCCGGCA 
GCCGTAGCTG AAGTGATAAC GTTCATGATG CATGTTTTCG AAGATCTTGG TCTGCAGGGG 
CTGAAGCTCA GGATCAATAC TCTCGGCAAT ATGGACGACC GCAAACGCTA TCGGGATGCT 
CTCCGGAATT ATCTGGCGCC ATGTTATGAG CAGCTCGATG ATGCATCGAA AGAGCGCTTC 
GAGAAAAATC CGCTACGGAT ACTCGACTCG AAAAATCCGG AAATGCAGCA GATCGTGAAG 
GACGCTCCGA AACTGTACGA TTATCTGGGG CGCGAGGCTC TGGATGATTT TGAAAAAGTG 
CTTTTTTATC TTTCAGCCCG GGGGATACCC TTTCAGATCG ATCACAGACT GGTTCGGGGT 
CTCGACTATT ACAGCTACAC AGCATTCGAA GTGACCAGTT CGGCGCTTGG TGCACAGGAC 
GCTCTTGGCG GCGGGGGACG CTATGACTCG CTTGCCGTCG AGCTGGGGAG TTCCGGTGAA 
GTGCCTGCAT CCGGTTTTGC CGTCGGGATG GAACGACTCC TGATCGCCAT GCAGAAACAG 
GGTTTGTTTT CAGATCTCGA TGCTGCGGCG CCATCTGTTT TTGTTATCGT TCAGCAGGAG 
GAGCTTTTCG ATCAGGCGCT TGAGATAGTC ACCACTCTTC GCCGGGCGGG TATCAGTGCG 
GTGATCGATC TTGCCGGGCG AAGCATGAAA GCCCAATTGC GGGAAGCGAA CAGGATGAAT 
GCTGCAAACG CTCTTTTTGT AGGCAGCGAT GAGCTCGCAT CGGGAAAATG CACGATGAAA 
GATCTCCGGT CGTCACTGCA GGATGAGTAT TTCCTTGAAG AGATAATCGA CAAGTTCCGG 
AAGCCCGAAC CGCTTAACCG GTTACGTTCA TGA

Protein sequence

MPHYQVVKGA RDIFPDEILQ WKHVEGVIHR LAALYGFNEI RTPVFEYTEL FQRSIGSSTD 
IVGKEMFSFL PDPSGRSITL RPEMTAGVMR AALQKNLLAA APVQKLYYIS ELFRKERPQA 
GRQRQFSQFG AELLGVSSPA AVAEVITFMM HVFEDLGLQG LKLRINTLGN MDDRKRYRDA 
LRNYLAPCYE QLDDASKERF EKNPLRILDS KNPEMQQIVK DAPKLYDYLG REALDDFEKV 
LFYLSARGIP FQIDHRLVRG LDYYSYTAFE VTSSALGAQD ALGGGGRYDS LAVELGSSGE 
VPASGFAVGM ERLLIAMQKQ GLFSDLDAAA PSVFVIVQQE ELFDQALEIV TTLRRAGISA 
VIDLAGRSMK AQLREANRMN AANALFVGSD ELASGKCTMK DLRSSLQDEY FLEEIIDKFR 
KPEPLNRLRS