Gene Cag_1467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1467
Symbol	hisS
ID	3746436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1932884
End bp	1934161
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	48%
IMG OID	637774001
Product	histidyl-tRNA synthetase
Protein accession	YP_379766
Protein GI	78189428
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.162943
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAGTT TTCAGTGCGT AAAAGGTACT CGCGATATTT TGCCCGACGA GAGCCTTCTT 
TGGTCGTTTG TGTCATCCCA TTTTCATCAT GTAGCGTCGC TTTACGGATT TCGTGAAATT 
CGAACGCCAA TGTTTGAATA CACCGATCTG TTCCAGCGAG GTATTGGTGC CACCACCGAT 
ATTGTGGGCA AGGAGATGTT TTCATTTCAG CCCGATCCAG CAGGGCGCTC TATAACGCTT 
CGTCCTGAAA TGACGGCAGG CGTTATGCGT GCTGCTCTGC AAAACAATTT GTTGGCACAA 
GCTCCTCTCC ACAAGCTTTT TTATATAGGG GAACTGTTTC GCAAAGAGCG TCCACAAGCA 
GGACGCCAAC GGCAGTTTAA CCAATGTGGC GCTGAGCTGC TTGGTGTTTC ATCGCCTGCG 
GCAGTAGCTG AGGTGATGTC GCTGATGATG CACTTTTTTG GCGCACTTGG CTTAACGGGT 
TTAACGCTCA AGGTTAATAC GCTTGGCAAT GCCGAAGAGC GACTTGCTTA TCGTGAAGCC 
TTGCAAGCCT ACTTTGCACC TCATCGCGCA ATGCTTGATG CATCATCGCA AGAGCGGCTC 
GAAAAAAATC CTTTGCGTAT TCTTGATTCT AAAAATCCTG CTTTACAAGA GCTGATTGCG 
GCTGCTCCTC GTTTGTACGA TTATTTGCAA GAGGCGTCGT TGCGTGATTT TGAAAAGGTG 
CTTTTTTATT TAACCGAGCG AAGAATTTCT TACACGATTG ATTACCGCTT AGTGCGCGGT 
CTTGATTATT ACTGCCATAC TGCGTTTGAA GTTACCAGCA ATGAGCTTGG TGCACAAGAT 
GCCATTGGCG GTGGTGGTCG TTACGATGCG TTAGCGCGTG AGCTTGGCAG TGCAACTGAT 
ATTCCAGCCG TTGGTTTTGC TGTTGGCATG GAGCGGTTGC TTATTGTGTT GGAAAAGCAA 
GGATTGCTGG GTAATCGCCA TGCGCGTCCA CCTCGCTTGT ATGTGGTGGT TCAGCAGCAA 
GAGATGCTCG ATCACGCTTT GCAGCTTGTG TGGCGTTTGC GCAACGGTGG TATTCGTAGT 
GAGCTTGATT TAGCGGGACG TAGCATGAAA GCGCAAATGC GTGAAGCCAA TAAGCTTGGC 
GCTCTGTATG CGCTTTTTGT AGGTGCTTCG GAATGTGCAA GTGGCAAATA TGGCTTAAAA 
AATCTTGCAA CATCGGAGCA AACCGATCTC TCCATAGAGG CAGTTATGCA GTTGCTGCAC 
GATCATGTAA CCGAGTAA

Protein sequence

MSSFQCVKGT RDILPDESLL WSFVSSHFHH VASLYGFREI RTPMFEYTDL FQRGIGATTD 
IVGKEMFSFQ PDPAGRSITL RPEMTAGVMR AALQNNLLAQ APLHKLFYIG ELFRKERPQA 
GRQRQFNQCG AELLGVSSPA AVAEVMSLMM HFFGALGLTG LTLKVNTLGN AEERLAYREA 
LQAYFAPHRA MLDASSQERL EKNPLRILDS KNPALQELIA AAPRLYDYLQ EASLRDFEKV 
LFYLTERRIS YTIDYRLVRG LDYYCHTAFE VTSNELGAQD AIGGGGRYDA LARELGSATD 
IPAVGFAVGM ERLLIVLEKQ GLLGNRHARP PRLYVVVQQQ EMLDHALQLV WRLRNGGIRS 
ELDLAGRSMK AQMREANKLG ALYALFVGAS ECASGKYGLK NLATSEQTDL SIEAVMQLLH 
DHVTE