Gene Cphamn1_0397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_0397
Symbol	hisS
ID	6374059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	+
Start bp	421919
End bp	423223
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	50%
IMG OID	642682914
Product	histidyl-tRNA synthetase
Protein accession	YP_001958843
Protein GI	189499373
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00425435
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.748396
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGAGT ACAGGGCGGT AAAGGGAACA AAAGATATCT TTCCTGATGA GATCACCTCA 
TGGAAATATA TTGAGGGTGT CATTCACAGA GTTGTCGGGC TCTATGGCTT TCAGGAAATC 
CGCACACCCG TATTTGAATA TACAGATCTG TTTCAACGCA GTATCGGCTC AACAACCGAC 
ATTGTGGGCA AAGAGATGTT TTCCTTCAGA CCTGAGCCTG ACGGCCGTTC GGTGACTTTA 
CGTCCCGAAA TGACGGCTGG TGTCATGCGT GCGTTTCTCC AGGCGAATCT TTCTTCTGCT 
TCTCCGGTTC ATAAGCTGTA TTACATAGCA GAACTGTTTC GAAAGGAACG CCCTCAGGCA 
GGGCGCCAGC GTCAGTTTTC ACAATTCGGG GCTGAAATGC TGGGAGCTTC CTCCCCTGAG 
GCTGTCGCTG AAGTGATAGA TATGATGATG CAGGTGTTTA CCTCTCTGGG GGTATCCGGG 
CTCAGGCTGA GGATTAACAC GCTTGGTGAT CTGGATGATC GGGTTCGATA CAGAGATGCA 
TTGCGAGCCT ATCTTGAACC CCATAGCGGG CTTCTTGACG CGCCGTCAAG AGAGCGTCTT 
GAAAAAAACC CTCTTCGTAT TCTGGATTCA AAAAATCCCG ATATACAGTC AGTCATTGCC 
GATGCTCCGA AACTGCATGA TTTTCTCAAT CCTTCTGCAA GAGCGGAGTT TGATCAGGTC 
TTGCTCTATC TCGATCAGAA ATCCATAGAG TATGTTATCG ATCCTTTGCT TGTCAGGGGA 
TTGGATTATT ACTGTCATAC AGCGTTTGAA GTTGTCAGCC CTGAGCTTGG AGCACAGGAT 
GCAATTGGAG GGGGCGGTCG TTATGACGGT CTTGCAAGAG AACTTGGCAG TAAATCCGAT 
ATTCCTGCTG TCGGTTTTGC CGTTGGTATG GAGCGGTTAT TGATTACCAT GGAAAAGCAG 
GGATTGCTTC GGCATATCGT GCCGTCAGGT CCCCGGGTCT ATATTGTACT CCAGAATGAG 
GAGCTGAAAA CCCATGCTCT CTCTGCCTGT GACCTGTTGC GAAGATCAGG GATACGAACT 
GAAATGGATC TTTGCGGAAG GAGCATGAAG GCGCAGATGC GCGAGGCCAA CAGGCAGCAT 
GCCGACTATG CTCTGTTTGT AGGGAAGAGC GAGGTGGAGT CGCAAGCCTA TGGGTTAAAA 
AATCTCAGGA CATCCGAACA GGATTTTCTC TCCATCCGGG AGATGATCGC AAGGCTTGCT 
TCATCAACGA AGCACGTTGA AGTCCCGGAT GGCGGCCCCG ATTGA

Protein sequence

MSEYRAVKGT KDIFPDEITS WKYIEGVIHR VVGLYGFQEI RTPVFEYTDL FQRSIGSTTD 
IVGKEMFSFR PEPDGRSVTL RPEMTAGVMR AFLQANLSSA SPVHKLYYIA ELFRKERPQA 
GRQRQFSQFG AEMLGASSPE AVAEVIDMMM QVFTSLGVSG LRLRINTLGD LDDRVRYRDA 
LRAYLEPHSG LLDAPSRERL EKNPLRILDS KNPDIQSVIA DAPKLHDFLN PSARAEFDQV 
LLYLDQKSIE YVIDPLLVRG LDYYCHTAFE VVSPELGAQD AIGGGGRYDG LARELGSKSD 
IPAVGFAVGM ERLLITMEKQ GLLRHIVPSG PRVYIVLQNE ELKTHALSAC DLLRRSGIRT 
EMDLCGRSMK AQMREANRQH ADYALFVGKS EVESQAYGLK NLRTSEQDFL SIREMIARLA 
SSTKHVEVPD GGPD