Gene Cpha266_0364 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_0364
Symbol	hisS
ID	4569342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	407766
End bp	409055
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	50%
IMG OID	639764962
Product	histidyl-tRNA synthetase
Protein accession	YP_910847
Protein GI	119356203
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00780967
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCAGT ATCAGGTTGT CAAGGGTGCC AGGGATATTT TTCCGGATGA AATAGTCCGC 
TGGCACTATG TCGAGGACGT TGTTCATCGT CTTGCGTCTC TTTATGGATA TAGTGAAATT 
CGTACTCCTG TTTTTGAATA TACGGAGCTT TTTCAACGTA GTATCGGGAC TACAACGGAT 
ATTGTGGGCA AGGAGATGTT TTCCTTTCTT CCGGATCCTC AGGGTCGATC CATTACCTTG 
CGTCCAGAGA TGACTGCGGG AGTTATGCGG GCGGTTTTGC AGAAAAATCT GCTTTCGACG 
GCACCGATAC ACAAGCTTTT TTATCTTTCA GAGCTTTTTC GAAAAGAGCG TCCGCAGGCC 
GGACGCCAGC GACAGTTTTC ACAGTTTGGC GCCGAATTGC TCGGGGTTTC CTCGCCTGCT 
GCCGTTGCCG AGGTCATAAC CTTTATGATG CAGGTGTTCG AAACTCTCGG AATACGAGGT 
TTGAAGCTTC GGATCAATAC CCTTGGCGAC AGCAGCGATC GAGCAAGGTA TCGCGAAATA 
CTCAGAGCGT ATCTCGCGCC TTTTTATGAC AGGCTTGATC TGGCATCCCG GGAGCGGTTT 
GAAAAAAATC CTCTGAGAAT TCTCGATTCG AAAAATCCTG ATATGCAGGA GATCATTGAA 
GGAGCTCCAA CGCTGCATGA TTCTCTTTCT CATGAAGCTT TGGAAGATTT TGAGAAAGTG 
CGTTTCTATC TTGACAGTCG GAGTATAGCT TACGATATTG ACTATCGTCT TGTTCGCGGC 
CTCGATTACT ACTGCCATAC CGCATTTGAG GTGACCAGTC CGGAACTTGG TGCACAGGAT 
GCTATTGGCG GGGGAGGCAG ATATGACGGT CTTGCGAAAG AGTTGGGAAG TTCCGGAGAT 
GTTCCTGCAT CAGGTTTTGC CGCAGGGATG GAAAGAGTGC TGATCACGAT GGAAAAGCAG 
GGTTTATTCG CCGCCCTGCG TCCTTCTGGT CCGAAGGTCT ATGTTGTTGC CCAGCAGCAC 
GCCCTGCTTG ACCATGCCTT GCAGGTGGCT TATCGTTTGA GGCGCGAGGG GATCAGCACT 
GAAGTTGATC TTGCCGGAAG AAGCATGAAA GCCCAGATGA GAGATGCCAA CAGGATGCGC 
GCCTGCTTTG CGCTTTTTAT CGGCGAAGAT GAGGTGGTTT CCGGCTCGTA TGCGCTGAAA 
AATCTTGTTA CTGCCGACCA GACGGCACAA TCGATTGAAA CCATTATTGA AATGCTCAAT 
CAATATTCGG GAGCGGAGCA GGGATCATGA

Protein sequence

MSQYQVVKGA RDIFPDEIVR WHYVEDVVHR LASLYGYSEI RTPVFEYTEL FQRSIGTTTD 
IVGKEMFSFL PDPQGRSITL RPEMTAGVMR AVLQKNLLST APIHKLFYLS ELFRKERPQA 
GRQRQFSQFG AELLGVSSPA AVAEVITFMM QVFETLGIRG LKLRINTLGD SSDRARYREI 
LRAYLAPFYD RLDLASRERF EKNPLRILDS KNPDMQEIIE GAPTLHDSLS HEALEDFEKV 
RFYLDSRSIA YDIDYRLVRG LDYYCHTAFE VTSPELGAQD AIGGGGRYDG LAKELGSSGD 
VPASGFAAGM ERVLITMEKQ GLFAALRPSG PKVYVVAQQH ALLDHALQVA YRLRREGIST 
EVDLAGRSMK AQMRDANRMR ACFALFIGED EVVSGSYALK NLVTADQTAQ SIETIIEMLN 
QYSGAEQGS