Gene Achl_2023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_2023
Symbol	hisS
ID	7293484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	2281149
End bp	2282522
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	66%
IMG OID	643590427
Product	histidyl-tRNA synthetase
Protein accession	YP_002488086
Protein GI	220912777
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.00000000257055
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCACGCA CCGCCTCCCT GTCCGGATTC CCCGAGTGGC TTCCCGAGGA GCGGCTGGTG 
GAGATTCATG TCCTGGATAC CCTGCGCCGG GTCTTCGAAC TGCACGGTTT CGCCTCCATT 
GAGACGCGCT CGGTGGAAAC AGTGGGACAG CTGCTGCGCA AGGGCGAGAT CGACAAGGAA 
GTGTACGGAC TCAGCCGCCT GCAGGAGGAC GAGGGCGAGA ACCCGGTCAA AGGCGGCAAA 
GCGGACCCGC ACGCGCTTGC CCTGCACTTT GACCTCACGG TTCCCTTCGC CCGCTACGTC 
GTCGAGAATG CCGGCTACCT GGCCTTCCCG TTCCGGCGCT ACCAGATACA GAAAGTCTGG 
CGCGGCGAAC GCCCCCAGGA AGGCCGCGCC CGTGAATTCA CCCAGGCGGA TATTGACGTC 
GTCGGCGATG GCGAGTTGCC GTTCCGCTAT GACGTTGAGA TCGCCCTGGT CATCGCCGAG 
GCACTCAGCG CGCTTCCCAT CCCGGACTTC CAGCTGCGGG TCAACAACCG CAAACTGGCA 
GAGGGCTTCT ACCAGGGCAT CGGACTGACG GACACCGCAG GGGTCCTGCG CAGCATCGAC 
AAACTGGAAA AAATCGGTCC GGCCAAGGTT GCCGAACTCC TGAAATCCGA ACTTGGTGCC 
ACCGACGAGC AGGCACAGAA GGCCCTGCAG CTTGCCGGTA TCCGCACCGG GGACCTGTCC 
TTCGTGGCCC AGGTCCGTGC CCTCGGCGTC AGCAACGACC TGCTCGAGGA GGGCCTTAGC 
GAGCTGGAGC AGGTCATCGA CGCCGCCGTC CAGCGGGCTC CCGGCAAGGT GCTGGCGGAC 
CTCAGTATTG CCCGCGGACT GGACTACTAC ACGGGCACCG TGGTGGAGAC CGTCCTGTTG 
GGTCATGAAC AGCTGGGTTC CATCTGCTCC GGCGGAAGGT ATGACGCCCT GGCCTCCAAG 
GGCAACCGGA AGTTCCCCGG CGTCGGCCTG TCCATCGGTG TGACCCGGCT GGTGTCCCGG 
ATCTTGAGCC AGGAGCTGGC CAAAGCCTCC CGTTCCGTTC CCACCGCCGT GCTGGTGGCC 
CTGTCGCACG ACGACAGCTG GGGCGCTGCG CAGGACGTCG CCGCCCAGTT GCGCAGCCGG 
GGGATTCCCA CCGAGGTCGC CGCCAAAGCG GAAAAGTTCG GCAAGCAGAT CAAGTTCGCC 
GACCGCCGGG GCATCCCGTT CGTCTGGTTC ACGGACGACG ACGGCACGCA CCAGGTCAAG 
GACATCCGGT CCGGTGAACA GGTGGTCGCT GCCCCGGAGA CGTGGATGCC GCCGGCCGCC 
GACCTCGTGG TACAGGTGGC CACCGCCGGC CCCGTTCCCG CCCAGGTCTC CTGA

Protein sequence

MARTASLSGF PEWLPEERLV EIHVLDTLRR VFELHGFASI ETRSVETVGQ LLRKGEIDKE 
VYGLSRLQED EGENPVKGGK ADPHALALHF DLTVPFARYV VENAGYLAFP FRRYQIQKVW 
RGERPQEGRA REFTQADIDV VGDGELPFRY DVEIALVIAE ALSALPIPDF QLRVNNRKLA 
EGFYQGIGLT DTAGVLRSID KLEKIGPAKV AELLKSELGA TDEQAQKALQ LAGIRTGDLS 
FVAQVRALGV SNDLLEEGLS ELEQVIDAAV QRAPGKVLAD LSIARGLDYY TGTVVETVLL 
GHEQLGSICS GGRYDALASK GNRKFPGVGL SIGVTRLVSR ILSQELAKAS RSVPTAVLVA 
LSHDDSWGAA QDVAAQLRSR GIPTEVAAKA EKFGKQIKFA DRRGIPFVWF TDDDGTHQVK 
DIRSGEQVVA APETWMPPAA DLVVQVATAG PVPAQVS