Gene Daro_2984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_2984
Symbol	hisS
ID	3568518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3221828
End bp	3223117
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	60%
IMG OID	637681455
Product	histidyl-tRNA synthetase
Protein accession	YP_286184
Protein GI	71908597
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	65
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAAA CCTTGCAAGC CGTGCGCGGG ATGAATGATG TCCTGCCCGA CGAAGCTGAA 
TTCTGGGAAC TGTTTGAGGA CACCATCCGT TCTTGGCTGA AGGGCTACGG CTATCGTCCG 
ATCCGTATGC CGATCGTCGA GCCGACGCCG CTGTTCAAGC GTGCCATCGG TGAGGTGACC 
GATATCGTCG AGAAGGAAAT GTATTCCTTT GTCGATGGTT TGAACGGTGA GGCACTGACG 
CTGCGTCCAG AAGGTACCGC TGGCTGCGTG CGAGCCGTCA TCGAACACAA CCTGGCCGCA 
CGCCAGACGC AGCGGCTCTA CTACATTGGC CAGATGTTCC GACACGAGCG GCCACAAAAA 
GGGCGCTATC GCCAGTTCCA CCAGGTCGGT GTCGAGTCTT TTGGCATGGC CGGACCGGAC 
ATCGATGCCG AAATGATCCT GATGGGCGCA CGCCTGTGGG CCGATCTCGG CCTGGATGGC 
ATCGAACTGC AGCTCAACAG TCTTGGCCAG CCGGAAGAAC GGGCCCTGCA CCGTGCCGCG 
CTGATCACCT ATTTCGAGGA AAACGCCGAA CTGCTCGACG AGGATGCCAA ACGTCGCCTG 
CATACCAATC CGCTGCGTAT TCTTGATACC AAGAATCCGG CGATGCAGGA ACTGTGCGCT 
GCGGCCCCGA AACTGATCGA TTACCTCGGC GCCGAGTCGC TGGCGCATTT CGAGGGCGTC 
CAGCGCGTCC TGCGCGATGC CGGCGTGCCA TTCACGATCA ACCCGCGTCT AGTGCGTGGC 
CTCGACTATT ACAACCTGAC CGTCTTCGAA TGGGTGACCG ACAAACTCGG TGCCCAAGGC 
ACGGTCTGCG CTGGCGGCCG TTACGACGGA CTGGTCGAGC AACTGGGTGG CAAGCCAACG 
CCGGCCTGCG GTTTTGCCAT GGGGGTCGAG CGCCTGATCG CCTTGATCCG GGAATCAGGC 
GGCGAACCGG CGGCGCCGGC CCCTGACGTT TACCTTGTGC ATCAGGGTGA AGCGGCTGCC 
CGCCAGGCTT TCCGGGTTGC CGAAGGCCTG CGTGACCAGG GTATCAATGT ATTGCAGCAT 
TGCGGCGGCG GCAGCTTCAA GTCGCAGATG AAAAAGGCCG ACGGCAGCGG TGCGACCTTT 
GCTGTCATCA TTGGTGATGA CGAAGCGGCG ACCGGAGAGG CGCAACTGAA ATCGTTGCGT 
GCAGAAGGCT CGGCACAATT GAAACTGAAA GTCGATGATC TGGCCGAGGC CATCATCGGA 
CAACTGATTG ATTCGGACGA AGAGGAATAA

Protein sequence

MSQTLQAVRG MNDVLPDEAE FWELFEDTIR SWLKGYGYRP IRMPIVEPTP LFKRAIGEVT 
DIVEKEMYSF VDGLNGEALT LRPEGTAGCV RAVIEHNLAA RQTQRLYYIG QMFRHERPQK 
GRYRQFHQVG VESFGMAGPD IDAEMILMGA RLWADLGLDG IELQLNSLGQ PEERALHRAA 
LITYFEENAE LLDEDAKRRL HTNPLRILDT KNPAMQELCA AAPKLIDYLG AESLAHFEGV 
QRVLRDAGVP FTINPRLVRG LDYYNLTVFE WVTDKLGAQG TVCAGGRYDG LVEQLGGKPT 
PACGFAMGVE RLIALIRESG GEPAAPAPDV YLVHQGEAAA RQAFRVAEGL RDQGINVLQH 
CGGGSFKSQM KKADGSGATF AVIIGDDEAA TGEAQLKSLR AEGSAQLKLK VDDLAEAIIG 
QLIDSDEEE