Gene Cagg_0287 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0287
Symbol
ID	7267468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	357112
End bp	358431
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	58%
IMG OID	643565157
Product	histidyl-tRNA synthetase
Protein accession	YP_002461671
Protein GI	219847238
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGTTA TTCAAAACGT GAAAGGAATG CGCGATCATC TGCCGACAGA TATGATGCTG 
CGGCAGTATA TCGTCAGTAC GCTTACCAGT ATCAGTGAAG CACACGGCTT CGAGCCTTTA 
CAAACCCCGA TTATCGAGTA TGCCGAAACG CTTGAGGGTA AGCTTGGCGA GGATGAAAAG 
CTGATTTACC GCTTTGAAGA TCATGGTGGG CGTCGGCTGG CGTTACGCTA CGATCAGACC 
GTACCGCTTG CCCGTGTGAC TGCCCAATAT GCCGGACAGT TGACATTACC CTGGCGTCGC 
TATGCCTACG GGCCAAGCTA TCGGGGTGAA CGGCCCGCGC GCGGACGCTA CCGTGAGTTC 
TACCAGTTCG ATATCGATAT CGTTGGTAGT GCCTCGCCGT TGGCCGATGC CGAGATTGTC 
GCAATGCTGT GTGAAGCGCT TTCGGCACTC GGCTTTCCTG ACTTTGTGAC CCTGCTCAAT 
CACCGCCAGA TTATCGGTGG GATTGCGCGC GTCAGTGGTC TCTCAGAGGA AGCTGCCGGT 
GGGGTCTATC GCGCCATTGA TAAGTTCGAC AAGATCGGTG TCGCCGGCGT CCGTAACGAG 
TTGCTGAAAG CAGGCGTCGA TACCGGTGCT GCCGATCGGA TTCTCGAACT CGTGCAGATC 
GACGGCTCCG CCGACGAGGT ACTCGCGGCA CTCGCCCAAC GTCTCGCCGA CGACGAGCGG 
GCGGTCGCTG CGATTGCCAA TCTGCGTTCA ATCCTTGACA GTTTGGCTGC GATGGGGGTG 
CCGACCGATC AATACCGCGT TGCGCCACGT CTCGCCCGGG GTCTCTCATA CTATACCGGT 
GCCGTTTTTG AGGCAATCAC CCCGCACTGG CCAGAAGGTT CACTGCTCGG TGGTGGTCGG 
TATGACGATC TGATCGGTCT GTTCGCCGGA CGTAACATCC CCACGGTAGG CCTTGCGTTC 
GGTATCGACC GTCTCCACGA TGTGATGCTC GAACTCAACC TTGGCCCACG CCCGCGCACA 
ACTGCGGTCG CGTATGTCAC CCTGTTTAGT GGAGATTACG TCGCAGCCAG CCTCGCTTTG 
GCCGCCGAAC TGCGCGCTGC CGGAATACAT ACGCTCATCG CACTCGAACC GGGCAACCTT 
GGTAAGCAAT TCAAAGAAGC CGATCGCCGT GGGGTTCGCT TTGCTCTCGT CCTTGGTCCC 
GATGAGCTAG CACGTGACGA AGTGGTGGTG AAAGATCTCC AGCGTGGTGA GCAACGTTCA 
CTCCCACGTG CCGCCGTTGC CGGTTTGCTG GCCGAAGCAC TTACAGAACA GGCGCGCTAA

Protein sequence

MAVIQNVKGM RDHLPTDMML RQYIVSTLTS ISEAHGFEPL QTPIIEYAET LEGKLGEDEK 
LIYRFEDHGG RRLALRYDQT VPLARVTAQY AGQLTLPWRR YAYGPSYRGE RPARGRYREF 
YQFDIDIVGS ASPLADAEIV AMLCEALSAL GFPDFVTLLN HRQIIGGIAR VSGLSEEAAG 
GVYRAIDKFD KIGVAGVRNE LLKAGVDTGA ADRILELVQI DGSADEVLAA LAQRLADDER 
AVAAIANLRS ILDSLAAMGV PTDQYRVAPR LARGLSYYTG AVFEAITPHW PEGSLLGGGR 
YDDLIGLFAG RNIPTVGLAF GIDRLHDVML ELNLGPRPRT TAVAYVTLFS GDYVAASLAL 
AAELRAAGIH TLIALEPGNL GKQFKEADRR GVRFALVLGP DELARDEVVV KDLQRGEQRS 
LPRAAVAGLL AEALTEQAR