Gene Rcas_0121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0121
Symbol
ID	5537581
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	143241
End bp	144605
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	61%
IMG OID	640892286
Product	histidyl-tRNA synthetase
Protein accession	YP_001430275
Protein GI	156740146
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0124] Histidyl-tRNA synthetase
TIGRFAM ID	[TIGR00442] histidyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAGCC GGGTTCAGAA CATTCGAGGC ATGCGCGATC ACCTGCCATC CGCCATGATC 
CTGCGGCAGC ACATTATTAA CACGCTGACT TCCGTTTTTG AGCGTTATGG TTTTGAGCCG 
TTGCAGACGC CAATTGTCGA ATATGCCGAA ACGCTCGACG GCAAAATCGG CGATGATGAG 
AAGTTGATCT ATCGTTTCGA GGATCACGGC GGGCGGAAGG TGGCGTTGCG CTACGATCAG 
ACGGTGCCGC TGGCACGGGT TGTCGCGCAG TATCAGGGGC AACTCACGTT TCCATGGCGG 
CGTTATGCCA TTGGTCAGAG TTATCGCGGT GAACGTCCTG GTCGTGGCCG CTACCGCGAG 
TTGTGGCAGG CTGATATCGA TATCGTCGGA TCGGCGTCGC CGGTGGCGGA CGCCGAGATT 
CTTGCAGTGT TGACCGATGC GCTGACCGCG CTTGGATTCA CCGGTTTTAC GACCCTCATC 
AGCCATCGTC AGGTTCTTGG CGGCATCGCG CGCGTTTCTG GTCTTGATGA TGCATCCGCC 
GGCAATGTCT ACCGCGCCAT CGACAAACTC GACAAGATTG GCATTGATGG CGTGCGCAAC 
GAATTGTTGC AGAGCGGCGT GACGCCTGAC GCCGCTGAGC GCATTCTGGC GCTGATCGAT 
CTGTATGGCA GCGCGGACGA TGTGCTGAAT GAACTGGCGC AGCGGTTGCA CGACGACGAG 
CGGGCGCAAC AGGCAATCGA CAATCTGCGC GCGATCATCG GCTATGCGCG CGCTATGGGC 
GTGCCTGAGG AGCGGATCGC GATCGCACCG CGCCTGGCGC GCGGGTTGTC GTACTACACC 
GGCGCCGTCT TCGAATCGAT CATCCAGGAG CCGCCGATGG GGTCGCTGCT CGGCGGCGGG 
CGCTACGATG AGTTGATCGG CATGTTCGCC GGGCGCTCGA TCCCTACGGT CGGGCTGGCG 
TTTGGCATCG AACGGTTGCA CGATGTGATG GAAGCATTGG GAATGGGACC GGAGTCACGG 
ACTATTGCGG TGGCGCTGGT GACGCTCTTC AACCCTGAGA TGGCGATGGA GAGTCTGGGT 
TTGGCGCAGG AGTTGCGCCG GGCAGGGTTG ATGATCGAGA CGACGCTCGA CCCCTCCGAA 
AAACTTGGGC GGCAACTCCA GTATGCGGAC CGACGCGGCA TTCCGTATGC GCTGGTGCTT 
GGTCCCGATG AACTGGCGCG CGGAGAAGTC GTTGTGAAAC ATCTGCGCAG TGGTGAGCAA 
CGGAGTGTGG CGCGCAGCGC CGTTGCCGGC ATGCTGCACG CGGCTGCGGA AGCGCAGCGC 
ACCCCGCGAA TAGCGAATGA GCAGGGAGGC ATCCATGAGC GATAG

Protein sequence

MSSRVQNIRG MRDHLPSAMI LRQHIINTLT SVFERYGFEP LQTPIVEYAE TLDGKIGDDE 
KLIYRFEDHG GRKVALRYDQ TVPLARVVAQ YQGQLTFPWR RYAIGQSYRG ERPGRGRYRE 
LWQADIDIVG SASPVADAEI LAVLTDALTA LGFTGFTTLI SHRQVLGGIA RVSGLDDASA 
GNVYRAIDKL DKIGIDGVRN ELLQSGVTPD AAERILALID LYGSADDVLN ELAQRLHDDE 
RAQQAIDNLR AIIGYARAMG VPEERIAIAP RLARGLSYYT GAVFESIIQE PPMGSLLGGG 
RYDELIGMFA GRSIPTVGLA FGIERLHDVM EALGMGPESR TIAVALVTLF NPEMAMESLG 
LAQELRRAGL MIETTLDPSE KLGRQLQYAD RRGIPYALVL GPDELARGEV VVKHLRSGEQ 
RSVARSAVAG MLHAAAEAQR TPRIANEQGG IHER