Gene Rcas_2053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2053
Symbol
ID	5539533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2633454
End bp	2634896
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	58%
IMG OID	640894189
Product	prolyl-tRNA synthetase
Protein accession	YP_001432158
Protein GI	156742029
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0442] Prolyl-tRNA synthetase
TIGRFAM ID	[TIGR00408] prolyl-tRNA synthetase, family I

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.449201
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCAAGG AAGGAATAAC TCCCCGCGCG CAGGATTATT CGCAGTGGTA TCTCGATATT 
GTGCAACAGG CGGACCTCGC CGACTATGCG GAGGTCGTCA AAGGGTGCAT TGTCTTCAAA 
CCGACCGGCT ATGCGCTGTG GGAGGCGATC CAGCGCGGGT TGGACGACCG GATCAAGGCG 
ACCGGTCATG TCAATGCCTA CTTTCCGCTG CTCATTCCAA AAAGTTTCCT GATGAAAGAA 
GCCGAGCACG TCGAAGGCTT TGCGCCCGAA GTGGCGGAAG TAACCCGTGC CGGTGGCGAA 
GACCTTGCCG AACCCTATGT CATCCGACCG ACCTCGGAAA CGATCATCGG CTACTTCTAT 
TCCAAATGGG TGCGAAGTTA CCGCGATCTG CCGCTGCTGA TCAATCAGTG GGCAAACGTG 
ATGCGCTGGG AGATGCGCAC CCGCCCCTTC CTGCGCACCA CCGAGTTCCT CTGGCAGGAG 
GGGCACACGG TGCATGCCAC CGAGGAAGAT GCCGAACGCG AAACGCTCTT GATCCTTCAC 
GAGGTGTATG CCGACTTCGT TGAGAAGGAT ATGGCGATTC CGGTAATCAG GGGGCTGAAA 
TCGGAGAAAG AAAAGTTCCC CGGCGCGCTG CGCTCCTACT GTATCGAAGC CATGATGCAG 
GACGGACGGG CGCTTCAGGC GGGAACATCG CACAACCTGG GGCAGAACTT TGCCCGCGCC 
TTCGATATTA CCTATACCGA TCAGCACAAT ACCATTCAGT ACGCCTGGAC GACCAGCTGG 
GGCGTCAGCA CACGCCTGAT CGGCGCCCTG ATTATGACCC ATTCCGATGA TGAAGGCCTC 
GTCATCCCAC CGCGCCTGGC GCCGACACAG GTCGTCGTCG TGCCGATTTA CCGGAACGAT 
GCCGAGCGCA GTGTGGTCAT GGAAGCGGTG CAGCGTATGA CCGCCGAATG GAAGGGACTC 
CTGCGCTTCA AGGTCGATGA CCGCGATAAT CTGACGCCAG GATTCAAGTT CAATGAGTGG 
GAATTGAAAG GTGTTCCTAT CCGCGTCGAG ATCGGTCCGA AAGACATCGA AAAAGGAAGC 
GTCGCCATTG CCCGGCGCGA CCAACCAGGG CGCGAAGGTA AATCGTTCGT TCCTCAGGAA 
GGACTGACCG CCCGCCTCGC TGCGCTGCTT GAGGAAATTC AGCAGGCGCT CTACCGGCGC 
GCACTGGCAT TCCGTGAAAC GCATACCGCC GATGTCACGA CCTATGAGGA ACTGAAACAA 
CAGGTCGAAC GCGGTTTTGC GCGCTGCTAC TGGGCGGGAA CTATGGAAGA CGAAAAGCGA 
ATCCAGGAAG AGACGCGCGC TACCATTCGC TGCATCCCGC TCGACCAACC GCAACAGGCG 
GGGAGGTGCA TCTACACCGG CAAAGAGACA ACCCAGCAGG TCATCTTCGC GCGGGCATAT 
TGA

Protein sequence

MPKEGITPRA QDYSQWYLDI VQQADLADYA EVVKGCIVFK PTGYALWEAI QRGLDDRIKA 
TGHVNAYFPL LIPKSFLMKE AEHVEGFAPE VAEVTRAGGE DLAEPYVIRP TSETIIGYFY 
SKWVRSYRDL PLLINQWANV MRWEMRTRPF LRTTEFLWQE GHTVHATEED AERETLLILH 
EVYADFVEKD MAIPVIRGLK SEKEKFPGAL RSYCIEAMMQ DGRALQAGTS HNLGQNFARA 
FDITYTDQHN TIQYAWTTSW GVSTRLIGAL IMTHSDDEGL VIPPRLAPTQ VVVVPIYRND 
AERSVVMEAV QRMTAEWKGL LRFKVDDRDN LTPGFKFNEW ELKGVPIRVE IGPKDIEKGS 
VAIARRDQPG REGKSFVPQE GLTARLAALL EEIQQALYRR ALAFRETHTA DVTTYEELKQ 
QVERGFARCY WAGTMEDEKR IQEETRATIR CIPLDQPQQA GRCIYTGKET TQQVIFARAY