Gene RPD_0249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0249
Symbol
ID	4020707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	286169
End bp	287215
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	64%
IMG OID	637960428
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_567390
Protein GI	162138292
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0230616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACTC AACGGGTTTT CTCCGGGGTC CAGCCGACCG GCAATCTGCA TCTCGGCAAC 
TACCTCGGTG CGATCGTGAA TTTCGTGAAG CTGCAGGAGA CTCACAACTG CATCTATTGC 
GTGGTCGATC TGCACGCGAT CACCGTTCCG GTGACGGTCT GGGGCGGACC CGACGAGCTG 
CGCCGCAACA CCCGCGAAGT CACCGCGGCG TTCATCGCGG CCGGCATCGA CCCGAACAAG 
CACATCATCT TCAACCAGAG CCAGGTCGCC GAACACGCCG AACTCGCCTG GGTGTTCAAC 
TGCGTCGCCC GTCTCGGCTG GCTGAACCGC ATGACCCAGT TCAAGGAGAA GGCCGGCAAG 
GACCGTGAGA ACGCCTCCAT TGGACTATAT GACTACCCGG TGCTGATGGC GTCCGACATT 
CTGGTCTACC GCGCCACCCA TGTGCCGGTC GGCGAGGACC AGAAGCAGCA TCTGGAACTG 
ACCCGCGACA TCGCCCAGAA GTTCAACAAC GACTTCGCGG AGTCGATCGC GGCGCAGGGG 
CTCGGCGACA GCTACTTCCC GATGCCGGAG CCGGTGATCA CCGGCCCCGC GACGCGGGTG 
ATGAGCCTGC GCGACGGCAC CAAGAAGATG TCGAAGTCCG ACCCCTCCGA CTATTCGCGT 
ATCAACCTCA CCGACGACGC CGACGCGATC GCGCAGAAGA TCCGGAAAGC GAAGACCGAT 
CCGGAGCCGC TGCCGTCCGA GGAAAAGGGG CTGGAGACCC GGCCCGAGGC CGACAATCTG 
GTCGGCATCT ACGCGGCGCT GGCCGGCAAG CCGAAGACCG ACGTGCTCGC CGAATTCGGC 
GGCGCGCAGT TCTCGGCATT CAAATCGAGC CTGGTCGACC TCGCGGTCGA GAAACTGTCG 
CCGATCGCCG GCGAGATGAA GCGGCTGTCG GCCGACCACG GCTATGTCGA TAGCGTGCTC 
GCCTCCGGCA GCGACCGCGC CCGCGTGATC GCCGCCGAGA CCATGGTGGG CGTGAAAGAC 
ATCATGGGCA TGGTGCGGAA GCGCTAA

Protein sequence

MTTQRVFSGV QPTGNLHLGN YLGAIVNFVK LQETHNCIYC VVDLHAITVP VTVWGGPDEL 
RRNTREVTAA FIAAGIDPNK HIIFNQSQVA EHAELAWVFN CVARLGWLNR MTQFKEKAGK 
DRENASIGLY DYPVLMASDI LVYRATHVPV GEDQKQHLEL TRDIAQKFNN DFAESIAAQG 
LGDSYFPMPE PVITGPATRV MSLRDGTKKM SKSDPSDYSR INLTDDADAI AQKIRKAKTD 
PEPLPSEEKG LETRPEADNL VGIYAALAGK PKTDVLAEFG GAQFSAFKSS LVDLAVEKLS 
PIAGEMKRLS ADHGYVDSVL ASGSDRARVI AAETMVGVKD IMGMVRKR