Gene RPD_0197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0197
Symbol
ID	4020655
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	220569
End bp	221783
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	65%
IMG OID	637960376
Product	tryptophan synthase subunit beta
Protein accession	YP_567338
Protein GI	91974679
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCAGA TCCTGCCGAA TTCGTTTCGA TCCGGTCCCG ACGAGCGCGG GCATTTCGGC 
ATTTTCGGCG GCCGCTTCGT CGCCGAGACG TTGATGCCGC TGATCCTGGA GCTGGAAAAG 
GCCTACGCTG AGGCAAAAGA CGATCCGGCG TTTCGCACCG AGATGGACGG CTATCTCAAG 
CATTATGTCG GCCGGCCGTC GCCGCTGTAT TTCGCCGAGC GGCTGACCGA GCATTTCGGC 
GGCGCCAAGA TCTACTTCAA GCGCGAGGAT CTCAATCACA CCGGCGCCCA CAAGGTGAAC 
AACGTGCTCG GCCAGATCAT GCTGGCCAGG CGGATGGGCA AGCAGCGGAT CATCGCCGAG 
ACCGGCGCCG GCATGCACGG CGTCGCCACC GCCACGATGT GCGCCAAGTT CGGCCTGCAA 
TGCGTGGTCT ATATGGGCGC GGTCGACGTC GAGCGGCAGC AGCCCAATGT GCTGCGGATG 
AAGGCGCTGG GCGCCGAAGT CCGCCCGGTG ACCTCCGGCG CCAACACGCT GAAGGACGCG 
ATGAACGAGG CGCTGCGGGA CTGGGTCACC AACGTTCACG ACACCTTCTA CTGCATCGGC 
ACCGTCGCGG GCCCGCACCC CTATCCGATG ATGGTGCGCG ACTTCCAGGA GGTGATCGGC 
CAGGAGGTGC GCGAGCAGAT TCTGGAGACC GAAGGCCGGC TGCCGGATTC GCTGATCGCC 
TGCATCGGCG GCGGCTCCAA CGCGATGGGC CTGTTTCACC CCTTCCTCGA CGACGCCGGC 
GTCGTGATCT ACGGCGTCGA AGCCGCGGGC CATGGCCTCA GCAAGCTGCA TGCGGCGTCG 
ATCGCCGGCG GCAAGCCCGG CGTGCTGCAC GGCAATCGCA CCTATCTGCT GATGGACGAT 
GACGGCCAGA TCCAGGAAGC GCATTCGATT TCCGCCGGCC TCGACTATCC CGGCATCGGC 
CCCGAGCACG CCTGGCTGCA CGATGTCGGC CGCGTCAACT TCCTGTCGGC CACCGACGCC 
GAGGCGCTCG ACGCCTTCAA GCTGTGCTGC CGTCTCGAGG GCATCATTCC GGCGCTGGAG 
CCGGCGCATG CGCTGGCCAA GGTCGCCGAT CTCGCGCCGA TCCTGCCGAA GGATCACTTG 
ATGGTGCTCA ACATGTCCGG CCGCGGCGAC AAGGATCTCG CTTCTGTGGC CGAGCATCTC 
GGGGGCAAGT TCTGA

Protein sequence

MNQILPNSFR SGPDERGHFG IFGGRFVAET LMPLILELEK AYAEAKDDPA FRTEMDGYLK 
HYVGRPSPLY FAERLTEHFG GAKIYFKRED LNHTGAHKVN NVLGQIMLAR RMGKQRIIAE 
TGAGMHGVAT ATMCAKFGLQ CVVYMGAVDV ERQQPNVLRM KALGAEVRPV TSGANTLKDA 
MNEALRDWVT NVHDTFYCIG TVAGPHPYPM MVRDFQEVIG QEVREQILET EGRLPDSLIA 
CIGGGSNAMG LFHPFLDDAG VVIYGVEAAG HGLSKLHAAS IAGGKPGVLH GNRTYLLMDD 
DGQIQEAHSI SAGLDYPGIG PEHAWLHDVG RVNFLSATDA EALDAFKLCC RLEGIIPALE 
PAHALAKVAD LAPILPKDHL MVLNMSGRGD KDLASVAEHL GGKF