Gene RPB_0635 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0635
Symbol
ID	3908328
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	720399
End bp	721613
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	67%
IMG OID	637882524
Product	tryptophan synthase subunit beta
Protein accession	YP_484257
Protein GI	86747761
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.874907
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0737735
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAGA TCCTGCCGAA CTCGTTTCGA TCCGGTCCCG ACGAGCGCGG GCATTTCGGC 
ATCTTCGGCG GCCGCTTCGT CGCCGAGACG CTGATGCCGC TGATCCTCGC GCTGGAAAAG 
GCCTACGCGG AAGCCAAGGA CGATCCGGCG TTCCGCGCCG AGATGGACGG CTACCTCAAG 
CACTATGTCG GCCGGCCGTC GCCGCTGTAT TTCGCCGAGC GGCTGACCGA GCATTTCGGC 
GGCGCCAAGA TCTACTTCAA GCGCGAGGAC CTCAACCACA CCGGCGCCCA CAAGGTGAAC 
AACGTGCTCG GCCAGATCAT GCTGGCGCGG CGGATGGGCA AGCCGCGGAT CATCGCCGAA 
ACCGGCGCCG GCATGCACGG CGTCGCCACC GCGACGATGT GCGCGAAATT CGGCCTGCAA 
TGCGTCGTCT ATATGGGCGC GGTCGACGTC GACCGGCAGC AGCCCAACGT GCTGCGGATG 
AAGGCGCTCG GCGCCGAAGT CCGCCCGGTG ACGTCCGGCG CCGCCACGCT CAAGGACGCG 
ATGAACGAGG CGCTGCGCGA CTGGGTCACC AACGTCCACG ACACGTTCTA TTGCATCGGC 
ACCGTCGCCG GCCCGCACCC CTATCCGATG ATGGTGCGCG ACTTCCAGGC GGTGATCGGC 
CAGGAAGTGC GCGCGCAGAT CATGGAAGCC GAAGGCCGGC TGCCGGATTC GCTGATCGCC 
TGCATCGGCG GCGGCTCCAA TGCGATGGGA CTGTTTCATC CCTTCCTGGA TGATAGCAGC 
GTCGCGATCT ACGGCGTCGA GGCCGCGGGC CACGGCCTCA GCAAGCTGCA TGCGGCGTCG 
ATCGCCGGCG GCAAGCCCGG CGTTCTGCAC GGCAACCGCA CCTATCTGCT GATGGACACC 
GATGGCCAGA TCCAGGAAGC GCATTCGATC TCGGCCGGCC TCGACTATCC GGGCATCGGC 
CCGGAACACG CCTGGCTGCA CGATGTCGGC CGCGTCGAGT TCATGTCCGC CACCGACACC 
GAGGCGCTCG ACGCCTTCAA GCTGTGCTGC CGGCTGGAGG GCATCATCCC GGCGCTGGAG 
CCGGCCCATG CGCTGGCGAA AGTCGGCGAC CTCGCCCCGC CCCTGCCGAA GGATCATGTG 
ATGGTGCTCA ACATGTCGGG CCGCGGCGAC AAGGATCTCG CTTCGGTCGC CGAACATCTC 
GGGGGCCAGT TCTGA

Protein sequence

MNQILPNSFR SGPDERGHFG IFGGRFVAET LMPLILALEK AYAEAKDDPA FRAEMDGYLK 
HYVGRPSPLY FAERLTEHFG GAKIYFKRED LNHTGAHKVN NVLGQIMLAR RMGKPRIIAE 
TGAGMHGVAT ATMCAKFGLQ CVVYMGAVDV DRQQPNVLRM KALGAEVRPV TSGAATLKDA 
MNEALRDWVT NVHDTFYCIG TVAGPHPYPM MVRDFQAVIG QEVRAQIMEA EGRLPDSLIA 
CIGGGSNAMG LFHPFLDDSS VAIYGVEAAG HGLSKLHAAS IAGGKPGVLH GNRTYLLMDT 
DGQIQEAHSI SAGLDYPGIG PEHAWLHDVG RVEFMSATDT EALDAFKLCC RLEGIIPALE 
PAHALAKVGD LAPPLPKDHV MVLNMSGRGD KDLASVAEHL GGQF