Gene Rpal_0072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_0072
Symbol
ID	6407715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	74866
End bp	76080
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	66%
IMG OID	642709981
Product	tryptophan synthase subunit beta
Protein accession	YP_001989110
Protein GI	192288505
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00296113
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCAAG CTTTGCCGAA TTCCTTCCGG TCCGGCCCCG ACGAGCGCGG GCATTTCGGT 
ATCTATGGCG GCCGCTTCGT CGCCGAGACG CTGATGCCGC TGATCCTCGA TCTGGAAAAG 
GCCTATGCGG AAGCCAAGGC CGACCCGGCG TTCCGCGCCG AGATGGACAA CCATCTCAAG 
CACTATGTCG GACGTCCGTC GGCTTTGTAT TTCGCCGAGC GGCTGACCGA GCATTTCGGC 
GGCGCCAAGA TCTACTTCAA GCGCGAAGAT CTCAATCACA CCGGCGCTCA CAAGGTGAAC 
AACGTGCTCG GCCAGATCAT GCTGGCCAAG CGCATGGGCA AGCCGCGGGT GATCGCCGAG 
ACCGGCGCCG GCATGCACGG CGTCGCCACC GCGACGATGT GCGCCAAATT CGGCCTCGAA 
TGCGTGGTGT TCATGGGCGC GGTCGACGTC GAACGCCAGC AGCCCAACGT GCTGCGGATG 
AAGGCGCTCG GCGCAGAAGT CCGCCCCGTC ACCTCCGGCG CCAACACGCT GAAGGACGCG 
ATGAACGAGG CGCTGCGTGA CTGGGTCACC AACGTCCACG ACACGTTCTA TTGCATCGGC 
ACGGTCGCGG GTCCGCATCC CTATCCGATG ATGGTGCGCG ACTTCCAGGC GGTGATCGGT 
CAGGAAGTCC GCGAGCAGAT CATGCAGGCC GAAGGTCGCC TGCCCGACTC GCTGGTCGCC 
TGCATCGGCG GCGGCTCCAA CGCGATGGGG CTGTTCCATC CGTTCCTCGA CGATCCGGGC 
GTCGCGATCT ACGGCGTCGA AGCTGCGGGC CATGGGCTCG ACAAGCTGCA CGCGGCGTCG 
ATCGCCGGCG GCAAGCCGGG CGTGCTGCAC GGCAACCGCA CCTATCTGCT GATGGATGCG 
GACGGCCAGA TCGAGGAAGC GCATTCGATC TCCGCCGGCC TCGACTATCC GGGCGTCGGC 
CCCGAGCACT CCTGGCTGCA CGACGTCGGC CGCGTCAACT TCCTGTCCGC CACCGACACC 
GAAGCGCTCG ACGCGTTCAA GCTGTGCTGC CGACTCGAAG GCATCATCCC GGCGCTGGAG 
CCGAGCCACG CGCTCGCCAA GGTCGCCGAC CTCGCGCCCA AGCTGCCGAA GGATCACCTG 
ATGGTCGTGA ACATGTCCGG CCGCGGCGAC AAGGACCTCG CGTCGGTCGC AGAACATCTC 
GGGGGCAAGT TCTGA

Protein sequence

MNQALPNSFR SGPDERGHFG IYGGRFVAET LMPLILDLEK AYAEAKADPA FRAEMDNHLK 
HYVGRPSALY FAERLTEHFG GAKIYFKRED LNHTGAHKVN NVLGQIMLAK RMGKPRVIAE 
TGAGMHGVAT ATMCAKFGLE CVVFMGAVDV ERQQPNVLRM KALGAEVRPV TSGANTLKDA 
MNEALRDWVT NVHDTFYCIG TVAGPHPYPM MVRDFQAVIG QEVREQIMQA EGRLPDSLVA 
CIGGGSNAMG LFHPFLDDPG VAIYGVEAAG HGLDKLHAAS IAGGKPGVLH GNRTYLLMDA 
DGQIEEAHSI SAGLDYPGVG PEHSWLHDVG RVNFLSATDT EALDAFKLCC RLEGIIPALE 
PSHALAKVAD LAPKLPKDHL MVVNMSGRGD KDLASVAEHL GGKF