Gene Rmar_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rmar_1049
Symbol
ID	8567690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodothermus marinus DSM 4252
Kingdom	Bacteria
Replicon accession	NC_013501
Strand	+
Start bp	1198585
End bp	1199793
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	68%
IMG OID
Product	tryptophan synthase, beta subunit
Protein accession	YP_003290329
Protein GI	268316610
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.644397
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGACCG CCGAGACCGA ACTGCTGACC TACGAGGCGC CGGACGCCAC CGGACACTTC 
GGCCCCTACG GGGGCGCATT TGTGCCCGAG ACGCTGGTGC CGGCGCTGGA AGCGTTGAAG 
GCGGCCTACG CCGAGGCGCG TCAGGATCCG GGCTTCTGGG AGGAATACCA CGCCCTGCTC 
CGGGAATATG TGGGTCGGCC CACGCCGCTC ACGTTCGCAC CGCGCCTCAG CGAAGCGCTG 
GGCGGGCTGC AGATCTACCT GAAGCGGGAG GACCTGTGCC ACACGGGTGC CCACAAGATC 
AACAACACGA TCGGCCAGAT CCTGCTGGCC CGGCGCATGG GCAAGACGCG CATCATCGCC 
GAGACGGGCG CCGGACAGCA CGGCGTGGCG ACGGCCACGG TGTGCGCCCG CTTTGGAATG 
CAGTGCGTCG TTTACATGGG CGCCGAAGAT GTGGAGCGCC AGCACCTGAA CGTGCTGCGC 
ATGCAGTTGC TGGGCGCCGA GGTGCGACCC GTCGAGAGCG GGAGCCGCAC GCTCAAAGAC 
GCCACGAACG AGGCCATCCG CGACTGGGTG ACGAACGTCC ACGACACGTT CTACCTGATC 
GGCTCGGTGG TGGGACCGCA CCCGTACCCG ATGCTCGTGC GCGACTTTCA GCGCGTGATC 
GGCGACGAGG TGCGGCGGCA ACTGGCCGAA CGCATCGGCC GGGAGACGCC CGACGCACTG 
GTGGCCTGCG TGGGCGGCGG CTCGAACGCC ATGGGCTTGT TCTATCCGTT CCTGAACGAC 
CGCCATGTGC GCATGTACGG CGTGGAGGCG GCCGGCGAGG GGCTTGACCG CCGTCATGCC 
GCCACGCTCA CCTGCGGGCG GCCCGGCATC CTGCACGGCG CCATGAGCTA TCTGTTGCAG 
GACGACGACG GTCAGGTGCA GCTGGCCCAT TCCATTTCGG CGGGGCTGGA TTACCCGGGG 
GTGGGTCCCG AGCATGCCTA CCTGAAGGAT CTGGGGCGCG TCACCTACGT GACGGCCACC 
GACGAGGAGG CGCTGGAAGG CGTGCGGCTA TTGGCCCGCA CCGAAGGGAT TATTCCGGCG 
CTGGAAACGG CGCACGCCAT CGCGTTTCTG CCCCTCCTGG CCCGCGAGCT GGGGCCGGAC 
GCCGTCGTGG TGGTCAACCT GTCCGGCCGC GGCGACAAAG ACATGGGCAC CATTGCACGG 
TATATGTAA

Protein sequence

MSTAETELLT YEAPDATGHF GPYGGAFVPE TLVPALEALK AAYAEARQDP GFWEEYHALL 
REYVGRPTPL TFAPRLSEAL GGLQIYLKRE DLCHTGAHKI NNTIGQILLA RRMGKTRIIA 
ETGAGQHGVA TATVCARFGM QCVVYMGAED VERQHLNVLR MQLLGAEVRP VESGSRTLKD 
ATNEAIRDWV TNVHDTFYLI GSVVGPHPYP MLVRDFQRVI GDEVRRQLAE RIGRETPDAL 
VACVGGGSNA MGLFYPFLND RHVRMYGVEA AGEGLDRRHA ATLTCGRPGI LHGAMSYLLQ 
DDDGQVQLAH SISAGLDYPG VGPEHAYLKD LGRVTYVTAT DEEALEGVRL LARTEGIIPA 
LETAHAIAFL PLLARELGPD AVVVVNLSGR GDKDMGTIAR YM