Gene TM1040_0291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0291
Symbol
ID	4077426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	297539
End bp	298585
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	64%
IMG OID	638005585
Product	ribosomal large subunit pseudouridine synthase C
Protein accession	YP_612286
Protein GI	99080132
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.503835
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGCG TGCAAATGAT CACCGTGACC GAAGACGACG GCGGCCAGCG GATCGACCGC 
TGGTTGCGGC GTCTGTTCCC GCATGTGAAC CAGGGCCGCA TCGAGAAGAT GTGTCGCAAG 
GGCGAGCTGC GTCTGGATGG CGGTCGCGTC AAGGCCAACA CCCGTGTTGA GGCGGGACAG 
GTTGTGCGGG TGCCCCCGCT GGCCGAGAGC GACATGAAAC CGGCCGAGGC GCGCCCGGTG 
AAGATCTCGG ATGCTGACGC CAAGATGATT CGCGATTGCG TGATCTACAA GGACGACGAT 
GTTCTGGTGA TCAACAAACC GGCCGGACTG GCGGTGCAGG GCGGCTCTGG CACCACCAAA 
CACGTAGATG GCCTCTCGGA AGCACTGCGC TTTGACGCCG AGGACAAGCC GCGGCTGGTG 
CATCGTCTCG ACAAGGACAC ATCCGGGCTC TTGGTGCTGG CGCGCAACCG CAAGGCGGCG 
CAGGGGCTGA CCGCAGCCTT TCGCCACAAG AACACCCGCA AGATCTACTG GGCCTTGGTG 
GCAGGCGTGC CGACGCCCTA CCTTGGCGAG ATCAAGACCG GGCTCGTAAA GGCGCCGGGA 
CATGGCAAAT CCGGCGAGGG CGAAAAGATG ATCCCCGTTG ATCCGCGCGA TGTGGATGCC 
ACGCCCGGGG CAAAGCGCGC GCATACCTAT TATGCCACGC TCTACCGCGT TGCGAGCCGT 
GCAAGCTGGG TCGCGATGGA GCCGGTGACG GGCCGCACCC ACCAGCTGCG TGCGCATATG 
GCGGGCATGG GGCATCCGAT CATTGGCGAT GGCAAATATG GCGGCTCGGG TCAGGAGAAC 
CTCGGCGATG GCTGGGGCGC GCAAATCGGC GGTCTGATCT CGAAGAAACT GCACCTGCAT 
GCGCGCCGTT TGCAGTTCGA ACACCCCGTC ACCGGCAAAG TGGTGACAGT GACTGCCGCG 
CTGCCCGACC ACATGAAAGA GAGCTGGGAC ACCTTTGGCT GGACCGAGGA TCTGGCCGCC 
GACGACCCGT TTGAGACGCT GTTTTGA

Protein sequence

MSGVQMITVT EDDGGQRIDR WLRRLFPHVN QGRIEKMCRK GELRLDGGRV KANTRVEAGQ 
VVRVPPLAES DMKPAEARPV KISDADAKMI RDCVIYKDDD VLVINKPAGL AVQGGSGTTK 
HVDGLSEALR FDAEDKPRLV HRLDKDTSGL LVLARNRKAA QGLTAAFRHK NTRKIYWALV 
AGVPTPYLGE IKTGLVKAPG HGKSGEGEKM IPVDPRDVDA TPGAKRAHTY YATLYRVASR 
ASWVAMEPVT GRTHQLRAHM AGMGHPIIGD GKYGGSGQEN LGDGWGAQIG GLISKKLHLH 
ARRLQFEHPV TGKVVTVTAA LPDHMKESWD TFGWTEDLAA DDPFETLF