Gene SbBS512_E2975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2975
Symbol	rluD
ID	6269120
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	2781503
End bp	2782483
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	52%
IMG OID	641726917
Product	23S rRNA pseudouridine synthase D
Protein accession	YP_001881382
Protein GI	187732689
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.0427325
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACAAC GAGTACAGCT CACTGCAACG GTGTCCGAAA ACCAACTCGG TCAACGCTTA 
GATCAGGCTT TGGCCGAAAT GTTCCCGGAT TATTCACGTT CGCGAATAAA AGAATGGATC 
CTCGACCAGC GCGTGCTGGT AAACGGCAAA GTTTGTGATA AGCCGAAAGA AAAAGTATTG 
GGTGGCGAGC AGGTTGCCAT CAACGCTGAG ATTGAAGAAG AAGCGCGTTT TGAACCGCAG 
GATATCCCGC TGGATATTGT CTATGAAGAT GAAGATATCA TCGTCATTAA TAAACCGCGC 
GACCTGGTGG TACATCCTGG CGCGGGTAAC CTGGATGGCA CGGTACTGAA TGCGTTGCTT 
CATTATTATC CGCCCATTGC CGATGTACCG CGTGCGGGCA TCGTCCATCG TCTGGATAAA 
GACACCACTG GCCTGATGGT TGTGGCAAAA ACCGTTCCGG CTCAGACGCG TTTAGTCGAA 
TCTTTGCAAA GGCGTGAAAT TACTCGTGAG TATGAAGCGG TGGCAATTGG TCATATGACC 
GCTGGCGGTA CAGTAGATGA ACCAATCAGC CGCCACCCGA CCAAACGTAC TCACATGGCG 
GTGCATCCCA TGGGCAAACC GGCGGTCACT CACTATCGCA TCATGGAACA CTTCCGTGTG 
CACACGCGTC TGCGGTTGCG TCTGGAAACC GGACGTACGC ACCAGATCCG CGTGCATATG 
GCGCATATTA CCCATCCGCT GGTGGGCGAT CCGGTTTATG GTGGCCGTCC GCGTCCGCCA 
AAAGGTGCTT CGGAAGCGTT TATCTCCACG CTGCGTAAGT TTGACCGCCA GGCGCTTCAT 
GCAACTATGC TGCGTCTTTA TCACCCGATC TCCGGCATCG AAATGGAATG GCATGCGCCT 
ATTCCAGAAG ATATGGTGGA GTTGATTGAG GTTATGCGCG CCGATTTCGA AGAGCATAAG 
GATGAAGTGG ACTGGTTATG A

Protein sequence

MAQRVQLTAT VSENQLGQRL DQALAEMFPD YSRSRIKEWI LDQRVLVNGK VCDKPKEKVL 
GGEQVAINAE IEEEARFEPQ DIPLDIVYED EDIIVINKPR DLVVHPGAGN LDGTVLNALL 
HYYPPIADVP RAGIVHRLDK DTTGLMVVAK TVPAQTRLVE SLQRREITRE YEAVAIGHMT 
AGGTVDEPIS RHPTKRTHMA VHPMGKPAVT HYRIMEHFRV HTRLRLRLET GRTHQIRVHM 
AHITHPLVGD PVYGGRPRPP KGASEAFIST LRKFDRQALH ATMLRLYHPI SGIEMEWHAP 
IPEDMVELIE VMRADFEEHK DEVDWL