Gene EcSMS35_2748 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2748
Symbol	rluD
ID	6143501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2830000
End bp	2830980
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	52%
IMG OID	641617618
Product	23S rRNA pseudouridine synthase D
Protein accession	YP_001744779
Protein GI	170683711
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0255935
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.237135
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACAAC GAGTACAGCT CACTGCAACG GTGTCCGAAA ACCAACTCGG TCAACGCTTA 
GATCAGGCTT TGGCCGAAAT GTTCCCGGAT TATTCACGTT CGCGGATAAA AGAATGGATC 
CTCGACCAGC GCGTGCTGGT TAACGGCAAA GTTTGTGATA AGCCGAAAGA AAAAGTATTG 
GGTGGCGAGC AGGTTGCCAT CAACGCTGAG ATTGAAGAAG AAGCGCGTTT TGAACCGCAG 
GATATCCCGC TGGATATCGT CTATGAAGAT GACGATATCA TCGTCATTAA TAAACCGCGC 
GACCTGGTGG TACATCCTGG CGCGGGTAAC CCGGATGGCA CGGTACTGAA TGCATTGCTT 
CATTATTATC CGCCCATTGC CGATGTACCG CGTGCAGGCA TCGTCCATCG TCTGGATAAA 
GACACCACTG GCCTGATGGT TGTGGCAAAA ACCGTTCCGG CTCAGACGCG TTTAGTCGAA 
TCTTTGCAAA GGCGTGAAAT TACTCGTGAG TATGAAGCGG TGGCAATTGG TCATATGACC 
GCTGGCGGTA CAGTAGATGA ACCAATCAGC CGCCACCCGA CCAAACGTAC CCATATGGCG 
GTGCATCCGA TGGGCAAACC AGCGGTGACT CACTATCGCA TCATGGAACA CTTCCGTGTG 
CACACGCGTC TGCGGTTGCG TCTGGAAACT GGACGTACGC ACCAGATCCG CGTGCATATG 
GCCCATATCA CTCATCCGCT GGTGGGCGAT CCGGTTTATG GTGGCCGTCC GCGTCCGCCA 
AAAGGTGCTT CGGAAGCGTT TATCTCCACG CTGCGTAAAT TTGACCGCCA GGCGCTTCAT 
GCAACCATGC TGCGTCTTTA TCACCCGATC TCCGGTATCG AAATGGAATG GCATGCGCCT 
ATTCCACAAG ATATGGTGGA GCTGATTGAG GTGATGCGCG CCGATTTCGA AGAGCATAAA 
GATGAAGTGG ACTGGTTATG A

Protein sequence

MAQRVQLTAT VSENQLGQRL DQALAEMFPD YSRSRIKEWI LDQRVLVNGK VCDKPKEKVL 
GGEQVAINAE IEEEARFEPQ DIPLDIVYED DDIIVINKPR DLVVHPGAGN PDGTVLNALL 
HYYPPIADVP RAGIVHRLDK DTTGLMVVAK TVPAQTRLVE SLQRREITRE YEAVAIGHMT 
AGGTVDEPIS RHPTKRTHMA VHPMGKPAVT HYRIMEHFRV HTRLRLRLET GRTHQIRVHM 
AHITHPLVGD PVYGGRPRPP KGASEAFIST LRKFDRQALH ATMLRLYHPI SGIEMEWHAP 
IPQDMVELIE VMRADFEEHK DEVDWL