Gene Ent638_3074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3074
Symbol	rluD
ID	5112613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	3351681
End bp	3352661
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	52%
IMG OID	640493272
Product	23S rRNA pseudouridine synthase D
Protein accession	YP_001177789
Protein GI	146312715
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.273549
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0295932
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACAAC GAGTAGAACT CACCGCAACA GTCTCCGAAA ATCAGCTCGG TCAACGCTTA 
GATCAAGCTT TGGCCGAAAT GTTCCCTGAT TATTCGCGTT CACGCATAAA AGAATGGATT 
CTTGACCAAC GAGTGATGGT CAACGGCAAA GTTTGGGACA CGCCAAAAGA GAAAGTGTTA 
GGTGGGGAAG TGGTCGCCAT CAATGCTGAA ATCGATGAAG AAGTCCGTTT TGAAGCACAA 
GATATCCCGC TTACCATCGT CTATGAAGAT GATGACATTC TGGTGATCAA CAAGCCTCGC 
GGCCTGGTTG TCCACCCGGG AGCGGGTAAT CCTGATGGTA CAGTGCTGAA TGCGCTGCTC 
CACTACTATC CACCGATCAC CGATGTACCG CGTGCAGGCA TCGTGCATCG TCTGGATAAA 
GACACAACCG GTTTGATGGT CGTCGCAAAA ACTGTTCCGG CGCAAACGCG CTTGGTGGAA 
TCGTTGCAGC TGCGTGAAAT CACCCGTGAA TATGAAGCGG TCGCGATTGG TCACATGACC 
TCAGGCGGTA CGGTAGAAGA GCCGATCAGC CGTCACCCGA CCAAACGCAC GCACATGTCA 
GTGCATCCGA TGGGGAAACC CGCGGTAACG CATTACCGCA TTATGGAACA TTTCCGCATT 
CATACGCGTT TGCGTTTGCG TCTGGAAACG GGCCGTACTC ACCAGATCCG TGTGCACATG 
TCGCACATTA CGCATCCGCT GGTAGGTGAT CAGGTTTATG GCGGACGCCC GCGTCCACCT 
AAAGGTGCTT CTGAAGAATT TATCAGTACC CTGCGTAAAT TTGATCGTCA GGCTTTGCAC 
GCCACTATGC TGCGCCTCTA TCACCCTATT ACAGGCATCG AGATGGAATG GCATGCGCCT 
ATTCCTCAGG ACATGGTCGA GCTCATCGAA GCGATGCGTG CAGATTTTGA AGAGCATAAG 
GATAAAGTGG ACTGGTTATG A

Protein sequence

MAQRVELTAT VSENQLGQRL DQALAEMFPD YSRSRIKEWI LDQRVMVNGK VWDTPKEKVL 
GGEVVAINAE IDEEVRFEAQ DIPLTIVYED DDILVINKPR GLVVHPGAGN PDGTVLNALL 
HYYPPITDVP RAGIVHRLDK DTTGLMVVAK TVPAQTRLVE SLQLREITRE YEAVAIGHMT 
SGGTVEEPIS RHPTKRTHMS VHPMGKPAVT HYRIMEHFRI HTRLRLRLET GRTHQIRVHM 
SHITHPLVGD QVYGGRPRPP KGASEEFIST LRKFDRQALH ATMLRLYHPI TGIEMEWHAP 
IPQDMVELIE AMRADFEEHK DKVDWL