Gene Saro_3046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3046
Symbol
ID	3916658
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3261197
End bp	3262195
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	67%
IMG OID	640445826
Product	ribosomal large subunit pseudouridine synthase D
Protein accession	YP_498315
Protein GI	87201058
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTACCCA TATGGCCGGG AATGGGGGGC ACCGACAGCA TCATTTCCGG ACAGGTCCCC 
GCAGGTGGCC AGAGACTCGA CAAGGCCCTG GCCGACGCCA GCGGCCTCTC GCGCGAGCGG 
GTCAAGGCTC TGCTTGGTGA AGGGCGTGTC CGGCTGGGTG GGGCGGTAGT CTCGCAGGCC 
TCGCTCAAGC CCGCCGAGGG CACACCGTTC GAAATCCACG TACCCGAGGC GGCCCCCGCC 
GAAGCCATCG CGCAGGCAAT CCCGCTGGTG GTCGTCCACG AGGACGACGC CCTGATCGTG 
GTCGACAAGC CTGCGGGACT TGTGGTCCAT CCGGCTGCGG GCAACCCCGA CGGGACGCTG 
GTCAACGCCC TGCTGCATCA CTGCCGTGGG CAGCTTTCCG GCATTGGCGG GGTGGCCCGG 
CCGGGGATCG TCCATCGCAT CGACAAGGAT ACTTCGGGCT TGCTGGTCGT GGCGAAGACC 
GACGCCGCCC ACGAGGGACT GGCACGGCAG TTCGCCGATC ATTCGATCAC GCGTGCGTAC 
AAGTGCGTGA CCGCAGGCGT GCCGATGCCG CCTTCTGGCA CGGTGCGCGG GGCGATCGCG 
CGATCGAGCC ATGATCGCAA GAAGATGGCG CTGGTCGATG ACGGGCGCGG GAAGCATGCG 
GTCACCCATT TCCGAACGCT CGCAGCGCTT CAGGGCGCCG CGCTTGTCGA GTGCCGGCTG 
GAGACGGGGC GAACCCACCA GGTGCGCGTT CACCTTGCGT CAATCGGCCA TCCGCTATTG 
GGTGATCCGG TCTATGGACG CACACCTTCA CGCCTCAGGC CGCTGCTCCA GCGGCTCGGG 
TTTCACCGTC AGGCGCTTCA CGCGGCGGAG CTGGGATTCA TCCACCCCGT CACCGGCGCA 
CCGCTCCACT TCGCCAGTCC GACGCCCGTC GACATGCGGG AACTCATCGT CGAACTGTGC 
GCTGAAGGTC AGGATGCAAA GCTCATGGCG ATGGTGTAG

Protein sequence

MLPIWPGMGG TDSIISGQVP AGGQRLDKAL ADASGLSRER VKALLGEGRV RLGGAVVSQA 
SLKPAEGTPF EIHVPEAAPA EAIAQAIPLV VVHEDDALIV VDKPAGLVVH PAAGNPDGTL 
VNALLHHCRG QLSGIGGVAR PGIVHRIDKD TSGLLVVAKT DAAHEGLARQ FADHSITRAY 
KCVTAGVPMP PSGTVRGAIA RSSHDRKKMA LVDDGRGKHA VTHFRTLAAL QGAALVECRL 
ETGRTHQVRV HLASIGHPLL GDPVYGRTPS RLRPLLQRLG FHRQALHAAE LGFIHPVTGA 
PLHFASPTPV DMRELIVELC AEGQDAKLMA MV