Gene Caul_1658 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1658
Symbol
ID	5899113
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1737630
End bp	1738619
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	68%
IMG OID	641562147
Product	RluA family pseudouridine synthase
Protein accession	YP_001683285
Protein GI	167645622
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.615207
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0770781
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGAAG TACGCACGCT GTTCGTGGAC GCTGGCGAGG ACGGGGTCCG CCTCGATCGC 
TGGTTCAAGC GTCGCTGGCC CCACCTCAAC CACATCCAGC TCAACAAGCT GTTCCGCTCG 
GGCCAGGTGC GGGTCGATGG TTCGCGCGCC AAGGCCGACA CCAAGCTGGC GGCCGGCAGC 
CAGATCCGCG TGCCCCCGCT GCCCGACGCC CCGGATCCGG ACGAAAAACA GAAGCTGAGC 
CCGCGCGACA TCGCCTTCGC CAAGTCGCTG GTGCTGTACG AGGACGAGGA AGTTCTGGCG 
CTGAACAAGC CGGCCGGCCT GGCCGTGCAG GGCGGCACCA AGACCACCCA CCACATCGAC 
AAGCTGCTCA GCGCCTGGGG CGAGGGCGTC AACCGGCCCA AGCTGGTCCA CCGCCTGGAC 
CGCGACACCT CCGGCGTGTT GCTGCTGGGC AAGACTCCCG CCGCGGCCGC CCGCCTGTCG 
GGCTCGTTCG CCAAGCGCAA GGCGCAGAAG ACCTACTGGG CGATCGTCGC CGGCAACCCG 
CACCCGACAG AGGGCGTGAT CGAGCTGCAC CTGGCCAAGC GCGGGGTGGG CGACCGCGAA 
CTGGTCGTGC CGGCAGAACC CAAGGATCCT GACGGCCAGC CGGCCGAGAC CGAGTTCGTC 
TCGATCAGCC GCGCGGGTCC ACGCGTCACC TGGATGGCCC TGCGCCCGCA CACCGGCCGC 
ACGCACCAGC TGCGCGCCCA CATGAAGGCC ATCGGCCACC CGATCCTCGG CGATCCCAAG 
TACAGCGACG ACAAGGCCTT GCAGCTTTCG GAAGGCCTGA AGCTGCAGTT GCACGCCCGC 
TCGATCGTGC TGCCGCACCC CTCGGTCGGC ACCCTGGCCA TCCAGGCGCC GCTCAGCCCC 
GAGATGAAGG CTGGCTTCGC CAAGTTCGGC TTCTCGGAGG ACGAGGCGGA ATACGACCCG 
TTCGCTCGCC GCCAAACCAA GCGTAGATAA

Protein sequence

MREVRTLFVD AGEDGVRLDR WFKRRWPHLN HIQLNKLFRS GQVRVDGSRA KADTKLAAGS 
QIRVPPLPDA PDPDEKQKLS PRDIAFAKSL VLYEDEEVLA LNKPAGLAVQ GGTKTTHHID 
KLLSAWGEGV NRPKLVHRLD RDTSGVLLLG KTPAAAARLS GSFAKRKAQK TYWAIVAGNP 
HPTEGVIELH LAKRGVGDRE LVVPAEPKDP DGQPAETEFV SISRAGPRVT WMALRPHTGR 
THQLRAHMKA IGHPILGDPK YSDDKALQLS EGLKLQLHAR SIVLPHPSVG TLAIQAPLSP 
EMKAGFAKFG FSEDEAEYDP FARRQTKRR