Gene Caul_0345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0345
Symbol
ID	5897619
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	386647
End bp	387702
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	73%
IMG OID	641560830
Product	RluA family pseudouridine synthase
Protein accession	YP_001681980
Protein GI	167644317
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGATCCAGC CCCTCGACCC GCCCGCGACG CTCGCGGATG ACGAGATCGA CGACATCGAC 
GCTCCCGAAA CGGGCGCCGG CGGCGACATC GTGCGGATCG AACTGGGCGC CGACCTGGCC 
GGCCAGCGCC TGGACAAGGC CCTGGCGACC GCCGCGCCGG AGCTGTCTCG CGCCCGCCTC 
CAGGCCCTGA TCGCGGCGGG CCAGGTGTCG CTGGTCGTCG AGGGCGCCGC GCCGCGCGCG 
ATGCCCGACG GCAAGGCCAA GGCCCCGGCC GGGCTCTACG AGGTGGTCGT GCCGCCGCCG 
ACCGCCGCCG AGCCGCTGCC CGAGAACATC CCGCTGAGCG TGCTCTACGA GGACGCCCAC 
CTGATCGTCA TCGACAAGCC GGCCGGCATG GCCGCCCACC CGGCCCCAGG GTGCGAGACC 
GGCACCCTGG TCAACGCCCT GCTGTTCCAC TGCGGGGCCA GCCTGTCGGG AATCGGCGGC 
GTGGCCCGGC CCGGCATCGT CCACCGCCTC GACAAGGAGA CGTCCGGGGT GATGGTGGCC 
GCCAAGACCG ACGCCGCCCA CCAGGGCCTA TCGGCCCTGT TCGCCAAGCA CGACATCGAC 
CGCATGTATC TGGCCCTGAC CCGCGGCGCG CCCCATCCGG TGGTCGGCAC GATCATCACC 
CAGCTGGGCC GCTCGCCGGG CGACCGCAAG AAGATGGCGG TGCTGAAGTC CGGCGGTCGC 
GAGGCGATCA CCCACTACCG CGTCGAGAAG AGCTTCGGTC CGCCGGACAA GCCCCTGGCC 
TCGCGCGTCG CCTGCCGGCT GGAAACCGGC CGCACCCACC AGATCCGCGT CCACATGGCC 
AGCAAGGGCA GCCCCTGCCT CGGCGACCCG GTCTACGGGG CCGGCGCCCC GGCCGCGCCG 
GTCAAGGCGG CCCTGACGGA GATCGGCTTC TCGCGCCAGG CTCTACACGC CGCCGTGCTG 
GGCTTCGTCC ACCCGATCAC CCGCGAACTT CTGCGCTTCG AAACGCCCCT GCCGCCCGAC 
ATGGCGGCGC TGGAGGCGGC CCTTGAAGCC CTGTGA

Protein sequence

MIQPLDPPAT LADDEIDDID APETGAGGDI VRIELGADLA GQRLDKALAT AAPELSRARL 
QALIAAGQVS LVVEGAAPRA MPDGKAKAPA GLYEVVVPPP TAAEPLPENI PLSVLYEDAH 
LIVIDKPAGM AAHPAPGCET GTLVNALLFH CGASLSGIGG VARPGIVHRL DKETSGVMVA 
AKTDAAHQGL SALFAKHDID RMYLALTRGA PHPVVGTIIT QLGRSPGDRK KMAVLKSGGR 
EAITHYRVEK SFGPPDKPLA SRVACRLETG RTHQIRVHMA SKGSPCLGDP VYGAGAPAAP 
VKAALTEIGF SRQALHAAVL GFVHPITREL LRFETPLPPD MAALEAALEA L