Gene Caci_2458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_2458
Symbol
ID	8333807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	2778439
End bp	2779437
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	70%
IMG OID	644955611
Product	pseudouridine synthase
Protein accession	YP_003113217
Protein GI	256391653
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1187] 16S rRNA uridine-516 pseudouridylate synthase and related pseudouridylate synthases
TIGRFAM ID	[TIGR00093] pseudouridine synthase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACCC CCGCTCGCCG TTCCCAGCCC AGCAAGTCCG GTGGAGGCCG GGGCTCCGGC 
TCCGGTGGCG GAGCGCGGGG TTCCGGCGGC TCTCGGCAGG CTGGTGCGGG TTCCGGTGGG 
TCTCGGCAGC CTGCGCCCGC TGGTGGACGT TCGCCTGGCA AGGCTGGTGG TCGCTCCGGT 
GGGTCGGGCG GTGGTGGCAA TGCTTCCGGC GCGAATGCCG CCGCCGGCTC CGGTGGTCGT 
GACTGGCGCG ACTATGACCC CTTTGCGGAC GCCAACGAAG AGGGCATCCG CCTTCAGAAG 
GTTCTGGCGC AGGCCGGGGT CGGCAGTCGG CGGGTCAGCG AGGATCTGAT CGCCGCCGGC 
CGGGTTGAGG TCAACGGTGA GATCGTGCGG CATCAGGGCA TGCGCGTGGA TCCCGAGACC 
GCGGTGATCC GGGTCGACGG GATGCGCATC TCGACCGCTG AGGGGATCGT GCACTTCGCG 
TTCAACAAGC CGATGGGCGT GGTGTCCGCC ATGGACGACC CGGATCGGCC CAACCTCGGC 
GACTACGTGC GCGGGCGCAA CGAGCGCCTG TTCCACATCG GACGCCTCGA CGTCGACACC 
GAGGGCCTGA TCCTGCTGAC CAACGACGGG GAACTCGCGC ACCGGCTGGC GCATCCGTCC 
TACGAGATCC GCAAGGTCTA CCGCGCGCAG GTCTACGGCA CCGTGCCGAA GGACCTGGGC 
CGCCGCCTGC GCGAGGGCGT GGACCTGGAG GACGGTCTGG CACGCGTCGA CCACTTCCGC 
CTGCTGGACT CCGTCGGCCG CAACGCGCTG GTGGAGATCA CCATCCACGA AGGCCGCAAC 
CGCATCGTCC GGCGCATCAT GGACGCGGTC GGGCTCCCCG TGCGCGGCCT GGTGCGCACC 
AAGTTCGGCC CGATCTCGCT CGGCGACCAG AAGCCCGAGC GCATGCGTCC GCTCAACAAG 
GAAGAGGTCG GCGCGGTCTA CAAGTCCGTC GGACTCTAG

Protein sequence

MNTPARRSQP SKSGGGRGSG SGGGARGSGG SRQAGAGSGG SRQPAPAGGR SPGKAGGRSG 
GSGGGGNASG ANAAAGSGGR DWRDYDPFAD ANEEGIRLQK VLAQAGVGSR RVSEDLIAAG 
RVEVNGEIVR HQGMRVDPET AVIRVDGMRI STAEGIVHFA FNKPMGVVSA MDDPDRPNLG 
DYVRGRNERL FHIGRLDVDT EGLILLTNDG ELAHRLAHPS YEIRKVYRAQ VYGTVPKDLG 
RRLREGVDLE DGLARVDHFR LLDSVGRNAL VEITIHEGRN RIVRRIMDAV GLPVRGLVRT 
KFGPISLGDQ KPERMRPLNK EEVGAVYKSV GL