Gene CPF_2104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2104
Symbol
ID	4203246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2336001
End bp	2336921
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	32%
IMG OID	638082969
Product	RluA family pseudouridine synthase
Protein accession	YP_696533
Protein GI	110801362
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTTAA GTAAAGAAGT AATAAAAATA ACTGAAGAAG AAAAAGGAAT AAGAGCAGAT 
AAATTTTTAG CTCTTAAAAT AGATGGAGTT TCAAGAAACT TTATTCAAGG GCTTTTTGAT 
GATGGAAAAA TTTTAATTAA TGGAAAAGCA GAAAAGGGAA AATATAAGCT TTCAGTTGGA 
GATTGCGTTG AGGTAGAAAT ACCAGAACCA GAGGAATTAA AAGTTGAAGC TGAGGATATC 
CCATTAAATA TAGTTTATGA AGATGAAGAT GTAATAGTAG TTAATAAACC AAAGGGAATG 
GTAGTTCATC CTGCACCGGG AAATTATACT GGAACTTTAG TTAATGCATT ATTACATCAT 
TGTGATGATT TATCAGGAAT AAACGGGGTT ATAAGACCTG GAATAGTACA CAGAATAGAT 
AAAGATACTT CTGGAATATT AGTTGTTGCA AAAAATGATA ATGCTCATCA AAAACTAGCA 
GAACAATTTA AAGATCATAG CATAAAGAGA GAATACTATG CTATTGTTGA GGGAAGATTT 
AAAAAAGAAG GTGGCACAAT TGATGCACCT TTAGGAAGAC ACCATAGAGA TAGATTAAAG 
TATGCTGTGG TTAAAGATGG AAAGAGAGCA GTTACTCATT ATGAAGTTCT TAAAGTATTT 
AATTCATGTT CCCTTGTTAA ATGTACTTTA GAAACAGGAA GAACACATCA GATAAGAGTT 
CATATGGCCT TTATAGGGCA TCCATTACTT GGAGATACTG TTTATGGCTT AAAGAAACAA 
AAGAAATTAA GTCAAGAGGG GCAAGTTCTT CATGCTAAAA CATTAGGATT TATTCATCCT 
ACTACTGGAG AATATGTTGA ATTTGACTCA GAATTGCCAG AGTACTTTGA AAAAATTGTA 
GAGAAATTAG GAGGGTGTTA G

Protein sequence

MSLSKEVIKI TEEEKGIRAD KFLALKIDGV SRNFIQGLFD DGKILINGKA EKGKYKLSVG 
DCVEVEIPEP EELKVEAEDI PLNIVYEDED VIVVNKPKGM VVHPAPGNYT GTLVNALLHH 
CDDLSGINGV IRPGIVHRID KDTSGILVVA KNDNAHQKLA EQFKDHSIKR EYYAIVEGRF 
KKEGGTIDAP LGRHHRDRLK YAVVKDGKRA VTHYEVLKVF NSCSLVKCTL ETGRTHQIRV 
HMAFIGHPLL GDTVYGLKKQ KKLSQEGQVL HAKTLGFIHP TTGEYVEFDS ELPEYFEKIV 
EKLGGC