Gene Cphy_2789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_2789
Symbol
ID	5742104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	3394840
End bp	3395880
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	35%
IMG OID	641293880
Product	RluA family pseudouridine synthase
Protein accession	YP_001559888
Protein GI	160880920
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCATTA CTAATGGCCA TCTATATAAT ATAGTAAAGG ATGTTAATAA AGTGAGAGAA 
ATCACCATAG TACAAAATGA GGCAGGTCAA AGACTGGATA AGTTCTTAGC AAAATATCTT 
AATAAAGCGC CTAAGAGTTT TTTTTATAAA ATGCTTCGAA AGAAAAATAT TACCTTGAAT 
GGAAAAAAGG CAGAAGGAGC AGAAAAACTT ATAGAGGGGG ATATCGTTCG TCTTTTCCTA 
GCAGAGGAGA CAATAGAAAG CTTCAAAGAA TCTTATCAGC TTGATGCTAA GGTGAATCAA 
AGAGCTGTAA AACTAGATGT TTTATACGAA GATTCTCATG TAGTTATTAT TAATAAACCG 
ATTGGTATGT TATCACAACG TGCAAAAGAA TCCGATGTAT CATTGGTTGA GCTATTAATT 
GCTTATCTTT TAGAGATGGG GAGTTTGACA AAAGAGGAGT TATCGACATT TAAACCATCG 
GTATGCAATC GATTAGACCG AAATACCAGC GGGATAGTAA TTGCCGGTAA AAGCTTACTA 
GGACTTCAGG AGATGTCAGC AAAGCTACAG GATCGTAGTC TTCATAAATA TTATCGCTGT 
ATTGTCAAAG GAACGATGAC TAAGGGTGCT CGAATCAATG GATATCTGGC TAAAGACGAG 
AAGACGAATA AAGTAAGGAT TACTACGAAT GATCCTAACG ATGGTGAAAG TTCCTACATT 
GAGACTGAAT ATCAACCGAT ATTAAGTAAG AACGGATATA CACTCTTAGA GGTATTATTA 
ATCACCGGTA AGACTCATCA GATTCGTGCT CACTTAAGTA GCATTGGGCA TCCGATTATT 
GGTGATACGA AATATGGTGA TGAAACGCTG AATAAAAAAA TGCAAAAACA GTATGGCTTA 
AGTCATCAGT TACTTCACTC TTACCGATTA GAGTTTCCTA ATCTTCCTAA AGAGCTAGAG 
AAATTAAGTA ATCAAAAGAT AATAGCACCA TATCCTAAAT TATTCAAAAA CTTAGAGAAA 
AGTTTATTTA GCGATAACTA G

Protein sequence

MPITNGHLYN IVKDVNKVRE ITIVQNEAGQ RLDKFLAKYL NKAPKSFFYK MLRKKNITLN 
GKKAEGAEKL IEGDIVRLFL AEETIESFKE SYQLDAKVNQ RAVKLDVLYE DSHVVIINKP 
IGMLSQRAKE SDVSLVELLI AYLLEMGSLT KEELSTFKPS VCNRLDRNTS GIVIAGKSLL 
GLQEMSAKLQ DRSLHKYYRC IVKGTMTKGA RINGYLAKDE KTNKVRITTN DPNDGESSYI 
ETEYQPILSK NGYTLLEVLL ITGKTHQIRA HLSSIGHPII GDTKYGDETL NKKMQKQYGL 
SHQLLHSYRL EFPNLPKELE KLSNQKIIAP YPKLFKNLEK SLFSDN