Gene Cphamn1_1044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_1044
Symbol
ID	6374715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	1127202
End bp	1128242
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	51%
IMG OID	642683545
Product	pseudouridine synthase, RluA family
Protein accession	YP_001959466
Protein GI	189499996
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID	[TIGR00005] pseudouridine synthase, RluA family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAAC AGCAGGTAAA AAGCGAACAG GAAGAACAGG ACAGAGAACA TCAGGAACCG 
AAAAAAATGA CGCTTCAGGT TGCACAGACC CAGAAACCGA TGCGTATCGA TGTCTATCTC 
GCCCAGCAGG TTGAAAACGC CACCAGAAAC AAGGTTCAGG AAGCAATTTC GGAACACCGC 
GTACGGGTTA ACGGAAAAAC CGTCAAAGCC AATTACAAGA TAAAATCTCT CGATTCCATA 
GAGATCACCT TTCTCCGCCC TCCCGCACCG GAACTCGCTC CTGAAGATAT CCCCGTCGAC 
ATCATCTATG AGGACAACGA TCTTATGGTA ATCAATAAAG CTCCCGGCAT GGTGGTCCAT 
CCCGCATTCG GCAACTGGAC GGGAACGCTT GCCAACGCCA TCCTTCACCA TCTCGGCACG 
GATGCAGAAA AACTCGATAC AACGGAATTA CGTCCCGGCA TCGTTCACCG GCTGGACAAA 
AACACCTCGG GACTGATCAT TGTCGCCAAA CACGCTACGG CCCTGCACCG TCTGGCAAAA 
CAGTTCGCGG AGCGTCAGGT CGAAAAAAAA TATCAGGCGA TTGTCTGGGG CGTTCCGGAG 
CCTCCTGAAG GAATCGTCAA AACAAACATA GGCCGTTCGA TACGCGACCG TAAAGTAATG 
ACCTCCTACG ATTTTGAAGG AAAGGAAGGA AAAACAGCGG TAACAGAGTA CCGTGTAGTG 
GAAAACCTGC GCTATTTCTC ACTTGTCGAG ATGATCCTCC ACACAGGCCG AACGCATCAG 
ATCAGAGTTC ACCTCAAACA TATAAACGCG CCTATTCTCG GAGACGAAAC CTATGGAGGG 
GCCGGAGTAC AGTCCCTTCC CTTCAGCAAA AGCGAAAGCT TCGTCAAGAA CCTCCTGGAG 
CGTATCCCGC GCCAGGCGCT CCACGCCGCG AGCCTGAGCT TTTTCCAGCC CACAACCCGA 
GAAAGGATTA CCCTGTCAGC CCCACAGCCG GAAGATATGC AGGCGGCACT GGATAAGATT 
AAAAGAATGT TGAACTGTTG A

Protein sequence

MQKQQVKSEQ EEQDREHQEP KKMTLQVAQT QKPMRIDVYL AQQVENATRN KVQEAISEHR 
VRVNGKTVKA NYKIKSLDSI EITFLRPPAP ELAPEDIPVD IIYEDNDLMV INKAPGMVVH 
PAFGNWTGTL ANAILHHLGT DAEKLDTTEL RPGIVHRLDK NTSGLIIVAK HATALHRLAK 
QFAERQVEKK YQAIVWGVPE PPEGIVKTNI GRSIRDRKVM TSYDFEGKEG KTAVTEYRVV 
ENLRYFSLVE MILHTGRTHQ IRVHLKHINA PILGDETYGG AGVQSLPFSK SESFVKNLLE 
RIPRQALHAA SLSFFQPTTR ERITLSAPQP EDMQAALDKI KRMLNC