Gene Daro_2455 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_2455
Symbol
ID	3568228
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	2656524
End bp	2657546
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	60%
IMG OID	637680923
Product	ribosomal large subunit pseudouridine synthase B
Protein accession	YP_285660
Protein GI	71908073
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1187] 16S rRNA uridine-516 pseudouridylate synthase and related pseudouridylate synthases
TIGRFAM ID	[TIGR00093] pseudouridine synthase

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	0.155456
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAATA AACGCACACC ATTCCGTCAA TCGTCGAACA AATCCGAGGG GGCTGCCGAG 
CGCCGACCGG AAGATGCAGG TCCACGTGTC GGCGCACCGT CGCGTGGACG CGCGGCCGCG 
CAGCGTGACC AGGTGCCAGG CGATGCTCAG GGGGCGAAAC CTGCGCCGCG CAGAAAGCCG 
GCACCCAATA CCGGCGGAAG AGCCAATCGT GGTAGCGTCG CCCGCGACGG ACGGCCGCTT 
GCTGAGGCCA AGCCAGTGCG TTTGCAGAAG GTGCTGGCCG AGGCTGGTGT CGGTTCGCGT 
CGCGAAATGG AAGAGTGGAT TGCTGCAGGC AAGGTCAGCG TCAATGGCGT CGTGGCGACT 
GTAGGGCAAT CGGTTGTGAA TTCCGACAAG GTCAAAATTG GTGGCCGCCT GATCAATATC 
CGCTTTACGG GCAGTTCTCG TCCGCCGCGC GTCTTGATGT ATCACAAGCC GGAAGGCGAA 
ATCGTTTCGC GCGACGACCC GGATGGTCGG CCGTCGGTGT TTGCTGCGCT GCCACGGATG 
CGCGGTGGGC GGTGGATCAA TGTCGGTCGC CTCGACTTCA ATACCTCGGG TTTGCTGTTA 
TTCACTACTT CTGGTGAGCT GGCCAACAAA CTGATGCATC CGAGTTCGGA ACTGGTTCGC 
GAGTACGCCG TGCGTGTTCT TGGTGAACTG ACCCTGGATG CACAACAGAA GCTGTTGCAC 
GGCGTCGAAC TGGAAGATGG TCGAGCGAAC TTTGGTTCGC TACACGACGG TGGTGGCGAG 
GGGGCGAACC ACTGGTACCG AGTAACGATC TCCGAGGGGC GTAACCGTGA GGTCCGTCGC 
ATGTTCGAGG CGGTCGGTTG CACGGTCAGC CGATTGATTC GCGTTCGCTA TGGCCCGTTC 
ATCCTGCCGC CGCAACTGAA ACGAGGTATG GCCCGCGAGT TGAAAGAGGC GGAAATCAAA 
ATGCTGATGC GAGAACTCGA AAACATGCCA TCGTCTCAGC GAAAAGGCCC TGAAGGCACG 
TAA

Protein sequence

MKNKRTPFRQ SSNKSEGAAE RRPEDAGPRV GAPSRGRAAA QRDQVPGDAQ GAKPAPRRKP 
APNTGGRANR GSVARDGRPL AEAKPVRLQK VLAEAGVGSR REMEEWIAAG KVSVNGVVAT 
VGQSVVNSDK VKIGGRLINI RFTGSSRPPR VLMYHKPEGE IVSRDDPDGR PSVFAALPRM 
RGGRWINVGR LDFNTSGLLL FTTSGELANK LMHPSSELVR EYAVRVLGEL TLDAQQKLLH 
GVELEDGRAN FGSLHDGGGE GANHWYRVTI SEGRNREVRR MFEAVGCTVS RLIRVRYGPF 
ILPPQLKRGM ARELKEAEIK MLMRELENMP SSQRKGPEGT