Gene Daro_3468 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3468
Symbol
ID	3567336
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3717609
End bp	3718748
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	63%
IMG OID	637681940
Product	pseudouridine synthase, Rsu
Protein accession	YP_286667
Protein GI	71909080
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1187] 16S rRNA uridine-516 pseudouridylate synthase and related pseudouridylate synthases
TIGRFAM ID	[TIGR00093] pseudouridine synthase

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	0.242566
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.43397
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGATA ACGCCGGTCA AGACGATCCC TGGGCCAAAT GGCGCAAGCC GGAAGTCCCC 
GCTGCGGTCG AGGCTGAAAC CAAGCCGAAA GCCAAACCGG TTGAAGCGGT AGAGGCTGCG 
GCGCCGAGCG AGGCTGCAGT CAAGCCGGAA GGAACCCTGG GGGTACGGAA GTCGGCGACG 
GTAGCCGAGC GTCCGGGTCA CCGCAAGCCG ATCCGGGGTG GTGCCGTGCC GAAGCGGACG 
ACCATGGCGG ACAAGGTGGC GATCGCCGAG CGCTTGGCAG ACAAGCCGGC GCGATCGGCG 
ACTGCCAAGA CGCGCGCTGA TGCGCCACGT GAAAATCCGT GGAAGAAGGC CGCGCCTGTA 
CCTCCGTCAC GAACCCCCGC GGTGGCCGCG AAGCCGCCTG GGCCAAGCCC GGAAGGCGTC 
CGGCTTTCCA AGGTGATGTC CGAGCGCGGC ATGTGTTCGC GCCGCGAGGC CGATCTGTGG 
ATTGAGCGTG GCTGGGTGTT TGTCAATGGC GAGCAGGTCA GCGAGCTGGG TTCGCGGATC 
GACCCATCGG TATCCGAGAT CACCGTTTCG CAGGAAGCCA AGAAGGATCA GGCCAAGGCG 
GTCACCATTC TGCTGCACAA GCCGGTCGGT TATGTGTCCG GACAGCCCGA GCCGGGTTGT 
ATTCCGGCGG TGACCTTGAT TACGGCGGAA ACGCAGGTCG AGCAATCGGG TGGTCCGGAA 
TTCAAGCCGT GGATGTTGCG TGGTCTGGCG CCGGCCGGTC GCTTGGACAT CGATTCGACC 
GGCTTGCTGG TGTTGACCAG CGATGGTCGT GTCGCCAAGC GCCTGATTGG CGAGGATAGC 
GAGGCAGAGA AGGAATATCT GGTTCGTGTT TCCGGCGAAA TGATCAAGGG TGGTCTGGAC 
TTGCTGCGCC ATGGTTTGGA ACTTGATGGC AAGCCGTTGA AGCCGGCTTG GGTCAAGCAG 
TTGAACGAAG ACCAGTTGCA CATCATCCTG AAGGAAGGCA AGAAGCGCCA GATTCGCCGC 
ATGTGCGAAC TGGTTGGTTT GCAAGTGATC GGCCTGAAGC GGGTGCGCAT CGGGCGGATC 
AGGCTGGGCG ATTTGCCGAT GGGGCAATGG CGCTTCCTGC GGGCTGACGA GGCGTTCTGA

Protein sequence

MSDNAGQDDP WAKWRKPEVP AAVEAETKPK AKPVEAVEAA APSEAAVKPE GTLGVRKSAT 
VAERPGHRKP IRGGAVPKRT TMADKVAIAE RLADKPARSA TAKTRADAPR ENPWKKAAPV 
PPSRTPAVAA KPPGPSPEGV RLSKVMSERG MCSRREADLW IERGWVFVNG EQVSELGSRI 
DPSVSEITVS QEAKKDQAKA VTILLHKPVG YVSGQPEPGC IPAVTLITAE TQVEQSGGPE 
FKPWMLRGLA PAGRLDIDST GLLVLTSDGR VAKRLIGEDS EAEKEYLVRV SGEMIKGGLD 
LLRHGLELDG KPLKPAWVKQ LNEDQLHIIL KEGKKRQIRR MCELVGLQVI GLKRVRIGRI 
RLGDLPMGQW RFLRADEAF