Gene Rsph17029_1077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1077
Symbol
ID	4896655
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	1112074
End bp	1113225
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	72%
IMG OID	640111664
Product	putative mRNA 3-end processing factor
Protein accession	YP_001042960
Protein GI	126461846
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1236] Predicted exonuclease of the beta-lactamase fold involved in RNA processing
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGCG ACCCCCTTCT GACCTTCACC GACCGCGGGA TCTTCTGCCC CGCGGGCGAT 
TTCTACATTG ACCCGTGGCG GCCGGTGGAG CGTGCGCTCA TCACCCACGG CCATTCGGAC 
CATGCCCGAT CCGGCCACGG CGCCTATCTG GCGACGGAGG GCTCGGCCCC GGTGATCCGC 
TACCGGCTGG GCGACATCCG CCTCAAGACG ATCCGCTACG GCGAGACCCG GCGGATCGGC 
GGCGTCACGG TCTCGTTCCA TCCGGCGGGT CATGTGCCGG GCTCGGCGCA GATCCGTGTC 
GAGCGGAACG GCGAGGTCTG GGTGGTCTCG GGCGATTACA AGGTGGCCGA GGACGGGCTG 
TCGGAGCCTT TCGAGCCGGT CACCTGCCAC AGCTTCATTT CGGAATGTAC CTTCGGCCTG 
CCGGTCTTCC GCTGGAAGCC GCAGGCCGAG CTCGCGGCCC AGCTGAACCG CTGGTGGGCG 
GCGAATGCCG CCGAGGGGCG CACGTCGATC GTGGGCGCCT ATACGCTCGG CAAGGCGCAG 
CGGCTTCTGG TCTCGGCCGA TCTCTCCATC GGCCCGATCC TGACCCATGG TGCGGTCGAG 
GCCACCACCG CCGTCCTGCG CGAGCAGGGG CTGGCGCTGC CGCCCACCAC CTATGTGGCG 
CCCGGCATCG ACGGCACGTC GCACCCGGGG GCACTGGTGA TCGCGCCGCC CTCGGCGCTG 
GGCACCCCCT GGGCCACGCG CTTCGGCCCC TCGGCCGAGG CCTTCGCCTC GGGCTGGATG 
GCGCTGCGCG GCGTCCGCCG CCGACGCGGC CTCGCGCAGG GCTTCGTCAT GTCCGACCAT 
GCCGACTGGG ACGGGCTCAA TGCCGCGATC CGCGCCACGG GGGCCGAGCG GATCTTCGTC 
ACCCACGGCT ATACCGCGAT CTTCCGCCGC TGGCTCGAGG ATCAGGGGTT CGAAGCGGGC 
ATCGTCGCCA CGGAATATGA GGGCGAGAGC CTCGATGCGG CCGAAGCCGA GGCGGGTCCG 
CTGATCGAGC CCGACGCGGG CGCAGATGCC GTGGCCGAGG AGGACGGGAC GGCAGCCGAT 
CCGGCCACGG ACGGGTCGGA GCCCGCCGAG GGCAAGCGCA GGCGCCCGGC AGCGGGGGAC 
GCCCGGACAT GA

Protein sequence

MARDPLLTFT DRGIFCPAGD FYIDPWRPVE RALITHGHSD HARSGHGAYL ATEGSAPVIR 
YRLGDIRLKT IRYGETRRIG GVTVSFHPAG HVPGSAQIRV ERNGEVWVVS GDYKVAEDGL 
SEPFEPVTCH SFISECTFGL PVFRWKPQAE LAAQLNRWWA ANAAEGRTSI VGAYTLGKAQ 
RLLVSADLSI GPILTHGAVE ATTAVLREQG LALPPTTYVA PGIDGTSHPG ALVIAPPSAL 
GTPWATRFGP SAEAFASGWM ALRGVRRRRG LAQGFVMSDH ADWDGLNAAI RATGAERIFV 
THGYTAIFRR WLEDQGFEAG IVATEYEGES LDAAEAEAGP LIEPDAGADA VAEEDGTAAD 
PATDGSEPAE GKRRRPAAGD ART