Gene RSP_3543 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_3543
Symbol
ID	3721957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007494
Strand	+
Start bp	633384
End bp	634484
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	62%
IMG OID	640073207
Product	type I restriction-modification system restriction subunit
Protein accession	YP_355045
Protein GI	77465542
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTCGTC GTCACGGGCC TTTCGGGAAG CGGCAAGACG AAGGAAATTC GCGATCTGCT 
GCGCCGCTTC CAGGAAAGCG CGGCGGTCCT CCCGTCGGGC CAGCCGGCAC GGATCGTCGA 
GTGCATTCTC GATGCAAAGG GCGGCTGGAA GGACCTCAAC AGGAAGACCC TCAAGGCAAT 
GGGGTATCCG ATTTCGGACA GTTCACGACT GCGCCCAACC TCATGCGCGA GGGTACACGG 
GGTCAGGTAT CGCCGGTGGA ACGCGACGGC ATCTTCGGCG GCGATATAAA GCTAGAGGTC 
TCCGACCCGC ACCAGGTCTA TGCACTGCTT GCCCGGATGC AGGAGATGCA CATCCTCGAC 
CAAGGCGAGA TCGACCGGTT CGTGTCACGC TTCCTGCAAG CCAATCAGCG GGCCGATGAG 
CGGCCGGTGC TGGAAGGCAT CGTCCGGCAG ACAGTGGAGC GCTTCCGGAC GGCCCTGACC 
GAGGAGCAGC AGGAAGAGTT CCGGCAGCTG CTGGCTTCCT TCCTGCGGTT TTATGCCTTC 
ATCTCGCAGG TCATCGCCCT CGAGGACAGC GACCTCGAGA AGATGTACCT CTTCGGCAGC 
TGGCTGAAAC GCCTGCTTCC GTCGCGCGAG GCGCCGCAAG GCGGCGATGT CACCGACGAC 
ATGCTGGAGT TGCAGGCCTT CCGGCTCTCG GAAGGCGAGG TTGTCGATGC GTCGCTCGAA 
GCAACAGAGG CGAAGCCGCT GTCCCCGATC GACCGTTTCG GGGCGAACCC TTTTACTGAA 
GAAGAGCGGC GCACGCTTTC GGAAATCATC AAGGCGTTCA ACGACCGGCA CGCCACGAAC 
TTCACCGAAG AGGATTACAT CCGCTTCGAG GCAGTGAACG AGGCCATCCT CGACGACGAG 
GCTTGGGCCG AAATGCTGCG GAACAACCCG CCCGAGGTCG TGCGGCCCAG GTTCGGCGAG 
GAGTTCATGC GTAGGGCCAT TCTGGCGTTC CAACGCGACC GCCAGATGCA GAGCGCCTTC 
CTCCAAGATC GGGAAGGCCG GGAGATGATC ATGGGGCTGA TGTTCGGGCG AGCCGTGCGC 
GGAGCAAGAA AGTCAGCATA G

Protein sequence

MPRRHGPFGK RQDEGNSRSA APLPGKRGGP PVGPAGTDRR VHSRCKGRLE GPQQEDPQGN 
GVSDFGQFTT APNLMREGTR GQVSPVERDG IFGGDIKLEV SDPHQVYALL ARMQEMHILD 
QGEIDRFVSR FLQANQRADE RPVLEGIVRQ TVERFRTALT EEQQEEFRQL LASFLRFYAF 
ISQVIALEDS DLEKMYLFGS WLKRLLPSRE APQGGDVTDD MLELQAFRLS EGEVVDASLE 
ATEAKPLSPI DRFGANPFTE EERRTLSEII KAFNDRHATN FTEEDYIRFE AVNEAILDDE 
AWAEMLRNNP PEVVRPRFGE EFMRRAILAF QRDRQMQSAF LQDREGREMI MGLMFGRAVR 
GARKSA