Gene RSP_1645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_1645
Symbol
ID	3718502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	238152
End bp	239486
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	73%
IMG OID	640069798
Product	putative phage-related protein
Protein accession	YP_351691
Protein GI	77462187
COG category	[R] General function prediction only
COG ID	[COG4653] Predicted phage phi-C31 gp36 major capsid-like protein
TIGRFAM ID	[TIGR01554] phage major capsid protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACGAC AGAATCTCGA CGACCTGCGC CGCGCCCGGA AGGCCGCGGC CGACACGATG 
GCCGCGGTGG CCGCCCGCAT CGGCGCGCTC GAGGCGGCAG AGACACCGGA CGCCGCCGCG 
CTCGAGGCCG AGACCGCGGC CTTTGCCGCC GCCGAAGCCG CCTTCGCCAG GGCCGATGCC 
GCCGTGACGC GCGCGGCCGC TGTGGAGGCC GCGCAGGCGG CTGCAGCTCA GGGCGACGGT 
GCGGGCGGCG GGAGTGGAAC GGGTGCCGCC GGCACTGACG CCGTGCCGGC GGTGGCCACC 
GATCCGGCGC ATCGCGGGGT GGCAGCGGGC TTCATGGTCC AGGCGCTCGC GCGCACGAAG 
GGCGACCGGG ACAAGGCCGC CCGTCTCCTC GAAGCCGAGG GCCATGGCGC GATCTCGGCC 
GCGCTCTCGG GCGCGAGCGA AGGCGCGGGC GGCGTCACCA TCCCCCGTCC CCAGGCGGCC 
GAGCTGATCG AGATGCTGCG CGCCCGGGTC GTCGTGCGCG CCTCGGGCGC CCGCACCCTG 
CCGATGCCCG CGGGCGAGAT GCGGCACGCC AAGCAGGTGG GCTCGGCGGT CGCCGCCTAT 
GCCGCCGAGA ATGCCGCCAT CGCGCCGAGC CAGCCCAGCT TCGACAAGAT CGACCAGAGC 
TTCAAGAAGC TCGTCGGCAT GGTGCCCATC GGCAACTCGC TCCTGCGGCA CTCGGGCGTG 
GCGATGGCGC AGCTCGTGCG CGACGATCTC CTGAAGGTCA TGGCGCTCCG CGAGGATCTG 
GCCTTCCTGC GCGGCGACGG CAGCGCCGAC ACGCCGAAGG GTCTGCGTCA CTGGATGCTG 
CCCGCGAACT GGTCCGCCGC ACCGGTCGCG GCCACGCCGG CGGCGGCCGA GGCGGCGATC 
CGGCGGGCGG TCTCGCTCGT GGAGGATGCC GACGTGGGCA TGGTCTCGCC CGGCTGGATC 
ATGCGGGCCT CGACGAAGAA CTGGCTCGCG AGCCTGAAGG ACGCGAACGG CAACCCGCTC 
TTTCCCTCCA TCGGCGCGTC GGCCCAGCTC ATGGGCTTCC CGATCCGCAC GAGCTCGCAG 
ATCCCCGACA ACTTGGGCGC GGGCGGCGAC GAGACCGAGA TCTACTTCGG CGACTTCGAC 
GAGGCGATGA TCGGCGACAG CATGGCGCTG GTGGTGGGCT CCTCCACCGA CGCCTCCTTC 
GTCGACGGCA ACGGGGCGAC CGTCTCGGCC TTCCAGAACG ACCTCACGCT GATGCGGGCG 
ATCTCCGAGC ACGACTTCGC GCCGGCGCAT GACGAGGCCT TTGCCGGCTT CAACGCCTCG 
GGCTGGACGC TCTGA

Protein sequence

MARQNLDDLR RARKAAADTM AAVAARIGAL EAAETPDAAA LEAETAAFAA AEAAFARADA 
AVTRAAAVEA AQAAAAQGDG AGGGSGTGAA GTDAVPAVAT DPAHRGVAAG FMVQALARTK 
GDRDKAARLL EAEGHGAISA ALSGASEGAG GVTIPRPQAA ELIEMLRARV VVRASGARTL 
PMPAGEMRHA KQVGSAVAAY AAENAAIAPS QPSFDKIDQS FKKLVGMVPI GNSLLRHSGV 
AMAQLVRDDL LKVMALREDL AFLRGDGSAD TPKGLRHWML PANWSAAPVA ATPAAAEAAI 
RRAVSLVEDA DVGMVSPGWI MRASTKNWLA SLKDANGNPL FPSIGASAQL MGFPIRTSSQ 
IPDNLGAGGD ETEIYFGDFD EAMIGDSMAL VVGSSTDASF VDGNGATVSA FQNDLTLMRA 
ISEHDFAPAH DEAFAGFNAS GWTL