Gene Rsph17029_1130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1130
Symbol
ID	4895275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	1175113
End bp	1176285
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	70%
IMG OID	640111716
Product	HK97 family phage portal protein
Protein accession	YP_001043012
Protein GI	126461898
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.868122
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.923959
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTTCG ACTTCCTGAG GAAACCGGCG CGCGCTCCGG CGCCCGAGCG CAAGGCCTCG 
GCCACGGGGC CGGTGGTGGG CTGGAGCACG GGGCGCGTGG CCTGGAGCGC GCGGGACATG 
GTGTCGCTGA CCCGGAACGG GTTTCTGGGC AATCCGATCG CCTTCCGGTC GGTCAAGCTG 
ATCTCGGAGG CGGCGGCCGC GCTGCCTCTG GTTCTGCAGG ATGCGGGGCG GCGCTACGAG 
AGCCACCCGA TGCTGGATCT GATCGCGCGG CCGAACCCGT TGCAGGGGCG GGCCGAGCTG 
CTCGAGGCGC TCTATGCGCA GCTTCTGCTG ACGGGGAATG CCTATCTCGA GGCGGTGGCC 
GGATCGGCGC GGCTGCCCGG AGAGCTGCAT CTCCTGCGCT CGGACCGGAT GAGCCTCGTG 
CCGGGGCCGG ACGGGTGGCC CGTGGCCTAC GATTATGCGG TGGGCGGGCG GCGCATCCGC 
TTCGACATGA CGGCGGGCCT GCCGATCTGC CATATTCGCA CCTTCCATCC GCAGGACGAT 
CATTACGGCT TCTCGCCGTT GCAGGCGGCG GCGGTGGCGC TCGACGTGCA TGTGGCGGCT 
TCGGCCTGGT CGAAGGCCTT GCTCGACAAT GCCGCCCGGC CCTCGGGGGC CATCGTCTAT 
CGCGGCTCGG ACGGGCAGGG AAGCCTGTCC TCGGATCAGT ATGACCGGCT GGTGGGCGAG 
ATCGAGGCCA ACCATCAGGG TGCGCGCAAT GCGGGGCGGC CGATGCTGCT GGAGGGCGGG 
CTCGACTGGA AGCCGATGGG CTTCTCGCCC TCCGACATGG AGTTCCACAC CACCAAGGAG 
GCTGCGGCGC GCGAGATCGC CATCGCCTTC GGCGTGCCGC CGATGCTGCT CGGCATCCCC 
GGCGAGGCGA CCTACGCCAA TTATCAGGAG GCGCACCGGG CCTTCTACCG GCTGACGGTG 
CTGCCGCTGG CGGCGAAGGT CACGGCCACG TTGTCGCACT GGCTCGGCAG TTTCAGCGGC 
GAGGCGGTGG AGCTGCGGCC CGACCTCGAT CAGGTGCCGG CGCTGGCGGC GGAACGGGAT 
CAGCAGTGGG CGCGCGTCGC CGCGGCGGAT TTCCTGACGG AGGCCGAGAA GCGGACGCTC 
CTCGGCCTGC CGAGGATCGC GGAGGAGGAG TGA

Protein sequence

MLFDFLRKPA RAPAPERKAS ATGPVVGWST GRVAWSARDM VSLTRNGFLG NPIAFRSVKL 
ISEAAAALPL VLQDAGRRYE SHPMLDLIAR PNPLQGRAEL LEALYAQLLL TGNAYLEAVA 
GSARLPGELH LLRSDRMSLV PGPDGWPVAY DYAVGGRRIR FDMTAGLPIC HIRTFHPQDD 
HYGFSPLQAA AVALDVHVAA SAWSKALLDN AARPSGAIVY RGSDGQGSLS SDQYDRLVGE 
IEANHQGARN AGRPMLLEGG LDWKPMGFSP SDMEFHTTKE AAAREIAIAF GVPPMLLGIP 
GEATYANYQE AHRAFYRLTV LPLAAKVTAT LSHWLGSFSG EAVELRPDLD QVPALAAERD 
QQWARVAAAD FLTEAEKRTL LGLPRIAEEE