Gene Rsph17025_1075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1075
Symbol
ID	5083367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	1103575
End bp	1104741
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	68%
IMG OID	640482633
Product	HK97 family phage portal protein
Protein accession	YP_001167281
Protein GI	146277122
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.529897
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.723665
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTTCG ACTTCCTGAG GAAAAAGGCC GAGCCGCCCG AGCGGAAGGC CTCGGCCACC 
GGCCCGCTGG TGGGCTGGAG CACGGGGCGC GTGGCCTGGA GCCCGCGGGA TACCGTGTCG 
CTGACCCGCA ACGGGTTTCT CGGCAACCCG ATCGCCTTCC GTTCGGTCAA GCTGATCTCG 
GAGGCGGCGG CGGCGCTTCC GCTTCTGCTG CAGGATCACG AGCGGCGCTA TGACAGCCAC 
CCGATCCTGG AGCTGATCGC CCGTCCGAAC CCGCTTCAGG GCCGGGCGGA ACTGCTGGAG 
GCGGTCTATG GGCAACTGCT GCTGACCGGC AACGCCTATC TGGAGGCGGT GGCGGGTCTG 
TCGCGGCTGC CGGGCGAGTT GCATCTGTTG CGGTCGGACC GGATGAGCCT TGTGCCGGGG 
CCGGATGGAT GGCCGGTGGC CTACGATTAT GCGGTGGGGG GGCGTCGCAT CCGGTTTGAC 
ATGACCGGGA CGATGCCGAT CTGCCATATC CGCACCTTCC ATCCACAGGA TGACCACTAC 
GGCTTTTCGC CGCTTCAGGC GGCGGCGGTG GCGCTGGATG TGCATGTCTC GGCCTCGGCC 
TGGTCGAAGG CGCTGCTGGA CAATGCCGCG CGCCCCTCGG GCGCCATCAT CTACAGGGGT 
GTGGACGGGC AGGGCGCGCT TTCCGCCGAG CAATATGACC GGCTGGTGAG CGAGATCGAG 
GTGAACCATC AGGGAGCGCG CAACGCCGGC CGGCCCATGT TGCTGGAAGG GGGGCTCGAC 
TGGAAGCCGA TGGGCTTCTC GCCTTCGGAC ATGGAGTTTC ACACCACCAA GGAGGCGGCC 
GCGCGCGAGA TCGCCATTGC CTTCGGCGTG CCGCCGATGC TGCTCGGCAT ACCCGGCGAG 
GCGACCTACG CGAATTATCA GGAGGCCCAC CGCGCCTTCT ATCGGCTGAC GGTGCTGCCT 
CTGGCGGCAC GGGTCACGGC GGCGATCTCG CACTGGTTGG CCGGCTTCAC CGGAGAGGCG 
GTGGAGCTTC GCCCGGATCT CGATCAGGTG CCGGCGCTGG CGGCCGAGCG GGATCAGCAA 
TGGGCGCGGG TTTCGGACGC GGGTTTCCTG ACCGAGGCGG AGAAGCGGAT GCTGCTGGGG 
CTGCCACGGA TCGCGGAGGA CGAATGA

Protein sequence

MLFDFLRKKA EPPERKASAT GPLVGWSTGR VAWSPRDTVS LTRNGFLGNP IAFRSVKLIS 
EAAAALPLLL QDHERRYDSH PILELIARPN PLQGRAELLE AVYGQLLLTG NAYLEAVAGL 
SRLPGELHLL RSDRMSLVPG PDGWPVAYDY AVGGRRIRFD MTGTMPICHI RTFHPQDDHY 
GFSPLQAAAV ALDVHVSASA WSKALLDNAA RPSGAIIYRG VDGQGALSAE QYDRLVSEIE 
VNHQGARNAG RPMLLEGGLD WKPMGFSPSD MEFHTTKEAA AREIAIAFGV PPMLLGIPGE 
ATYANYQEAH RAFYRLTVLP LAARVTAAIS HWLAGFTGEA VELRPDLDQV PALAAERDQQ 
WARVSDAGFL TEAEKRMLLG LPRIAEDE