Gene Rsph17025_0137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_0137
Symbol
ID	5082545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	138783
End bp	140543
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	70%
IMG OID	640481692
Product	peptidase U35, phage prohead HK97
Protein accession	YP_001166353
Protein GI	146276194
COG category
COG ID
TIGRFAM ID	[TIGR01543] phage prohead protease, HK97 family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACCCTGC ACCTTCGCGC GGCGACCCCG CGCCCCTCGA CGCTCGACCC CGAGGCCCGC 
ACGATTGAAG CCATCGTCTC GACCGGCGCC GATGCCCCGC GCGCGGGCTT CGTGGAACGC 
CTCGACTTGC GCGGCGTGGA TCTGTCGCGC CTCATCGGTG CGCCCGTTCT GGACGCGCAC 
CGCGCCGCCT CGACCCGCGA CCAGCTCGGC GTGGTCGAAG CCGCTGAGCT GCGCCCCGAA 
GGGCTGTGGG TGCGGATGCG CTTCCGTAGC AACGACGCCG CCCAGGCGGT GCTGGCCGAT 
ATCGGCGACG GCACCCTGCG CGGCCTGTCC ATCGGCTACA GCGTGGCCGA GTGGAAAGAC 
ATGCGGGACG GCAACCGCCG CATCCGCACC GCAACACGAT GGACGCCCTT GGAAGTGTCC 
ATCGTCCCGG TCCCGGCCGA CTCCGGGGCA CACTTCCGCA ACGGAGAAAT GGAAATGCCG 
CAGACGCAGC AAGATGCCGG GCATGCGCCC GCCGCTGGCG TGGTCCTGAC CCGCGCCGAG 
ATCAACGCCG AAATCCGCAC CATCGCCGAG ACGGCGGGCC TTACCCGCTC CTGGGCGGAT 
GCGCAGATCG ACGCCGAGGC CACGGCCGAG GATGCCCGCG CCGCCGCCTT CGAGGCCATG 
CGCACCCGCA GCGCGCAGAC CGCGCCGCGC ACGAGCCGCG CCTCGATCAC CTTCGACCAC 
ACCGACCCGG CCGTGGTGGT TCAGCGTGCC GGCGAAGCGC TCTTTGCGCG CTCGCACCCG 
GAACACGCCC TGTCCGAGGC CGCGCGGCCC TATGCGCACA TGACCACAGT GGACCTTGCG 
CGGGACTGCC TGCACCGCTC GGGCCTGTCC TGCACGGGCC TCGCGTCCGA GGGGATCATT 
ACCCGCGCGC TGCACACCAC GTCCGACTTC CCGCTGATCC TCGGCGATGC GGTCGGGCGC 
GAGCTGCGCA CCGCCTACTC GGCCGCGCCG GCCGGGATCT TCCAGCTTGC GCGCCAAACC 
ACGGTGCGCG ACTTCCGCGC CAAGAACGCG ATCCAGTTCG GCGGCCAGCC GGATCTGGAG 
AAGGTGAACG AGAGCGGCGA GTTCAAGCAC GGCACCTTCG AGGAATCGGC CGAGAGCTAC 
AGCATCGCGA CCTTCGGCAA GATCTTCGCC ATTTCGCGGC AGGCGCTGGT GAACGACAAC 
CTGGGCGCCT TCACGTCCGT TCCGGCCCGC CTGGGCGCCT CGGCCCGCGC CTTCGAGGCG 
GCGCAGCTCG TCGCGAAGCT GACTGCCAAT CCGGTCATGA GCGACGGCGT GGCCGTGTTC 
CATGCCGACC ACAAGAACCT GTCGGCCGAG GCTATCATCA ACGCCACGTC GCTCGCGACG 
GCCCGCATCG CGATGCGCCG TCAGACCGGC CTGACTTCCG AGCTGGTCGC TGTGACGCCG 
CGTTTCGTCG TGGTGCCGCC CGAACTGGAA CTTGCTGCGG AACGGATGCT GACCGAGATC 
CAGGCGGCGA CCGTTGCGGA GGTCAACCCG TTCTCGAACC TGTCGCTGGT GGTTGAGCCC 
CGCCTGACCA ACGCGGCGCA GTGGTATGTC GCGGCCGATC CGGCATCTAT CGACGGCCTC 
GAATACGCAT ATCTCGAAGG CGCCCCCGGC CCGCAGATCG AGAGCAAGGC GGGCTTCGAG 
GTGGACGGCG TGCAGATCAA GGTGCGCCTC GACTTTGGCT GCGGCTGGAT CGACCACCGC 
GGCTGGCACC GCGTCGGCTG A

Protein sequence

MTLHLRAATP RPSTLDPEAR TIEAIVSTGA DAPRAGFVER LDLRGVDLSR LIGAPVLDAH 
RAASTRDQLG VVEAAELRPE GLWVRMRFRS NDAAQAVLAD IGDGTLRGLS IGYSVAEWKD 
MRDGNRRIRT ATRWTPLEVS IVPVPADSGA HFRNGEMEMP QTQQDAGHAP AAGVVLTRAE 
INAEIRTIAE TAGLTRSWAD AQIDAEATAE DARAAAFEAM RTRSAQTAPR TSRASITFDH 
TDPAVVVQRA GEALFARSHP EHALSEAARP YAHMTTVDLA RDCLHRSGLS CTGLASEGII 
TRALHTTSDF PLILGDAVGR ELRTAYSAAP AGIFQLARQT TVRDFRAKNA IQFGGQPDLE 
KVNESGEFKH GTFEESAESY SIATFGKIFA ISRQALVNDN LGAFTSVPAR LGASARAFEA 
AQLVAKLTAN PVMSDGVAVF HADHKNLSAE AIINATSLAT ARIAMRRQTG LTSELVAVTP 
RFVVVPPELE LAAERMLTEI QAATVAEVNP FSNLSLVVEP RLTNAAQWYV AADPASIDGL 
EYAYLEGAPG PQIESKAGFE VDGVQIKVRL DFGCGWIDHR GWHRVG