Gene RSP_2998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_2998
Symbol
ID	3720249
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	1694748
End bp	1696334
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	49%
IMG OID	640071192
Product	putative terminase large subunit
Protein accession	YP_353065
Protein GI	77463561
COG category	[R] General function prediction only
COG ID	[COG4626] Phage terminase-like protein, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.353099
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGATGA GTGATCAATC TTTACCCGTT CTCTCGTCCG CTCAACCCGT CATTCCGCCT 
AAGCCGAAAC TGTCTAGGGC AGAAAAGAAT ATCAAGTGGA TTGAGTCGAA CCTGTTTATT 
CCAGAAGGTA AGGACGTTGG TAAGCCATTC AGGCTTGTGG ACTTTCAGAA GGATATCATT 
CGTTCGATCT ATGACAATCC GGCTGGAACT CGTCGGGCTA TTATTTCGAT GCCCCGTAAG 
GCTGCGAAGA CAACGCTCTG TGCCGCTCTG ATGCTGTTGC ATCTGGTAGG TCGAGAAGCC 
TTGCCCAACT CGCAACTATA CAGTGCAGCC CGAAGCAGGG ATCAAGCTGC GGAGTTGTTC 
AAACTGGCAG TCAAGATGAT CAGGATGAGT CCGCGTATAT CGCGTTTTGT TCGGATTGTG 
GAGACTAGTA AGCGGCTGAA GGTGCCCGAG CTAGGGACAG AGTATAGGGC TCTCTCCAAG 
GATGCTGGAA CGGCTCAAGG GCTGAGTCCG TGCCTCGTGA TCCACGATGA GCTAGGGCAG 
GTGAGAGGGC CAGTAGATCC GCTCTACGAA GCCTTGGAGC TTGCCACTGC GGCTCAGGCA 
AACCCGCTTA CCCTCGTGAT CTCTACGCAG GCTCCGACTG ACAATGACCT TCTTAGTCAG 
TTGATCGATG ACGCCGCAAC CGGGGCAGAT CCGACCAAGG TTCTTAAGCT CTATTCGTGT 
CCGATGAATA TCGATCCGTT CTCAGAAGAA GCCCTAGCTG TCTCGCATCC TGCATGGAAT 
TCCTTTGTGA ACCGCAAGGA ACTCAAGCAA ATGCAGGCCG AGGCCGCACG GATGCCTGCC 
CGTGCTGCGG ATTTCCGCAA CTACACCCTC AACCAGAGGA TCGAAGTCAA CGCTCCATTC 
ATTTCAAAAG ATGTTTGGGA TGAAGGCAAG GATAATCCCG AAGAATGGCA TGGAAAGGAT 
GTTTGGCTTG GCCTTGATCT ATCTGAAACC CGAGATCTCA CTTCTCTTAC TTTAGCACAT 
AAAGACGAGA ATGGTTTGCT TCACGTTCAT CCATTCTTTT GGCTTCCCGA TGAGGGAATA 
GAGGATAAAT CGAGAAGTGA TAAGGTTCCT TATGACATTT GGGCCAAGGG TGGACTAATC 
CATTTAAGCC AAGGAAGAAC CATCCAATAT AAGGATGTCG CTGCCAAGCT TAAGGAGATT 
GCGGATAACG CCAATGTCCA GAAGGTAGCC TTTGACCGTT ACAAAATAAA ATACTTCAAG 
CGCGACATGA TTGATTGTGG TTTTGATGAG CGATGGATTG ACGAGCACAT GGTTTCTTAT 
GGGCAGGGCT TCGTTTCTAT GGGCATCGGA ATTAACGAGT TGGAGCGTTT AATTCTGGAT 
GGCAAAATTC GCCATGGGAA CAACCCCGTC ATGAATATGT GCATGGCAAA CGTGAAAGTT 
GTTTCGGACA CTTCAAACAA CCGCAAATTC ATCAAGCATA CTTCGACAAG ACGAATTGAC 
GGCGCTGTTA CGTTAGCGAT GCTCGCCGGA ATGCTTGCTG ATCCAGATAA CAAGCCAAAG 
CCCAAGCGAA AAGCTCTATT TGCTTAA

Protein sequence

MTMSDQSLPV LSSAQPVIPP KPKLSRAEKN IKWIESNLFI PEGKDVGKPF RLVDFQKDII 
RSIYDNPAGT RRAIISMPRK AAKTTLCAAL MLLHLVGREA LPNSQLYSAA RSRDQAAELF 
KLAVKMIRMS PRISRFVRIV ETSKRLKVPE LGTEYRALSK DAGTAQGLSP CLVIHDELGQ 
VRGPVDPLYE ALELATAAQA NPLTLVISTQ APTDNDLLSQ LIDDAATGAD PTKVLKLYSC 
PMNIDPFSEE ALAVSHPAWN SFVNRKELKQ MQAEAARMPA RAADFRNYTL NQRIEVNAPF 
ISKDVWDEGK DNPEEWHGKD VWLGLDLSET RDLTSLTLAH KDENGLLHVH PFFWLPDEGI 
EDKSRSDKVP YDIWAKGGLI HLSQGRTIQY KDVAAKLKEI ADNANVQKVA FDRYKIKYFK 
RDMIDCGFDE RWIDEHMVSY GQGFVSMGIG INELERLILD GKIRHGNNPV MNMCMANVKV 
VSDTSNNRKF IKHTSTRRID GAVTLAMLAG MLADPDNKPK PKRKALFA