Gene RSP_2997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_2997
Symbol
ID	3720248
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	1693482
End bp	1694708
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	50%
IMG OID	640071191
Product	putative head portal protein
Protein accession	YP_353064
Protein GI	77463560
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.429219
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCGGAT TTGGCAAACG AGAGTCAGGC AGCAATCAGC CGACCGTTAT TAGTAGGATC 
TCTGAGGCGT TCGGCTGGTG GGGCGGATCG TCTTCTATTG CCCCGGCACT AAGCAATACA 
ACTGCGATGC AGAACCCGGC TGTTATGTGC GCAGTCCGAA CAATCGCGGA AGGTGTAGCT 
TCCATGCCTA TCAATATTAT CGAGACAAAA GAAGTAGACG GGCTGTCAAA GCGAACAATT 
CGGAAAGATC ATTGGGCGTC AAAGCTGATT AATAAGCCAA ATGCCTATCA GACCCGATTT 
GAATTTGTTG AAATGATGAT TTCAAATGCC GTGCTCGGAA AAGGCGCATT GGCACTCAAA 
ACCGTTGTCG GTGGAGAAGT CCGCGAACTC TTGCCTATCC CTAGCGGTAT TTGGGAAATG 
GAAATCCTCA CTAATGGATC ATACAATTTC CGGGTAAGGT TTACCGATGG TTCCAGCCGC 
GTATTCGCAG CTAAGGATTG TCTATTCTTC CGTGGTTTGT CGCTTGACGG GTATTCGTCT 
ATCTCCGCTA TTGAGACCGC CAGAAAGGCT GTCGGTATCG CGAACGCCCT TGAAGGCCAG 
ACTCTTCAGA CGGCTTCGAA TGGTGGAAGA CCTTCAGGTG TCTTGAGCAT CGGTGATCCA 
GAAGACGGCG TTGCTCTGGA TGAAGATACC CGTGCCAAAA TCATCGCACT TTGGAAGGAC 
CGATTCTCAT CGAATGGGGA AGGCGGTATC CTGATTTCAT CTGGATATTC GACCGACTTC 
AAACCGATCC AACAGAACGC GGTTGATAGC CAACTTATCG AAAGCCGCAA GTATCAGGTC 
GAAGAGATAG CTCGCATCTT CCGGGTGCAT CCGGCTTATC TGATGGCGTC CGGGACTATC 
ACTCCCGAGA TCCAACGGGC GCATGTCCGC AATACCCTCA TGCCTTGGGT AGCTCGTTTT 
GAACAAGCAT TAGCAGCGTC ACTGCTCCAA GCCGAACCAA ATCTGTTGTT TGATTTTGAT 
GAGCACGAAT TACTTCGCGG GGACCATTCT GCCCTAAAAG ATTTCTTCGC ATCAGTGACG 
GGCGTTGGTG GAAGTCCTGC AATCATGTCG GTCAACGAAT GCCGTTATGA ATTGGGCCTT 
GATCCTATTG CGGATGAATG GGCCAGAACT CCGCTCAAAG GCGGGTATGA AAACTCCGCT 
ATTCAGAAAG AGGAAAGCAG CAAATGA

Protein sequence

MFGFGKRESG SNQPTVISRI SEAFGWWGGS SSIAPALSNT TAMQNPAVMC AVRTIAEGVA 
SMPINIIETK EVDGLSKRTI RKDHWASKLI NKPNAYQTRF EFVEMMISNA VLGKGALALK 
TVVGGEVREL LPIPSGIWEM EILTNGSYNF RVRFTDGSSR VFAAKDCLFF RGLSLDGYSS 
ISAIETARKA VGIANALEGQ TLQTASNGGR PSGVLSIGDP EDGVALDEDT RAKIIALWKD 
RFSSNGEGGI LISSGYSTDF KPIQQNAVDS QLIESRKYQV EEIARIFRVH PAYLMASGTI 
TPEIQRAHVR NTLMPWVARF EQALAASLLQ AEPNLLFDFD EHELLRGDHS ALKDFFASVT 
GVGGSPAIMS VNECRYELGL DPIADEWART PLKGGYENSA IQKEESSK