Gene Rsph17029_3359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3359
Symbol
ID	4898941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	409800
End bp	411290
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	72%
IMG OID	640113958
Product	lambda family phage portal protein
Protein accession	YP_001045227
Protein GI	126464114
COG category	[R] General function prediction only
COG ID	[COG5511] Bacteriophage capsid protein
TIGRFAM ID	[TIGR01539] phage portal protein, lambda family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.591009
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGGGA CCTTCCTGCG CCGGCTCGGC GCCTGGGTCG GCGGGTTCGA TGCGGGCCTC 
GCCAACCGGC GCCTGCGCGG CTTCCGCCCC GCACGCGCCC ATGTGAATGC GCTTCTCGCC 
GCGGCCGGCC CCGACATGAA CGCCCGCGCG CGCTACCTCG TGCGCAACAA CGGCTATGCC 
CAGGGCGCGC TCGACAGCTG GGCCGCGAAC ACGGTCGGCA CCGGGGTGAA GCCCTCCTCG 
CTCATCGCGG CGCCGGCGCG GAAGGCAGCC CTCCAGCGGC TCTGGCAGGA CTGGACCGAC 
GAGGCGGATG CCGAGGGCGT GACCGACTTC TACGGCCTGC AGCGCCGCAT CGCGCGCGAG 
TTCTTCCTCA CGGGCGAATG CTTCGTGCGC CTGCGCGCGC GGAGGCCCGG CGACGGGCTC 
ACGGTGCCGC TCCAGCTCCA GTGCCTGCCC TCCGAGATGC TGCCGATCGG CCGGACCGAG 
GTGCTGGGCG GCGGGCGCGC GATCCGGCAG GGGATCGAGT TCGACGCGGT GGGCCGGCGG 
GTGGCCTATC ACTTCCATCG CCGCCATCCG GGCGATCCGA CCGAGCCGGG GCTTGCGGGC 
GAGACGGTGC GCGTGCCGGC CGAGGATGTG CTCCACATCG TCGATCCGGT CGAGAGCGGC 
CAGCTCCGCG GCGTCTCGCG CTTCGCGCCC GCCATCGTGA AGCTCTTCCT GCTCGATCAG 
TACGACGATG CCGAACTCGA CCGGAAGAAG GTCGCGGCCA TGTATGCGAT GTTCATCACC 
TCGAACGATC CGGATGCGGC GCCGCTCGAG GGCGAGCTGG GCGATCAGGT GGCGCCGGGG 
CAGATCGTGC GTCTCGACCC GGGCGAGGAC ATGAAGGTGG CCGATCCCGC GGACTCGGGC 
GCGACCTACG AGCCGTTCCA GTACCGCACG CTCCTGCAGG TCTCGGCCGC GCTCGGGATC 
CCCTACGCCC ATCTCTCGCA GGACATGGTG AAGGCGAACT ATTCCAATGC CCGCACCGCG 
CTCATGGAAT TCCGCCGCCG GGTCGAGGCC TTCCAGCATT CGGTCCTCGT CTATCAGCTC 
TGCCGTCCGG TCTGGGCGCG CTTCACCGAT CTCGCGGTGC TGACCGGAGC GGTGCGGCTG 
CCGGGCTATG AGCGCCGGAG GCGGGACTAT CTCGCCTGCG AGTGGCTGCC GCCGAAGTGG 
CAATGGGTCG ATCCGCTGAA GGACATCCGC GCCGAGATCG AGGAGATCGG CGCGGGCCTC 
AAAAGCCGGT CGCAGGCGAT CGGGGAGCGC GGCTACGACG CCGAGGAGGT CGATCGCCAG 
ATCGCCGCCG ACCGCAAGCG CGAGGGGCGG CTCGGGCTCG ACTTCCGCCG CAGCGCGCAG 
GGCTCCTCCG CACCTGCGGC GCAGGACGGG GCGCGCGCCG ACGAGGAGGA CGACGAGGAT 
GACGACGGCC GCGCGGCGGA CCGCGACGCC GGCAGGAGGG CAGAGCCATG A

Protein sequence

MAGTFLRRLG AWVGGFDAGL ANRRLRGFRP ARAHVNALLA AAGPDMNARA RYLVRNNGYA 
QGALDSWAAN TVGTGVKPSS LIAAPARKAA LQRLWQDWTD EADAEGVTDF YGLQRRIARE 
FFLTGECFVR LRARRPGDGL TVPLQLQCLP SEMLPIGRTE VLGGGRAIRQ GIEFDAVGRR 
VAYHFHRRHP GDPTEPGLAG ETVRVPAEDV LHIVDPVESG QLRGVSRFAP AIVKLFLLDQ 
YDDAELDRKK VAAMYAMFIT SNDPDAAPLE GELGDQVAPG QIVRLDPGED MKVADPADSG 
ATYEPFQYRT LLQVSAALGI PYAHLSQDMV KANYSNARTA LMEFRRRVEA FQHSVLVYQL 
CRPVWARFTD LAVLTGAVRL PGYERRRRDY LACEWLPPKW QWVDPLKDIR AEIEEIGAGL 
KSRSQAIGER GYDAEEVDRQ IAADRKREGR LGLDFRRSAQ GSSAPAAQDG ARADEEDDED 
DDGRAADRDA GRRAEP