Gene RSP_3539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_3539
Symbol
ID	3721953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007494
Strand	-
Start bp	622498
End bp	624168
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	66%
IMG OID	640073203
Product	hemolysin-type calcium-binding region, RTX
Protein accession	YP_355041
Protein GI	77465538
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.223263
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCGGGC TGAACCTCGA AGGCACCGAC GGCGCCGATC TGCTCATCGG CTCGCGGGGC 
GCGGACGTGA TCTCCGGCCG GATGTTCAAC GACACGCTGA TGGGCGGGGC GGGCAACGAC 
AGCCTCTACG GCAACGGTGA CGACGACCGC CTCTACGTTA ACGAGGGCAA CGACAGCCTC 
TATGGCGAGG AGGGCAACGA CTGGCTGCAT GGCGGTCAGG GCGACGACCT GGTCGTGGGC 
GGCGACGGCA ACGACACGCT CGCGGGCGGT CTGGGCAACG ACACCCTGCA GGGTGGCGCG 
GGCAACGACA CGGCCAGCTA CGAAACGGCC ACCGAGGGCG TTACCGTCAG CCTCGCGCTG 
CAGGGCGAAG GCCAGTTCGT GAACGCGCAG GAAGGCAACG ACCCGCTGAC CTCGATCGAG 
AACCTGACGG GCAGCAATCA CGACGACACG CTGATCGGGG ACGAGGGCGA CAACGTGCTC 
TCGGGTCTCG CGGGCAACGA CGTGCTGGTG GGCGGCGCGG GCAATGACAC GCTGCTCGGC 
GGTGCCGGCA ACGACATCGC CGACTACGCC GCGGCGACGG GCGGGGTGAC GGTCAATCTG 
GCGCGTGATG GGCAGGCGCA GATCATCGGC GCCGATCAGG GCACCGATGT CCTGAGCTCG 
ATCGAGGGTG TCATCGGCAG CGCCTTCAAC GACATCCTGT CGGGCAGCGC GGTCGCCAAC 
CTCATCTTCG GTGGGGACGG TGCCGACCTG GCCACCGGTG GCGCGGGCAA CGACACCATC 
CTCGGCGGCG CCGGATCGGA CAGCCTCTAT GGCAACCTTG GGGATGACCT CCTCTTTGGT 
GACGTGGGCA ACGACTGGAT CCACGGCGGC CAGGGCAACG ACACCGTCCT CGGCGGTTTC 
GGCGACGATA CGCTGGCCGG CGGCGTCGGT GACGATGTGG TGGATGGCGG CGATGGGATC 
GACACCGTCG AGTTCCAGAC CGCAACCGCC GGTGTCACCG TGGATCTCTC GCTGCAGGGT 
CAGGCGCAGC GCATCAGTGC CGAGGAAGGC ACGGATACGC TGTTCTCGAT CGAGAACATC 
CTCGGCAGCC GGTATGACGA CCGCCTGCTG GGCGATGCGG GCTCCAACTT GATCGACGGC 
AGTGCCGGCA ACGACACTGC CATGGGTCAG GCGGGCGAGG ACCTCATCTT CGGCGGGGAC 
GGCAACGACA GCCTCTATGG CAACCAGGAC AACGACACTC TGGTCGGCGG CAACGGCAAC 
GACTGGTTGC ACGGCGGTCA GGGCAACGAT CTCCTGGTGG GCGATGCCGG CAGCGACACC 
CTCAACGGCG GCGTGGGCGA CGATGTGCTG GTCGGGGGTC AGGGCTTCGA CCTTCTGACG 
GGCGGCACCG GGGCGGACAC TTTCGTCTTC GGCAGCCTCG ACAGCGCGGA TGCGGATCGG 
ATCACCGATT TCGAGCAGGG CGTCGACCAG ATCGTGATCG CCGACCAGCT GATGTGGGCG 
CTGGAGAATG CCGAGCTGAA CCTCGCCGAT CAGATCGTCT GGAATGCCGA GACCGGCATG 
CTCTCCATCG ATCTCGACGC CGGGGAGGCG ACCCGTCTGG TGGATCTTGC TCAGATCGAT 
CATGATGGAA CGCTGAACAT CACGATCGAC GACTTCCAGT TCCTGCGCTG A

Protein sequence

MVGLNLEGTD GADLLIGSRG ADVISGRMFN DTLMGGAGND SLYGNGDDDR LYVNEGNDSL 
YGEEGNDWLH GGQGDDLVVG GDGNDTLAGG LGNDTLQGGA GNDTASYETA TEGVTVSLAL 
QGEGQFVNAQ EGNDPLTSIE NLTGSNHDDT LIGDEGDNVL SGLAGNDVLV GGAGNDTLLG 
GAGNDIADYA AATGGVTVNL ARDGQAQIIG ADQGTDVLSS IEGVIGSAFN DILSGSAVAN 
LIFGGDGADL ATGGAGNDTI LGGAGSDSLY GNLGDDLLFG DVGNDWIHGG QGNDTVLGGF 
GDDTLAGGVG DDVVDGGDGI DTVEFQTATA GVTVDLSLQG QAQRISAEEG TDTLFSIENI 
LGSRYDDRLL GDAGSNLIDG SAGNDTAMGQ AGEDLIFGGD GNDSLYGNQD NDTLVGGNGN 
DWLHGGQGND LLVGDAGSDT LNGGVGDDVL VGGQGFDLLT GGTGADTFVF GSLDSADADR 
ITDFEQGVDQ IVIADQLMWA LENAELNLAD QIVWNAETGM LSIDLDAGEA TRLVDLAQID 
HDGTLNITID DFQFLR