Gene RSP_3921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_3921
Symbol
ID	4796497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_009007
Strand	-
Start bp	106191
End bp	107492
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	74%
IMG OID	640103033
Product	hypothetical protein
Protein accession	YP_001033882
Protein GI	125654688
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGACG CCTCGCCGAT CCTGTCGCTT CCCTACATCC TGCCTTCCCA GGCGCAGAAA 
CATGTGACCC ACAACGAGGC GCTGCAGCGG CTCGATGTGC TGGTCCAGCC CGCCGTGCTC 
GACCGCGACC GCTCCGCGCC GCCCGCCGCC CCGGCCGCGG GGGCGCGGCA TCTGGTGGGC 
CCGGGCGCCG AAGGGGCCTG GGCAGGGCGG GAGGAGGCCT TTGCGGTCTG GGACGCGGAG 
GCGGCGGTCT GGCGTTTCCT CGCCCCGCAG CCGGGCTGGC AGACCTTCGT GCTGGCCGAG 
GGAGCGGGGC TCGTCTTCAC CGCCCAGGGC TGGCGCACGC TGATCGGCCT TCTGCCGGAA 
TTTCCCTCGC TGGGCATCGC CACCTCGGCC GATGCCACCA ACCGCCTCGC GGTGGCGGGC 
CCCGCCACGC TCTTCACCCA TGCGGGTGCG AGCCACCGGA TCAAGGTCAA CAAGGCCGCG 
GAGGCCGAGA CGGCGAGCCT CCTGTTCCAG TCCGACTGGT CGGGCCGGGC CGAAATCGGG 
CTTGCGGGCA GCGACGACTT CGCGCTGAAG GTCAGCCCGG ACGGCACTTC CTTCCGCACC 
GCGCTCAGCG CCGACCGGGC GAGCGGGCGG GTGGCGCTGC CGCAGGGGGC GGTGGTGACG 
GGCAGCCTCA CCGGAAGCGC GGTGCAGGCC TCGGCCGCCG ATGCGACCCC GGGCCGGCTC 
TTGACGGTGG GGGCCTTCGG GCTGGGGGCG CCGGCGCCGC TCGTCGGCAA TGCCGGGGCG 
GTGGACGGCG CGCTCGCGCC GGGCTTTTAC GGCTACGACA GCGCGCAGGG CAGCAGCGGC 
GGCCCTGCGG GCGTGCAGGC GGGCCTTCTC CTTCACCAGA GCCGCGGGGC GGGCGAGGTG 
CAGCTCTTTC TCGTGGAGGC GGGGGGCGGG GGCCTCATGC CGGGCATCCT CTTCTCGCGC 
GCCCGCGGCG AGGGCGCCTG GTCGCCCTGG GTCGCGGGCG GGATCGTCGA GAGCGCGGGC 
AACGCCAACG GCCGCTACAT CCGCCATCAG GACGGGACGC AGAGCTGCTG GCAGAAGGTG 
ACCACCTCGG CCTCCGCCGA TGTGGTGGCC CCCTTTCCCG CCGCCTTCTC CACCGCCACG 
GGCCTCGTCA CGGTCTCGAG CGTGGTCTCG AACGGAGCCC AGGCGCTCAG CCCGCGGCTG 
ACCGGGCGGA CGACGACCAG CGTCGGCGTC TCGGTCTTCA GCGCCACGAA CACGCGCCTT 
GCCGCGCAGG TCGAGCTGAT CTCGATGGGC CGCTGGTATT GA

Protein sequence

MSDASPILSL PYILPSQAQK HVTHNEALQR LDVLVQPAVL DRDRSAPPAA PAAGARHLVG 
PGAEGAWAGR EEAFAVWDAE AAVWRFLAPQ PGWQTFVLAE GAGLVFTAQG WRTLIGLLPE 
FPSLGIATSA DATNRLAVAG PATLFTHAGA SHRIKVNKAA EAETASLLFQ SDWSGRAEIG 
LAGSDDFALK VSPDGTSFRT ALSADRASGR VALPQGAVVT GSLTGSAVQA SAADATPGRL 
LTVGAFGLGA PAPLVGNAGA VDGALAPGFY GYDSAQGSSG GPAGVQAGLL LHQSRGAGEV 
QLFLVEAGGG GLMPGILFSR ARGEGAWSPW VAGGIVESAG NANGRYIRHQ DGTQSCWQKV 
TTSASADVVA PFPAAFSTAT GLVTVSSVVS NGAQALSPRL TGRTTTSVGV SVFSATNTRL 
AAQVELISMG RWY