Gene Rsph17029_4090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_4090
Symbol
ID	4894990
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009040
Strand	+
Start bp	31952
End bp	33253
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	74%
IMG OID	640110492
Product	hypothetical protein
Protein accession	YP_001041804
Protein GI	126464828
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	107
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	83
Fosmid unclonability p-value	0.150292
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGACG CCTCGCCGAT CCTGTCGCTT CCCTACATCC TGCCCTCTCA GGCGCAGAAA 
CATGTGACCC ACAACGAGGC GCTGCAGCGG CTCGATGTGC TGGTCCAGCC CGCCGTGCTC 
GACCGCGACC GCTCCGCGCC GCCCGCCGCC CCGGCCGCGG GGGCGCGGCA TCTGGTGGGC 
CCGGGCGCCG AAGGGGCCTG GGCAGGGCGG GAGGAGGCCT TTGCGGTCTG GGACGCGGAG 
GCGGCGGTCT GGCGTTTCCT CGCCCCGCAG CCGGGCTGGC AGACCTTCGT GCTGGCCGAG 
GGGGCGGGGC TCGTCTTCAC TGCCCAGGGC TGGCGCACGC TGATCGGCCT TCTGCCGGAA 
TTTCCCTCGC TGGGCATCGC CACCCCGGCC GATGCCACCA ACCGCCTCGC GGTGGCGGGC 
CCCGCCACGC TCTTCACCCA TGCGGGCGCG GGCCACCGGA TCAAGGTCAA CAAGGCCGCG 
GAGGCCGAGA CGGCGAGCCT CCTGTTCCAG TCCGACTGGT CGGGCCGGGC CGAGATCGGG 
CTTGCGGGCA GCGACGACTT CGCGCTGAAG GTCAGCCCGG ACGGCACTTC CTTCCGCACC 
GCGCTCAGCG CCGACCGGGC GAGCGGGCGG GTGGCGCTGC CGCAGGGGGC GGTGGTGACG 
GGCAGCCTCA CCGGAAGCGC GGTGCAGGCC TCGGCCGCCG ATGCGACCCC GGGCCGGCTC 
CTGACGGTGG GGGCCTTCGG GCTGGGGGCG CCGGCGCCGC TCGTCGGCAA TGCCGGGGCG 
GTGGACGGCG CGCTCGCCCC GGGCTTTTAC GGCTACGACA GCGCGCAGGG CAGCAGCGGT 
GGCCCTGCGG GCGTGCAGGC GGGCCTTCTC CTTCATCAGA GCCGGGGGGC GGGCGAGGTG 
CAGCTCTTTC TCGTGGAGGC GGGGGGCGGG GGCCTCATGC CGGGCATCCT CTTCTCGCGC 
GCCCGCGGCG AGGGCGCCTG GTCGCCCTGG GTCGCGGGCG GGATCGTCGA GAGCGCGGGC 
AACGCCAACG GCCGCTACAT CCGCCATCAG GACGGGACGC AGAGCTGCTG GCAGAAGGTG 
ACCACCTCGG CCTCCGCCGA TGTGGTGGCC CCCTTTCCCG CCGCCTTCTC CACCGCCACG 
GGCCTCGTCA CGGTCTCGAG CGTGGTCTCG AACGGAGCCC AGGCGCTCAG CCCGCGGCTG 
ACCGGGCGGA CGACGACCAG CGTCGGCGTC TCGGTCTTCA GCGCCACGAA CACGCGCCTT 
GCCGCGCAGG TCGAGCTGAT CTCGATGGGC CGCTGGTATT GA

Protein sequence

MSDASPILSL PYILPSQAQK HVTHNEALQR LDVLVQPAVL DRDRSAPPAA PAAGARHLVG 
PGAEGAWAGR EEAFAVWDAE AAVWRFLAPQ PGWQTFVLAE GAGLVFTAQG WRTLIGLLPE 
FPSLGIATPA DATNRLAVAG PATLFTHAGA GHRIKVNKAA EAETASLLFQ SDWSGRAEIG 
LAGSDDFALK VSPDGTSFRT ALSADRASGR VALPQGAVVT GSLTGSAVQA SAADATPGRL 
LTVGAFGLGA PAPLVGNAGA VDGALAPGFY GYDSAQGSSG GPAGVQAGLL LHQSRGAGEV 
QLFLVEAGGG GLMPGILFSR ARGEGAWSPW VAGGIVESAG NANGRYIRHQ DGTQSCWQKV 
TTSASADVVA PFPAAFSTAT GLVTVSSVVS NGAQALSPRL TGRTTTSVGV SVFSATNTRL 
AAQVELISMG RWY