Gene Rsph17025_4093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_4093
Symbol
ID	5086266
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009430
Strand	+
Start bp	143645
End bp	144715
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	70%
IMG OID	640485656
Product	hypothetical protein
Protein accession	YP_001170250
Protein GI	146280093
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.818341
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.104815
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCACC GACTGACGGT TGTTCTTGTG GGAAGCCTGC CGGTTCTCGC AGGCTGTTCG 
GAAGGCCATG TGCGCTTTCC GGTGACGGAG AGCGCGCAGA AGGCGCTTCC GGAGAATGTG 
CAGGTGATCC GGCTGGATGC GGAGAACATC CGCAGCTTCG AGGTGCCGGC GGAACCGCAC 
CAGGCGACGC GGCTGCCGGC CGGCGGAGGA TGGGACTACC GGATCGGGGT GGGGGACATC 
CTGGGGATCA CGGTGTTCGA CCATCCCGAA CTCATGCTGC CGGGGGGCGA GAAGACCGCC 
GGGGAGAGCG GCTTCCGGGT GCAGGGGGAC GGGACGGTGG CCTTTCCCTA CGTGGGGGCG 
GTGCGGGCGA AGGGCCGGGC GCCGGAGGAG GTGCGCGAGG AACTCCGGAC GCGGCTTGCG 
GCCTTCATCC CCGAGCCGCA GGTGGATGTG CGGGTGACGG CCTTCAACTC GCAGGCGGTG 
AGCGTGACGG GGGAGGTGAG AACCCCGAAC CGGCAGGCGC TGACCACGGT CGAACTGACG 
CTTCTCGATG CCATCAACGC GGCGGGGGGA CTGGCCGAGA CGGCGGACGC GCGGCGGGTG 
ACGGTCCGGC GCGGCACGAG CTCCTACAGG GTCGATCTCG AGGGGTTCCT GACCGCGGGG 
CTCGGGAGCA ACAACCCGGT ATTGCGGCCG GGCGACATCG TCACGGTGCC GCGCCGGCAG 
GCGCGCGAGG CCTATCTTCT GGGCGAGATC GTGAAGCCCG CGGCGGTCGA TCTTTCGGTC 
GAGCCGCTGA CACTGACCCA GGCGCTGAGC CGGCAGGGCG GCATTCTCGA GCGGCGGGCG 
GATGCGCGGG GGGTCTTCGT CTTCCGCGCG AACGGCGCTC CGGGCATGAA GGTGTTCCAG 
CTCGATGCGC GCTCGCCCAC GGCGCTTCTC CTGGGGACAC GGTTCCTGCT GCAGCCGGGG 
GATGTGGTCT ATGTGACGCG CGCGCCGCTC AGCCGCTGGA ACGACACGAT CAGCGACCTG 
CTGCCCTCGG TGGGGATCAC CAGCAGCCTC GACCGGCTGG GGACGAACTG A

Protein sequence

MLHRLTVVLV GSLPVLAGCS EGHVRFPVTE SAQKALPENV QVIRLDAENI RSFEVPAEPH 
QATRLPAGGG WDYRIGVGDI LGITVFDHPE LMLPGGEKTA GESGFRVQGD GTVAFPYVGA 
VRAKGRAPEE VREELRTRLA AFIPEPQVDV RVTAFNSQAV SVTGEVRTPN RQALTTVELT 
LLDAINAAGG LAETADARRV TVRRGTSSYR VDLEGFLTAG LGSNNPVLRP GDIVTVPRRQ 
AREAYLLGEI VKPAAVDLSV EPLTLTQALS RQGGILERRA DARGVFVFRA NGAPGMKVFQ 
LDARSPTALL LGTRFLLQPG DVVYVTRAPL SRWNDTISDL LPSVGITSSL DRLGTN