Gene Rsph17025_1974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1974
Symbol
ID	5082338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	2015790
End bp	2017025
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	69%
IMG OID	640483536
Product	polysaccharide export protein
Protein accession	YP_001168170
Protein GI	146278011
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.154701
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTGT TCCGTCGCCA TCTCCTCCCG CTCGTCGCGT TGGCGATGCT GCCCGGAGGG 
GCCGTGCTGG CCGAAGGTTA CAAGATCAGC GCCAGCGACC TCCTGCGTCT GCGGGTCCTC 
GAATGGCAGC CGGTGGACGG GACGATGCGC GTTTGGGACG CGATGACGGG CGAATACCGG 
GTCAATTCGG ACGGCACGAT TTCCGTTCCG TTCCTCGGGC CGGTCGAGGC GGCGGGGCAC 
ACGCCCTCCC AGCTCGGCAC CCTGATCGCC GACGGCCTGA TGGAGCGTCT GGCGCTGCCC 
GACATGCCCG ACGCCACCGT CGAGATCGCC GAATATCGCC CGGTCATCGT GGCGGGTCAT 
GTGCGCAATC CGGGCGAAGT GGTCTATCGT CCCGGCATCA CCGCGCGGCA GGCCATCGCC 
ATGGCGGGCG GGCCGAGCGA CGAGATCCGC AGCACCCCGG CCATCGTGCG CGACCTGATC 
TCGCAGGAAG GCGCGCTGCG CATCCTGCTC GACAGCCGCG AGGGTATGCT CGCCCGCCGC 
GCGCGCCTGA TGGCCGAGCG CGCCAACGAG AGCGAACTGG GCGCCGTCCC GGACCTCGAC 
AGCGCGCGGG GCCGGGCGCT GCTGGCCGAA GAGAAGTCGT TCATGGATCT GCGCCGCGAT 
CAGGTTGAGC GCAATCTGGC GGCCATCGAC GCGCAGAGCG AACTGCTGAC CGCAGAGATC 
GAGGCGCTGC AGGCCAAGAC GGTCCAGCTC GAGACACAGC TCGAACTGGC CGAGAAAGAG 
GCTGCAAACG CCCGGAACCT GTCGGAACGC GGGCTCGTGG CCAGCGGGCG GCTGTTCGAG 
ACGCAGCGGA CCCTGTCGGC CATCGAGAGC CAGCGGCTCG ACACTTCGAC GGCGATCCTG 
CGGGCCCGTC AGGGCATCAC GACAGCCGAG CGCGACCGGA TCGCGCTGCT GGACGGACGC 
TCGTCGGAGA TCGCGGCCCA GCTTCAGGAG GTCGAGGCCC AGATCCTCGA GATCGACCGC 
AAGATCGACA CGCAGCGGGG GCTCTCGGTG TCGCTTCTGG GGCAGGCGGG CGGCAAGGAT 
CTGGCGGCCG ACCCGGACGC CATCGCCGCC ATGAGCAGCG TCATCGTGAT GCGCATCGAC 
GACGACGAGC TGCGCCAGAT CCCCGACGCG ATGGACCTGC GGCTGGAGCC GGGCGACATG 
GTCCAGATGA CGCTGAGGCC GCCCTCGACC AACTGA

Protein sequence

MAVFRRHLLP LVALAMLPGG AVLAEGYKIS ASDLLRLRVL EWQPVDGTMR VWDAMTGEYR 
VNSDGTISVP FLGPVEAAGH TPSQLGTLIA DGLMERLALP DMPDATVEIA EYRPVIVAGH 
VRNPGEVVYR PGITARQAIA MAGGPSDEIR STPAIVRDLI SQEGALRILL DSREGMLARR 
ARLMAERANE SELGAVPDLD SARGRALLAE EKSFMDLRRD QVERNLAAID AQSELLTAEI 
EALQAKTVQL ETQLELAEKE AANARNLSER GLVASGRLFE TQRTLSAIES QRLDTSTAIL 
RARQGITTAE RDRIALLDGR SSEIAAQLQE VEAQILEIDR KIDTQRGLSV SLLGQAGGKD 
LAADPDAIAA MSSVIVMRID DDELRQIPDA MDLRLEPGDM VQMTLRPPST N