Gene RSP_3838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_3838
Symbol
ID	4796555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_009007
Strand	+
Start bp	4
End bp	1839
Gene Length	1836 bp
Protein Length	611 aa
Translation table	11
GC content	70%
IMG OID	640102951
Product	capsule polysaccharide export protein
Protein accession	YP_001033800
Protein GI	125654606
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3524] Capsule polysaccharide export protein
TIGRFAM ID	[TIGR01010] polysaccharide export inner-membrane protein, BexC/CtrB/KpsE family

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTCTCGT GCCCCTGTCA TCGGGCCCGA GAGAGCGAGA GCCAACCGCA ACGGTTGTGC 
GAGCTGTGCC AGTACCCTGT CCTTGCTGTG TCGCACCGGG GTGCCGTCCA TTCTGCCCCG 
TTAGCTTCTC TGGTGTCGCG CTCCGTGCCC TTGACTTTCC GGCTGGTCGC CACTCTGTCA 
ACCGTTCTTC CGATTCCGGC CCTGACCTTC GCTCGGCCGA TTCCGGGCAC CGCCCGTTCG 
CCGACCCCAT CTGGTCGCCC GGTCCCGCCG GGTGCCCCGC CGCGATTCCG CCGCCGGACG 
GCCCCTGCCC TCCCCCCCCG CCCCGTCGCG GCCCCCGAAG TCGCCCCGAA ACCCGGCCCC 
GGCGCGGCGC TCGGCCCGAG CGGCCTGCGG AGCGGCGAAC GTCCCGCCGC GGAGAGCCCG 
AGCGCCGAAG AGACGCGCGG CCCGGGTCGT GCAGGAGACG CGCGGGCCGC AGACGCGCGG 
GCCGGAGAAC TCCGCCCCGG CAGGCCTGCC GATGCGGGCC GGGCGGGCGG CGGCCAAGGC 
TCAGGACAGG GCGACGGTTC CGGACCGGCG CGCGGCGCCG GGGGCTCAGG TCCGGCCGGC 
AAGGCGGGCG GCAGGGGCCA GCCCGGCGGC GGCGGCAAGG CAGGCGAGGG CAAGACCGGC 
GAGGGCAAGG GCCGCATCCT GCCCTCCTCC TTCAAGGTGC CGGCCGCCGC CCCCCGCGCC 
GCGGCGCGGC TGCGCCACCA CGGCCTGCTC GCGAGCTTCC TCGGCCTCGT GCTGGCCCCG 
ATCCTCGCGT CCGGCCTCTA TCTCTTCGCC ATCGCCGAGG ATCAATATAC CTCGACCGTG 
GGCTTCTCGG TCCGCACCGA GGAGATGGGC TCGGCGCTCG ATCTTCTGGG CGGGCTGAGC 
AGCTTCGGCC TCACCGGCGG CGGCTCGGCC TCGGATTCCG ACATCCTCTA CCAGTTCATC 
CAGAGCCAGG AGCTGGTGCA GCGGATCAAC GAGCGGATCG ACCTGCGCGC AATCTATTCG 
AAGCCCGGCT TCGATCCGGT CTTCAGCTTC GACCCCGACG GCGGGATCGA GGATCTGGTG 
GATTACTGGA AGGACATGGT GCGGATCAGC TACGACAGCA CCACCGGGCT GATCGAGCTG 
CGCGTCCATG CCTTCACGCC CGAGGACGCA CAGGCGGTGG CGCAGGGGAT CCTCGACGAA 
TCGAACCGGA TGATCAACGA CCTGTCGGCC ATCGCCCGGG CCGATGCCAC GCGCTATGCG 
CGCGAGGAGC TCGACAATGC GGTCGAACGG CTGCGCGTGC AGCGTGTCGC CATGACCGAA 
TTCCGCTCGC GCACCCAGAT CGTCGATCCC TCGGCCGACA TCCAGGCCCA GATGGGCCTC 
CTGAACACGC TCCAGCAGCA GCTCGCGTCG GCCAGCATCG ATCTCAACCT GCTGCGCCAG 
ACCACCCAGC CGAGCGACCC GCGCATCGCC CAGAACGAAC GGCGCATCGG GGTGATCGAG 
GAGCTGATCC AGCGCGAACG CGAGAAGTTC GGCCTGGGCG GCGGCACCGG CACCGGGGCC 
AGCACCTATT CCACCATGAT CGCCGAGTTC GAGCGGCTGA CCGTCGATCT CGACTTCGCC 
GAGAAGGCCT ATATCGCCGC GCTCACGAAC CACGACGCGG CCATCGCCGA GGCGCAGCGG 
ATGAGCCGCT ATCTCGCGAC CTATGTCCGG CCCACCCTCG CCCAGCAGTC GCTCTATCCG 
CAGCGCGGCC TGCTCACGCT GATGATCGGC GGGTTCGCTC TCATGCTCTG GGCGATCGGG 
ATGCTGATCT ATTACAGCGT GCGCGACCGG CGCTGA

Protein sequence

MLSCPCHRAR ESESQPQRLC ELCQYPVLAV SHRGAVHSAP LASLVSRSVP LTFRLVATLS 
TVLPIPALTF ARPIPGTARS PTPSGRPVPP GAPPRFRRRT APALPPRPVA APEVAPKPGP 
GAALGPSGLR SGERPAAESP SAEETRGPGR AGDARAADAR AGELRPGRPA DAGRAGGGQG 
SGQGDGSGPA RGAGGSGPAG KAGGRGQPGG GGKAGEGKTG EGKGRILPSS FKVPAAAPRA 
AARLRHHGLL ASFLGLVLAP ILASGLYLFA IAEDQYTSTV GFSVRTEEMG SALDLLGGLS 
SFGLTGGGSA SDSDILYQFI QSQELVQRIN ERIDLRAIYS KPGFDPVFSF DPDGGIEDLV 
DYWKDMVRIS YDSTTGLIEL RVHAFTPEDA QAVAQGILDE SNRMINDLSA IARADATRYA 
REELDNAVER LRVQRVAMTE FRSRTQIVDP SADIQAQMGL LNTLQQQLAS ASIDLNLLRQ 
TTQPSDPRIA QNERRIGVIE ELIQREREKF GLGGGTGTGA STYSTMIAEF ERLTVDLDFA 
EKAYIAALTN HDAAIAEAQR MSRYLATYVR PTLAQQSLYP QRGLLTLMIG GFALMLWAIG 
MLIYYSVRDR R