Gene RSp1020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSp1020
Symbol	epsA
ID	1223332
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ralstonia solanacearum GMI1000
Kingdom	Bacteria
Replicon accession	NC_003296
Strand	-
Start bp	1286203
End bp	1287348
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	66%
IMG OID	637240885
Product	EPS I polysaccharide export outer membrane transmembrane protein
Protein accession	NP_522581
Protein GI	17549241
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.784638
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.873856
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGTAA GCATTCCGAA TATCCGAAAA GCAGTCGTGT CGTTGAGCGT GGTGCCGTTG 
CTGGCCGCAT GCGCATTTGC CCCGGGCATG CGGTTCGATC CGCAGCGCCC GCTGGATCCG 
GCCGACAACG CGTCGGTACC GAAGATCACG CCCATTACGC CCGATCTTGT GCGGGCCGGG 
CAGACGCAGG CACAGGTGCA GGCGTCGCAC GAGAATGCCG ATGTCGGGCC GTTGCTGGCA 
AAGGCAACGC CGTATCGCAT CGGCACGGGC GACATCCTGT CGATCGTGGT CTGGGATCAC 
CCCGAACTGG TGTTCCCGAC GCAGACCTAT TCGATCGGGT CCACATACGA TCTTGCCAGC 
TTTGGCGGGG CACCCAGCGT GTCCGGCTAT GTGGTCAGCA CCGGTGGCGA CATCCAGTTC 
CCCTATGCCG GCGTCATCAA GGTCGCAGGC AAGACCCAGA ACGAAGTCCG CGACGAGATC 
TCGCGTGGCA TTGCCCGGGT GGTGAAGGAC CCGCAGGTCA CGGTGCGGGT GCTGGCCTAC 
CGCAGCCAGC GGGTCTACGT GGATGGTGAG GTCAAGACCC CCGGCCAGCA GAGCATCGAC 
GACGTGCCGA TGACCCTGGT CGAGGCGCTG AACCGCGCCG GCGGCATCAA CACCACCACC 
GGGGACAACA GCCGGATCCG GCTGACCCGC GGCGGCAAGC AATGGACGCT GAGCATGCCC 
GCGCTGATGC AGCAGGGCAT CGACCCGGCC AACATTCTGC TGCGCGGCGG CGACATCGTC 
CGCGTGGAGC AGCGCGAGGA CAGCAAGGTC TTCGTGACCG GCGAAGTGGT CAGACCGTCG 
ACCGTGCTGC CGCGCAACGG CAGGCTGACG CTGAGCGAAG CGCTGGGCGA GGCCGGGGGC 
GTCAGCCCGG TGTCGTCCGA TCCGCGCAAT GTCTACGTGA TCCGCCGGGC CGCGGAGGGC 
GAGCCCCAGG TCTACCACCT GGATGCCAAG TCGCCCGTGG CGCTGGCGCT GGCCGAAGGC 
TTCGAGCTGA AACCGAAGGA CGTGGTGTAC GTGGATGCCG GCAGCCTGGT GCGCTGGAGC 
CGTGTGATCA ACCTCTTGGT GCCGACCGCA ACCCCGCTGA TCGGGGCGGC CGCTGTCGCG 
AAATGA

Protein sequence

MFVSIPNIRK AVVSLSVVPL LAACAFAPGM RFDPQRPLDP ADNASVPKIT PITPDLVRAG 
QTQAQVQASH ENADVGPLLA KATPYRIGTG DILSIVVWDH PELVFPTQTY SIGSTYDLAS 
FGGAPSVSGY VVSTGGDIQF PYAGVIKVAG KTQNEVRDEI SRGIARVVKD PQVTVRVLAY 
RSQRVYVDGE VKTPGQQSID DVPMTLVEAL NRAGGINTTT GDNSRIRLTR GGKQWTLSMP 
ALMQQGIDPA NILLRGGDIV RVEQREDSKV FVTGEVVRPS TVLPRNGRLT LSEALGEAGG 
VSPVSSDPRN VYVIRRAAEG EPQVYHLDAK SPVALALAEG FELKPKDVVY VDAGSLVRWS 
RVINLLVPTA TPLIGAAAVA K