Gene Rsph17025_0659 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_0659
Symbol
ID	5083003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	660884
End bp	662770
Gene Length	1887 bp
Protein Length	628 aa
Translation table	11
GC content	71%
IMG OID	640482216
Product	general secretion pathway protein E
Protein accession	YP_001166870
Protein GI	146276711
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.814938
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.16836
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCTT CCAAGGCCGC GCCTTTGCCC GAGGCCCCGG TTCCCGACGC CTTGGGCGTG 
ATGCTCCTGC GGCAGGGCCA CCTTGCGCCG CACCGGATCA TGGGCGCCCT CCGGCGCAGT 
TCGGGCCATG CGGCGGGACT TGCCGACGTG CTTCTGGCCG AAGGGGCCAT GGATGAGGAG 
GAAATCCTCG CCCTGACCGC CCGCCAGAGC GGCCTGCCGC TGCTCGATCC GGCAACGGGG 
GCCGCCGATC CGCGGCTGAT CGACCGCCTC GGCGTTCGGA CCTGCCTGCG CGAGACGCTT 
CTGCCGGTGC ATGACGTCGG CGGCGCCGTG CTTATCGCGG CCCCGTCGCC CGAGAGCTTC 
CGGCGCCACG GCCCGCTGCT TGGGCAACTC TTCGGGCGCG TGATCCCCGT GCTGGCCACG 
CGAACCGCGA TCGAGGGCGC GCTGCATGCG GCGCGCGCCA CAGCCATCGG ACTTGCGGCC 
GAAACCCGCG TCACGCCCGG CGAAAGCTGC CGGGGCTGGC GCACCGGGCG GGCGACGCGG 
CTTGCCCTCG GCACGGGCCT CGGCCTTGCC GCCGGGCTGA TGCTGGCGCC GGGCCTGGTG 
GTGCTGGCGC TTTCCCTCTG GGCGCTGTTC GCCATGACCT GCGGCACCGC CCTGCGGATC 
GCCACCGCCA TAGCCACGCT CCGACGCCGC CCGGCGGACC CGCCCTGCCC GCCCCTCCTG 
CGGCTGCCCA TCGTCTCGGT GATCGTCGCC CTCTATCAGG AGGAGGATAT CGCCGGCCGC 
CTGGTGGCGC GGCTCGGGCG GATCGACTAT CCGCATGACC GGCTCGAGAT CCTGCTTGTC 
GTCGAAGAGG CCGATCTGCG CACCCGCAAG GCTCTGGTCG AGGCCCGCCT GCCGCCCTGG 
ATGCGGATCG TGATCTCTCC CGCCGGCGCC ATCCGCACCA AGCCGCGTGC GCTCAACGTG 
GCGCTCGACC ACTGCCGCGG CTCGATCGTG GGCGTCTATG ACGCCGAGGA TGCGCCCGAC 
CCCGACCAGA TCCGCCGCGT GGTCGAGGGG TTCAGCCGCC GCGGCTCGCA GGTGGCCTGC 
CTTCAGGGCC AGCTCGACTA TTACAACCCG CGGACCAACT GGCTCTCGCG CTGCTTCACC 
ATCGAATATG CCTCCTGGTT CCGCCTGATG CTGCCGGGGC TCGACCGGCT CGGGCTTGCG 
GTGCCGCTGG GGGGAACGAC GCTCTTCTTC CGCCGCGAGG CGCTCGAGGA TCTGGGAGCG 
TGGGACGCCC ACAACGTCAC CGAGGACGCC GATCTCGGCA TCCGCCTCGC GCGCCATGGC 
TACCGGACGG ACCTGATCGA CACGGTGACG GGCGAAGAGG CGAACTGCCG CGCGCTCCCC 
TGGATCAAGC AGCGCTCCCG CTGGATCAAG GGCTTCATGA TGACCTGGGC CGTCCACATG 
CGCGATCCGG TGCTTCTGTG GCGGCAGCTG GGCCCCTGGC GCTTTGCCGG CTTTCAGGTA 
ATGTTCCTCG GCTCGCTGTC GCAGACGCTG CTGGCCCCGG TCCTGTGGTC GTTCTGGCTG 
CTGGCCCTCG GCCTGCCGCA TCCGGTGACG CCGCTTCTGT CCACGCCGGC CCTCTGGGCC 
ATCGTCGGCC TGCTCCTCGG AGCCGAGGGG ACGAGCATCG CGCTCGGCAT CCTCGCGCTG 
CGCCTCACGC GGCACAAGCT CAACCCCCTG TGGGTGCCGA CGATGCATCT CTACAACCCG 
CTGGCCACCT TTGCCGCCTA CAAGGCCCTG TGGGAGCTTC TCCGCGCCCC GTTCTACTGG 
GACAAGACGC GCCACGGCCT CTTCGACGGC TCTTCGCGGG GGCCGGCGGC CTGGGTGCCG 
CGGCTGAGGG GCCAACGCGC GGCCTGA

Protein sequence

MPPSKAAPLP EAPVPDALGV MLLRQGHLAP HRIMGALRRS SGHAAGLADV LLAEGAMDEE 
EILALTARQS GLPLLDPATG AADPRLIDRL GVRTCLRETL LPVHDVGGAV LIAAPSPESF 
RRHGPLLGQL FGRVIPVLAT RTAIEGALHA ARATAIGLAA ETRVTPGESC RGWRTGRATR 
LALGTGLGLA AGLMLAPGLV VLALSLWALF AMTCGTALRI ATAIATLRRR PADPPCPPLL 
RLPIVSVIVA LYQEEDIAGR LVARLGRIDY PHDRLEILLV VEEADLRTRK ALVEARLPPW 
MRIVISPAGA IRTKPRALNV ALDHCRGSIV GVYDAEDAPD PDQIRRVVEG FSRRGSQVAC 
LQGQLDYYNP RTNWLSRCFT IEYASWFRLM LPGLDRLGLA VPLGGTTLFF RREALEDLGA 
WDAHNVTEDA DLGIRLARHG YRTDLIDTVT GEEANCRALP WIKQRSRWIK GFMMTWAVHM 
RDPVLLWRQL GPWRFAGFQV MFLGSLSQTL LAPVLWSFWL LALGLPHPVT PLLSTPALWA 
IVGLLLGAEG TSIALGILAL RLTRHKLNPL WVPTMHLYNP LATFAAYKAL WELLRAPFYW 
DKTRHGLFDG SSRGPAAWVP RLRGQRAA