Gene Rsph17025_4069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_4069
Symbol
ID	5086242
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009430
Strand	+
Start bp	118838
End bp	119929
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	72%
IMG OID	640485632
Product	hypothetical protein
Protein accession	YP_001170226
Protein GI	146280069
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1087] UDP-glucose 4-epimerase
TIGRFAM ID	[TIGR01179] UDP-glucose-4-epimerase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.487038
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.116036
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGACA GCGTCCTCCT CGCCGGTGGG GCCGGTTACA TCGGCTCGCA TGTGGTCACG 
GCGCTCGCCT CGGCCGGCTG GCGCCCGGTC ATCCTGGACA ATTTCGACAA TTCCGAACCC 
GAGGTCGTGG AGCGGATCGA GGAGATCACC GGCTGCCGCG TGCCGCTGAT CGAGGGCGAC 
GTGCGCGACC GGGCGCTGGT CGAGCGCGCG CTGCGCCGCC ACCGGATCGG GGCGGTGGTC 
CATCTGGCGG GGCGCAAGTC GGTGAACGAG TCGGCCGAGG ATCCGCTGCT CTATTTCGCC 
GAGAACCTCA GCGGGGCGGT CTCGCTGATG ACGGCGATGC GCAACTGCGG CGTGTCGCGG 
CTGGTCTTCT CGTCCTCGGC CACGGTCTAT GGCGCGGCCG AGACGCTGCC GGTGGACGAG 
ACGGCGCCGA CGCGGGTGAC CAGCCCCTAC GGCCGCACCA AGCTGATGAT CGAGGAGATG 
ATCGACGATT GCGTGGCCGC GGTGCCGGAG TTCTCGGCGG TCTCGCTGCG CTATTTCAAC 
CCGGTGGGCG CCCATCGCAG CGGCCTGATC GGCGAGGTGC CGCGCGGCCT GCCGAACAAC 
CTCTTTCCCT ATGTGGTGCG CGCGGCCACG GGCGAGCTGC CCTTCGTGCG GGTGTTCGGC 
GACGATTATC CGACGCCCGA CGGCACGGGC CTGCGCGACT ACATCCATGT CGAGGATCTC 
GCCCGCGGCC ATGTGGCGGC GCTGCGCGTC CAGCGCGAGG GGCCGGGCCT GCTTGCCCGC 
CACCAGCGGA TCAATCTCGG CACCGGGCGG GGCCATACCG TGCTCGAGGT GCTCGACGCC 
TTCGGCCGGG CCTGCGGCTT CCGCATCCCG CGCCGGATCG TGGGGCGGCG GCCGGGCGAC 
GTGGCCGCCT CGGTGGCCGA TCCGGGGCTC GCGCAGCGGC TGCTCGGCTG GCAGGCGCGG 
CACGGGCTCG ACGAGATGTG CGAGAGCCAG TGGATCTTCC AGCAGCGCCA CGCCGAGCGG 
CTGGAGCGGG CCCCGGCCCT GCCGCACCTG CCGGTTCCGG CCTATGCGGC CCCGGCGCAT 
CCTGCGGAGT AG

Protein sequence

MSDSVLLAGG AGYIGSHVVT ALASAGWRPV ILDNFDNSEP EVVERIEEIT GCRVPLIEGD 
VRDRALVERA LRRHRIGAVV HLAGRKSVNE SAEDPLLYFA ENLSGAVSLM TAMRNCGVSR 
LVFSSSATVY GAAETLPVDE TAPTRVTSPY GRTKLMIEEM IDDCVAAVPE FSAVSLRYFN 
PVGAHRSGLI GEVPRGLPNN LFPYVVRAAT GELPFVRVFG DDYPTPDGTG LRDYIHVEDL 
ARGHVAALRV QREGPGLLAR HQRINLGTGR GHTVLEVLDA FGRACGFRIP RRIVGRRPGD 
VAASVADPGL AQRLLGWQAR HGLDEMCESQ WIFQQRHAER LERAPALPHL PVPAYAAPAH 
PAE