Gene Rsph17029_2165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2165
Symbol
ID	4895484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2294076
End bp	2295503
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	69%
IMG OID	640112759
Product	glycoside hydrolase family protein
Protein accession	YP_001044040
Protein GI	126462926
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2931] RTX toxins and related Ca2+-binding proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.669505
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.045019
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATCTTC AGCATGGCGG CAAGGACTTT CTGGTCTCCA CCTGGGACGC CGGGCAATCC 
TACCTGACCA GCTGGTCGGG CGAGAACGTC CGGCTGCTCG AGGATGAGCG CATCGCCCTG 
ATCCTGAACC GGTCGCACGA CAGCGCCGCG CGGCCCTGGC TCGGCGGGGA GCTCCAGTCC 
GAGGCCGCCT TCACCACCGG CTCCTGGAGC TGGATGGCCC AGGCGCCGCG CATGGTCGAC 
GGCACGGTCT TCGGCCTCTT CCTCTATCAG GACGATTATC GCGTTCAGCC GTGGCGGGAG 
TTCGACATCG AGTTCGTGGG CGGCGACACG ACGCGCATCC ACCTCGCCGT GCATTTCGAG 
GACGGGGCGG GCCATCACGT CTCGCTCCGC CAGCCGATGA TCGTGGATCT CGGGTTCGAC 
GCGGCCGACG CGCCGCATGT CTACGAGATC GAGGTGACAG AGAAGGCCGC CTTCTTCCGG 
GTCGACGGCA GGGCCGTGGC GCGGATCGGC CCCGAGCATG TCGAGGGCGG CATCTGGGAT 
CTGGGCCCGC TCGCGAGCCT CGCGGATCTC TGGGCGACCC CGCCCGAGCT GACGCCCTGG 
GCAGGGCAGA TGGCGCAGCC GCCCGACCGG CTGACCGCCT ATGTCGAGAA CATCCGGCTG 
CCCTCGGACA GCACGGTCTT CGGCAAGGGC GGCGCAGACG ACCTGCGCGG CACAAGCGGC 
GAGGATCTGC TCTACGGGTT CGGCGGCAAC GACACGCTGC GGGGCGGCGG TGCGGCCGAC 
CGGATGATCG GCGGCACGGG CAATGACACC TACATCGTCG ATCACGCCGG AGACGAGGTC 
GTCGAGCGGG CAGGCGAGGG GCTGGACCGC GTCTGCGCCT CGGTGAGCCA CCAGCTCGCG 
GCGCATGTCG AGCGGCTGAT GCTGACCGGA ACGGCGGCGA TCAACGGGGC GGGCAACGGG 
CTTGCGAACG TCCTGTGGGG CAACGGGGCC GCGAACCGGC TGTCGGGCGG CGGCGGCAAT 
GACCGGCTCG AGGGGCGCGA CGGTTCGGAT GTGCTGAACG GCGGAACCGG GCATGACACC 
TTGATCGGAG GCGCGGGCCA TGATCGGCTG GCGGGCGGGA CCGGAAGCGA CCGGCTCGTC 
GGGGGGTCCG GCAACGACCG TCTGGATGGC GGGATCGATC GCGATGTGCT GACCGGCGGG 
GCGGGGGCCG ATACGTTCGT CTTCGCCGCG GGATACGGGC GCGATGTCAT CACCGACTTC 
CGGGTCGGCA ACGGCGGGGA CCGGCTGGAA ATCCATGACT ACGCGGCCCC GCTCGAGCTG 
CGTCAGGTCG GCGGCGGCAC CCTGATCGTG TTCTCGGAGA CCGACTCGAT CCTGCTGCAG 
CACGTTCGGG CCACAGCGCT CGATGCCGAG GATTTTCTCT TCTGCTGA

Protein sequence

MYLQHGGKDF LVSTWDAGQS YLTSWSGENV RLLEDERIAL ILNRSHDSAA RPWLGGELQS 
EAAFTTGSWS WMAQAPRMVD GTVFGLFLYQ DDYRVQPWRE FDIEFVGGDT TRIHLAVHFE 
DGAGHHVSLR QPMIVDLGFD AADAPHVYEI EVTEKAAFFR VDGRAVARIG PEHVEGGIWD 
LGPLASLADL WATPPELTPW AGQMAQPPDR LTAYVENIRL PSDSTVFGKG GADDLRGTSG 
EDLLYGFGGN DTLRGGGAAD RMIGGTGNDT YIVDHAGDEV VERAGEGLDR VCASVSHQLA 
AHVERLMLTG TAAINGAGNG LANVLWGNGA ANRLSGGGGN DRLEGRDGSD VLNGGTGHDT 
LIGGAGHDRL AGGTGSDRLV GGSGNDRLDG GIDRDVLTGG AGADTFVFAA GYGRDVITDF 
RVGNGGDRLE IHDYAAPLEL RQVGGGTLIV FSETDSILLQ HVRATALDAE DFLFC