Gene Rsph17029_3906 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3906
Symbol
ID	4898737
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	1041469
End bp	1042500
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	70%
IMG OID	640114509
Product	WD-40 repeat-containing protein
Protein accession	YP_001045756
Protein GI	126464643
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAGCA CGACCAGACT GAGCCGTCGC AGCTTCGGCC TTCTGACCGC CGGAAGCGTC 
GCGAGCCTTG CCATCGGGGC GCCGAGCCTG ATCCGCGCCC AGACGGCGGT GAATTTTGCC 
GTCCCCAACC CCTCGGCCCT GACCTGGCTG CCCTACTGGG TGGCGGTGGG CGAAGGCTAC 
TTCGCCGAAG AAGGCTTCGA GCCCCGGCTC GAGGCCATCG ACGGCTCTTC GGCCGTGCTT 
CAGGCCATGT CGGCGGGACA GGCACAGATC GGCGCGCCGG GACCGGGCCC GACGCTCGGC 
GCGCGCGCGC GCGGGGTGGA CGTCAAGTTC CTCTACAACC TCTATCCGAA GTCGGTCTTC 
GGCCTGCTCG TGAAGGAGGA CAGCGCCTAT CAGACCCCGG CCGACCTCAA GGGCCAGGTC 
ATCGGCGTGG GCACCGCGGA CGGGGCCGAG GTCTCCTTCA CCCGCGCCAT CCTGACCGAG 
GCCGGCATGA CCGAGGGGGC CGATTACAGC TTCCTGCCGG TGGGCGACGG CGGCACGGCG 
GCGGTGGCCT TCCTGCGCGA CGAGGTGGCG GCCTATGCGG GCGCGGTCTC GGATGCGGCG 
ATCCTTGCCG CGCGCGGCCT CACGCTGCGC GAGATCACGC CCGAGGCCTT CCTCGGCTTC 
TTCGGCAACG GCATCGCCAT GCTGGAAAGC CAGATGCAGG CCATGCCCGA GCTTGCCCCC 
GCTTTCGGCC GGGCGCTGGT GCGCGGCACG CGCTTCGCCT CGGATCCGGC CAACAAGGAG 
AAGGCACTGG CCCATTGCGC GGCCGGCAAC CCGCAGGAGG GCGAGCAGGA TTACGCGGCC 
TCGCTCTATG ACGGCGTGGT CAACCGCATG ACCCCGACCG AGGCCTTCAT CGGCAAGGGC 
TACGGCTACC AGCCGCCCGA GCACTGGCAG GCGATCCACG ATTCCGCCGT GGCTTCGGGC 
GCCCTGTCCG AGCCGATCGA GGATCTGGCC TCGGTCTATA CCAACGAGTT CGTCGAAGGC 
TGGAACAGCT GA

Protein sequence

MTSTTRLSRR SFGLLTAGSV ASLAIGAPSL IRAQTAVNFA VPNPSALTWL PYWVAVGEGY 
FAEEGFEPRL EAIDGSSAVL QAMSAGQAQI GAPGPGPTLG ARARGVDVKF LYNLYPKSVF 
GLLVKEDSAY QTPADLKGQV IGVGTADGAE VSFTRAILTE AGMTEGADYS FLPVGDGGTA 
AVAFLRDEVA AYAGAVSDAA ILAARGLTLR EITPEAFLGF FGNGIAMLES QMQAMPELAP 
AFGRALVRGT RFASDPANKE KALAHCAAGN PQEGEQDYAA SLYDGVVNRM TPTEAFIGKG 
YGYQPPEHWQ AIHDSAVASG ALSEPIEDLA SVYTNEFVEG WNS