Gene Rsph17025_3355 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3355
Symbol
ID	5085846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009429
Strand	-
Start bp	234339
End bp	235385
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	65%
IMG OID	640484924
Product	hypothetical protein
Protein accession	YP_001169541
Protein GI	146279383
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0675521
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATTC TGCTGACGTC GGCGGCGCTG GCGCTGACGG CTCTGGCCGC TCCGGCCGTG 
GCGCAAGACA TCGTGGATGT GTCGAAGGTC AACCAGGACC TGATCGCCAC CGCCGACGGC 
AAGGAATACA GCATTGCCAC CGTGGTGAAG GTGGACGGCA TCGCCTGGTT CGACCGGATG 
CGCGACGGCA TCGACCAGTT CAAGGGCGAC ACCGGCCATG ACGTCTGGAT GGTCGGCCCG 
AGCCAGGCGG ACGCCGCGGC GCAGGTGCAG CTGATCGAGA ACCTGATCGC GCAGGGGGTC 
GATGCGATCT GCGTGGTGCC CTTCTCGGTC GAGGCGGTGG AGCCGGTGCT GAAGAAGGCG 
CGTGACCGCG GCATCGTGGT CATCACCCAC GAGGCCTCGA ACATCCAGAA CACCGACTTC 
GACCTCGAGG CGTTCGACAA CCTCGCCTAT GGCGCGAACC TGATGAAGGA ACTCGCCAAA 
TCCATGGGCG AGAAGGGTCA GTATGTCGCC ACCGTCGGCT CGCTCACCTC GAAGAGCCAG 
ATGGAATGGA TCGACGGCGC GGTGGCCTAC CAGAAGGAGA ACTACCCCGA GATGAGCCTC 
GTGGGTGATC GTCTGGAAAC CGCCGACGAT GCGGCCATCG ACTACACCAA GCTCAAGGAA 
GCGATGACCA CCTACCCCGA CATCACCGGG ATCCTCGGCG CGCCGATGCC GACCTCGGCC 
GGGGCGGGCC GCCTGATCGC CGAGAGCGGG CTGAAGGACA AGGTCTTCTT TGCCGGCACC 
GGCCTGCCGT CGGTGGCGGG CGAATACCTC CAGAACGGCG ACATCCAGTA CATCCAGTTC 
TGGGATCCGG CGGTTGCGGG CTATGCGATG AACATGCTGG CCGTGGCGGT GCTCGAGGGC 
CGGAAGGACG AGATCAAGCC GGGCCTGAAC CTCGGCCTCA CCGGCTATGA GGATCTCACC 
GCGCCGGACG AGGCCAACCC GCATCTGCTC TATGGCGCGG GCTGGGTCGG CGTGACGAAG 
GACAACATGG CCGACTACGA CTTCTGA

Protein sequence

MKILLTSAAL ALTALAAPAV AQDIVDVSKV NQDLIATADG KEYSIATVVK VDGIAWFDRM 
RDGIDQFKGD TGHDVWMVGP SQADAAAQVQ LIENLIAQGV DAICVVPFSV EAVEPVLKKA 
RDRGIVVITH EASNIQNTDF DLEAFDNLAY GANLMKELAK SMGEKGQYVA TVGSLTSKSQ 
MEWIDGAVAY QKENYPEMSL VGDRLETADD AAIDYTKLKE AMTTYPDITG ILGAPMPTSA 
GAGRLIAESG LKDKVFFAGT GLPSVAGEYL QNGDIQYIQF WDPAVAGYAM NMLAVAVLEG 
RKDEIKPGLN LGLTGYEDLT APDEANPHLL YGAGWVGVTK DNMADYDF