Gene Rsph17025_3341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3341
Symbol
ID	5085832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009429
Strand	+
Start bp	218228
End bp	219202
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	64%
IMG OID	640484910
Product	hypothetical protein
Protein accession	YP_001169527
Protein GI	146279369
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.699949
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.164593
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTGA AATCCCTCAC GCTTGCAGCC CTGCTCGGCG CTGCCGCCGT TCTGCCTGCC 
GCAGCGCAGG AAGTGGTGGT GCGCGTGGCC TACGAGAACA ATCCCGGCGA GCCGACCGAC 
CTCGTGATGA ACCGCTGGGC CGAGCTGGTT GCCGAAGCCT CGGACGGCAA CGTGGCGCTC 
GAGCTCTATC CCTCGTCGCA GCTGGGCGCC AAGCAGGACG TGATCGAGCA GGGCCTGCTG 
GGCGTCAACG TCATCACGAT CGCCGACGTG GGGTTCCTGA CCGACTATGA TCCCGATCTC 
GGCATCCTCT TCGGGCCCTA TCTGACCGAC AGCCCCGAGC AGCTCTTCAA GATCTACGAG 
AGCGACTGGT TCAAGGAGAA GGAAGCCGCG CTGCGCGAGA AGGGCGTGCA TATCGTCATC 
TCGAACTACC TCTACGGCAC CCGGCAGCTT CTGGCGAAGA AGAAGGTCGA GACGCCGGAC 
GATCTGGCCG GGATGAAGGT CCGCGTGCCC AACAACATCA TGCAGATCAA GGCGCTCGAA 
CTGATGGGTG CCACGCCGAC GCCGATGCCG CTGGGCGATG TCTATCCGGC GCTGACCCAG 
GGCGTCATCG ACGGCGTCGA GAACCCGCTG CCGGTGCTCT ATGGCGGCAA GTTCCACGAG 
CAGGCCAAGG AGCTGTCGAT GATCAGCTAC CTGACCAACA CCTCGCTCTG GCTGGGCGGC 
GAGGCCTATT TCTCGACCCT CGACCCCGAG GTGGTGACCA TGCTGCATGA GACGGGCCAT 
CAGGCCGGCC TCTACAGCCA GGAGCTGGCG GCGCAGGAAG AGGGCAAGAT GATCGAAGCG 
ATGAAGGCCG CCGGCGTGAC GGTGACCGAG CCCGACGTCG AGGCCTTCCG CGAAAAGACC 
AAGGCCTTCT ACACCATGTT CCCGGAATGG TCCGAGGGGC TATACGAGCA GATCCAGGCG 
GCTCTCGCCC AGTGA

Protein sequence

MTLKSLTLAA LLGAAAVLPA AAQEVVVRVA YENNPGEPTD LVMNRWAELV AEASDGNVAL 
ELYPSSQLGA KQDVIEQGLL GVNVITIADV GFLTDYDPDL GILFGPYLTD SPEQLFKIYE 
SDWFKEKEAA LREKGVHIVI SNYLYGTRQL LAKKKVETPD DLAGMKVRVP NNIMQIKALE 
LMGATPTPMP LGDVYPALTQ GVIDGVENPL PVLYGGKFHE QAKELSMISY LTNTSLWLGG 
EAYFSTLDPE VVTMLHETGH QAGLYSQELA AQEEGKMIEA MKAAGVTVTE PDVEAFREKT 
KAFYTMFPEW SEGLYEQIQA ALAQ