Gene Rsph17029_3541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3541
Symbol
ID	4899100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	627975
End bp	628964
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	65%
IMG OID	640114150
Product	TRAP dicarboxylate transporter, DctP subunit
Protein accession	YP_001045404
Protein GI	126464291
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.106923
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAAGA AAACACTGGT GGCCTCGGCC CTGTGCCTGA TGATGGCGCC TGCCGCCTTC 
GCGCAGGACT ACACCATCCG GCTGTCGCAC GGCGACAACG AGAGCAATCC GACCCACCTG 
ACGGCGGTGA AGTTCCAGGA GCTGGTGAAG GAATACACTG AAGGCAAGGC CGAGGTGCAG 
ATCTTCCCGA GCAACTCGCT CGGCACCGAA ACCGAGGTGG CGCAGGCGCT GCGGATGGGC 
TCCATCGAGG CCGAGATCCT CTATACCGGC AACCTCGTGC CGCTCGCGCC TTCGGCCGGC 
GTCCTGATGC TGCCCTACGC CTATACCTCG ACCGAGCAGG CGCACAAGGC GATGGATGCG 
CTGATCGATC CGCTGAACGA GCGTCTGACC AAGGAAGCCG GCGTGCGCGC GCTCGGGCTG 
ATGGAGAAGG GCTTCCGGGT CCTGACCACC AACAAGCCCG TGACCACGCT CGAGGATCTG 
AAGGGCCTCA AGATCCGCGT CTCGCCCAAC GACATCGCGA TCAAGACCTT CCGCGCCTGG 
GGGATCGAGC CCCTGCCGAT GGACTGGGCC GAGGTCTTCC CCGCGCTGCA GCAGCGCGTG 
ATCGACGGTC AGGAGAACCC CTACACCACG GCCATCTCCT CGCGCTTCTT CGAGGTTCAG 
AGCGACATCA CCGAGATCCA CTACATGATG TGGACAGGCC CGCTCCTGAT CAGCGAGCGC 
GCCTTCCAGA AATATCCCGA GGATATCCAG CAGGCGCTGC TGCGCGCCGG CCGCGAGGCG 
GTGGACTACG GGCGGCAGGT GTCGGCCGAG CTCACCGAAC AGTCGAAGGC CGAGCTGGTG 
AAGAACGACA TGACCCTGCA CGGCGCGCCG AAGGACGAGG AGAAGTGGGA AGCGGCGGCC 
GCGGCCCTCT GGCCGGAGTT CTACGACCAG ATCGGCGGCG AGGAATGGGC CACGCAGGCC 
ATCGAGATCA TCAAGGCCAC CGAGAAGTAA

Protein sequence

MLKKTLVASA LCLMMAPAAF AQDYTIRLSH GDNESNPTHL TAVKFQELVK EYTEGKAEVQ 
IFPSNSLGTE TEVAQALRMG SIEAEILYTG NLVPLAPSAG VLMLPYAYTS TEQAHKAMDA 
LIDPLNERLT KEAGVRALGL MEKGFRVLTT NKPVTTLEDL KGLKIRVSPN DIAIKTFRAW 
GIEPLPMDWA EVFPALQQRV IDGQENPYTT AISSRFFEVQ SDITEIHYMM WTGPLLISER 
AFQKYPEDIQ QALLRAGREA VDYGRQVSAE LTEQSKAELV KNDMTLHGAP KDEEKWEAAA 
AALWPEFYDQ IGGEEWATQA IEIIKATEK