Gene RSP_4016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_4016
Symbol	dctP
ID	3712045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007488
Strand	+
Start bp	30256
End bp	31311
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	66%
IMG OID	640069322
Product	TRAP dicarboxylate family transporter DctP subunit
Protein accession	YP_345189
Protein GI	77404615
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.807538
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGTCAT GGATTCGCCA CAAGAGCGAG CCGCCAACAG AGAGAGAGAC CGAGATGACC 
CAAGCGCAGA CATTCCTCGC CGGAACCGCC CTGGCCCTGC TGGCCGCCCT GCCGGCCTGG 
GCCGAAGAGT TCCGCATCGC CGTGGGCGAT GGCGCGGGCG GCACGCAGGA GGCGCTCGGC 
AAGGCCTTCG TCGCGGCGCT CGAGAAGGAG TCGGGCGGCG AGATGACGGG CAAGCTGTTC 
CTGAACGGCC AGCTCGGCGA CGAGCAGGAC ACGGTGACGG CCGCGGCTAC CGGCACGCTC 
GACTTCTCGA TCCTCGCGAT CAACAACATC ACGCCCTTCT CGCCCTCGGT GGGCACGCTG 
ACGCTGCCCT ATGTCATCCT GAGCCAGGAG GATGCCGAGA CGGTCACGCA GGGCGAGGTC 
GGCCGGCAGA TGATCGAGAA GACGGTCGAG GATGCGGGCG TGCGCATCAT CGGCTGGGGC 
TATTCGGGCT TCCGGGTGCT GACCAATTCG AAGAAGCCCG TGGCCTCGGT CGAGGACATG 
CAGGGGCTGA TCGTGCGCGT GCCCAAGAAC GAGATCATGA TCGAGACCTA CAAGAGCTGG 
GGCATCAACC CCACGCCGAT GGCTTGGGGC GAGACCTTCG CGGCGCTTCA GCAGAAGGTC 
GTGGACGGGC AGGACAATCC CTACATGACC GTCTATGCGA TGAAGTTCGA CGAGGTGCAG 
AAATATGTCA CCGAGCTGCG CTACATCTTC TCGATCGAGC CGCTGATCGT GAGCGAGGCC 
CTGTTCGAGG GGCTGAGCGA GGAGAAGCAG GCGCAGATCC TCGCCGCGGG CGAGGCGGCG 
ACGCAGGCCT CCTCGGCCTT CCTGCGCGAG CAGGAGAGCC GGATCCGCGA CGAGCTGGTG 
GCGCGCGGCA TGGAGATCAC GCCGCCCGCG GACGGCGAGA AGGGCTTCAT CGAGCTGGCG 
ACCGCGCAGG TCTGGCCCAA GTTCGCCGAC CAGATCGGCG GCATCGAGGT GCTGAACGGC 
GTCTTGACCT CGCTCGGCCG GCCCACCGTC CAGTAA

Protein sequence

MSSWIRHKSE PPTERETEMT QAQTFLAGTA LALLAALPAW AEEFRIAVGD GAGGTQEALG 
KAFVAALEKE SGGEMTGKLF LNGQLGDEQD TVTAAATGTL DFSILAINNI TPFSPSVGTL 
TLPYVILSQE DAETVTQGEV GRQMIEKTVE DAGVRIIGWG YSGFRVLTNS KKPVASVEDM 
QGLIVRVPKN EIMIETYKSW GINPTPMAWG ETFAALQQKV VDGQDNPYMT VYAMKFDEVQ 
KYVTELRYIF SIEPLIVSEA LFEGLSEEKQ AQILAAGEAA TQASSAFLRE QESRIRDELV 
ARGMEITPPA DGEKGFIELA TAQVWPKFAD QIGGIEVLNG VLTSLGRPTV Q