Gene Rsph17029_2138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2138
Symbol
ID	4895223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2265513
End bp	2266490
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	63%
IMG OID	640112732
Product	TRAP dicarboxylate transporter, DctP subunit
Protein accession	YP_001044013
Protein GI	126462899
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.231468
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.866818
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAA CAATGATCGC GACCCTGCTG GCGAGCGCCG CGCTCGCGGC ACCCGCCTTC 
GCCGAGTGCG AGGTGACGCT GCGGTCTTCG GACACGCACC CGGATGGCTA TCCGACCGTC 
GAGGGCGTCA AGTTCATGGC CGAGCGCGCC AAGGAACTGT CGAACGGGCG CATCTGCATC 
GAGGTCTTCC CCTCGTCGCA GCTCGGCGAA GAGAAGGACA CGATCGAGCA GACCCAGTTC 
GGCGTGATCG ACATGGTGCG CGCCTCGTTC GGCTCGTTCA ACGACATCGT GCCCGAGGCG 
CAGCTCCTGT CGCTGCCCTA CCTCTTCCGC TCGGAAGAGC ATCTGCACAA TGTGATGGAC 
GGCCCGATCG GCGACGAGCT CGCCAAGGCC TTCGAGGCCA AGGACCTGAT CGCGGTGGCC 
TACTATGACG GTGGCTCGCG CAGCTTCTAC AACAGCCAGA AGCCGATCAC CAAGGTCGAG 
GACCTCAAGG GCATGAAGTT CCGCGTCATG CAATCGGACG TGTTCGTGGA CATGATGTCC 
GCGCTCGGCG CCAATGCGAC GCCGATGCCC TACGGCGAGG TCTATTCCTC GATCCAGACC 
GGCGTCATCG ACGGGGCCGA GAACAACTGG CCGTCCTACG ACAGCTCGGG CCATTTCGAG 
GTGGCGAAAT ACTACACGCT CGACCAGCAT CTGATGGTGC CCGAGCTGGT GGCGATCTCG 
AAGATCAAGT GGGACGCGCT CTCGCCCGAG GACCAGCAGG TGCTGCGTCA GGCGGCCGAA 
GAGTCCGAGC CCGTGCAGCG CAAGCTCTGG GCCGAGCAGG AGAAGGCCTC GGAAGAGAAG 
GTCGTGGCCT CCGGCGCTGA GGTCGTGCGC GAGATCGACA AGACCCCCTT CATCGAGGCG 
ATGGCTCCGG TCTACGAGAA ATACGTGACC AAGTCGGAAT ATCAGGATCT CGTGAAGCGG 
ATCCAGGAAA CCCAGTGA

Protein sequence

MKKTMIATLL ASAALAAPAF AECEVTLRSS DTHPDGYPTV EGVKFMAERA KELSNGRICI 
EVFPSSQLGE EKDTIEQTQF GVIDMVRASF GSFNDIVPEA QLLSLPYLFR SEEHLHNVMD 
GPIGDELAKA FEAKDLIAVA YYDGGSRSFY NSQKPITKVE DLKGMKFRVM QSDVFVDMMS 
ALGANATPMP YGEVYSSIQT GVIDGAENNW PSYDSSGHFE VAKYYTLDQH LMVPELVAIS 
KIKWDALSPE DQQVLRQAAE ESEPVQRKLW AEQEKASEEK VVASGAEVVR EIDKTPFIEA 
MAPVYEKYVT KSEYQDLVKR IQETQ