Gene Rsph17029_3620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3620
Symbol
ID	4898664
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	712331
End bp	713422
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	65%
IMG OID	640114228
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_001045482
Protein GI	126464369
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.39212
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCCTTCCC GCCCCCGTGA CGGGGACGGG CTACAGCTCA AAAGAGCATT CAGAAAGGGA 
GGAGACCTGA TGAATTACCT GACTTCCACC GCCGTGGCGC TGATCGCCGC GCTTACCGCC 
GGCTCGGCCG CGATGGCGCA GGAACACCAT TTCCGCTTCC AGTCCTCGGA CCCGGCGGGC 
AACCCGAACT TCGAGCTGCA GCATGTCTTC GCCGACAAGG TGAAGGAGCT GACCAACGGT 
GAGGTCACGA TCGAGCTCAT GCCGGTCGGC ACCATCGTCG ACTACAAGGA GACGCCCGAC 
GCGATCCAGG CCGGGCTGAT CGACGGCCAT ATCACCGACA CCTCCTATTT CGCCGGCCGT 
GACCCGGCCT TCGGCCTGAT CGCGAACCCG GTCGGCGCCT GGGCGGACCC CGCGCAGATG 
ATCGACTTCG TCGAGAACGG CGGCGGCAAG GAGCTGATGA ACGAGCTCAT CAATCCCTAC 
GGGCTCCAGT TCATCGGCGT CTCGACCCCG GGCCTCGAGG CTTTCGTCTC GAAGGTGCCG 
CTCGACACGG TGGAGGATCT GAAGGGCGTG AAGGTCCGCT CGCCGGAGGG GCTGATCGCC 
AACGTCTTCG CCGCCGCGGG CGCGAACCCG GTCAACCTGC CCTCGTCCGA GGTCTATACC 
TCGCTCGACA AGGGCGTGAT CGACGCGGCC GACTATTCGG TCTTTTCGGT GAACCAGGAC 
ACCGGGATGA ACGATATCGC GCCGCATCCG GTCTATCCGG GCTTCCACTC GCTGCCGCTC 
GTCGAAGTGT CGATGAACAA GCAGAAGTGG GACGCGCTGA CGCCCGAGCT GCAGGCCAAG 
ATCACCGAGG CGCAGAAGAT CTTCCAGCAG ACCCAGATCG ACACGCTGCA CCAGCGCGAT 
CTCGAGGCCG TCGAGGCCGC CAAGGCCGGC GGCAAGATCA CGGTCCACGA CTGGTCGGAC 
GAGGAACGCG CCAAGTTCAG GGGCATCGCC CGCGGCGAAT GGGAGAAGGT CGCCGGCCAG 
TCCGAGATGG CGCAGAAGGT CTATGACACG CTCGTGACCT ATCTGAAGGA CAAGGGCCTG 
ATGGCCGAGT GA

Protein sequence

MPSRPRDGDG LQLKRAFRKG GDLMNYLTST AVALIAALTA GSAAMAQEHH FRFQSSDPAG 
NPNFELQHVF ADKVKELTNG EVTIELMPVG TIVDYKETPD AIQAGLIDGH ITDTSYFAGR 
DPAFGLIANP VGAWADPAQM IDFVENGGGK ELMNELINPY GLQFIGVSTP GLEAFVSKVP 
LDTVEDLKGV KVRSPEGLIA NVFAAAGANP VNLPSSEVYT SLDKGVIDAA DYSVFSVNQD 
TGMNDIAPHP VYPGFHSLPL VEVSMNKQKW DALTPELQAK ITEAQKIFQQ TQIDTLHQRD 
LEAVEAAKAG GKITVHDWSD EERAKFRGIA RGEWEKVAGQ SEMAQKVYDT LVTYLKDKGL 
MAE