Gene Rsph17029_3018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3018
Symbol
ID	4898651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	26408
End bp	27547
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	65%
IMG OID	640113620
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_001044890
Protein GI	126463777
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCTT TCGAGAAGAA AGCGGCGTAT TCGCGCCGCT CGTTCCTGCG CACCGGTGCC 
TTGGCCGGGG GTGCGGCGGC GGGGTCTGTC CTGGCGGCTC CGGCCGTTCT GGCCCAAGCG 
CCGCTGGTGA TGAAGATGCA GACATCCTGG CCCGCCTCGG ACATCTGGAT GGACTTCGCC 
CGCGAATATG TCACGCGGGT CGAGGAGATG TCGGGCGGCA GGCTCAAGGT GGACCTGCTG 
CCGGCCGGAG CCGTGGTCGG CGCCTTCCAG GTGATGGATG CCGTGCATGA CGGCGTGATC 
GACGCCTCGC ATTCCGTGTC GGCCTACTGG TACGGCAAGT CGAAGGCGGC CTCGTTCTTC 
GGCACGGGCC CGGTCTTCGG CGGTTCGGCG ACCACGATGC TCGGCTGGTT CTATCAGGGC 
GGCGGTCAGG ATCTCTACCG CGAGCTGACC CAGGACATTC TCGGAATGAA CATCGTGGGC 
TTCTACGGCT TCCCGATGCC GGCCCAGCCC TTCGGCTGGT TCAAGACCGA GGTGAACGGC 
GTCGCCGACA TCCAGGGCTT CAAATACCGG ACCGTGGGGC TGGCGGCCGA CCTGCTGCAG 
GCGATGGGCA TGTCGGTGGC GCAGCTGCCC GGCGGCGAGA TCGTGCCGGC GATGGAGCGG 
GGCGTGATCG ACGCGTTCGA GTTCAACAAC CCCTCGTCGG ACATGCGCTT CGGCGCGCAG 
GACGTGGCGA AGAACTACTA TCTCTCCTCC TACCATCAGG CGTCCGAGAG CTTCGAATAT 
ACGTTCAACC GCGATTTCTA CGAGGATCTG GATCCCGACC TGCAGGCGAT CCTGAAATAT 
GCAGTGGAGG CGGCCTCGAC CTCGAACACG GCGCTGGCGC TGCGCCAGTA TTCGGCCGAT 
CTCGCGACGC TCGCGGCCGA AAACGGGGTC GCGGTGCATC GGACCCCGAA GGATATCCTT 
TCGGGCCAGC TCGAGGCCTG GGACAAGCTG ATCGTGGATC TCGAGGCCGA CGAGTTCTTC 
AAGAAGGTCC TCGACAGCCA GCGCGCCTGG GTGGAGCAGG TGAGCTATTA CGAGCTGATG 
AACGCGGCCG ACCTCGGGCT GGCCTACGAA CATCACTTCC CCGGCAAGCT CAAGCTCTGA

Protein sequence

MTAFEKKAAY SRRSFLRTGA LAGGAAAGSV LAAPAVLAQA PLVMKMQTSW PASDIWMDFA 
REYVTRVEEM SGGRLKVDLL PAGAVVGAFQ VMDAVHDGVI DASHSVSAYW YGKSKAASFF 
GTGPVFGGSA TTMLGWFYQG GGQDLYRELT QDILGMNIVG FYGFPMPAQP FGWFKTEVNG 
VADIQGFKYR TVGLAADLLQ AMGMSVAQLP GGEIVPAMER GVIDAFEFNN PSSDMRFGAQ 
DVAKNYYLSS YHQASESFEY TFNRDFYEDL DPDLQAILKY AVEAASTSNT ALALRQYSAD 
LATLAAENGV AVHRTPKDIL SGQLEAWDKL IVDLEADEFF KKVLDSQRAW VEQVSYYELM 
NAADLGLAYE HHFPGKLKL