Gene TM1040_2069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2069
Symbol
ID	4077996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2172766
End bp	2173767
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	59%
IMG OID	638007388
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_614063
Protein GI	99081909
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.828242
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAGT CACTTTTGAC CACCGCAGCC ACGGCGGCTG CTTTCACCCT GTCGCTCGGC 
GCTGCAGACG CGGCAGACAT GCGGCTCAAA CTCGCCGGGG TCGTCCCGGT CGAACACTTC 
GGCAATGACA TTCTGAAGCA GATCGAAGCG GATATCGAAG GCGCTGATGT GGGCCTCTCG 
GTGACCTTGT TTGAGGCGGG GCAGCTGGGC TCTGGCGAAG AGCTGTTCGA GGACGCCGCG 
CGCGGCAACG TCGATCTGGT GCATTCCGTG ATCTACGCGC ATCGTGACCC GGTGCTGGAG 
ATCAACTCCT TGCCTTATCT GGTGTCGAGC TTTGATGAGA TGGAAGACAT CTATCTCAAC 
AAGGACAGCG CCTTTAACGA GATTTTTGCC GAGCGTCTGG AGGGGCTGGG GCTGAAACTT 
CTGGCCAATG CACCCGAAGG TTTCATCGGC GTTGTGGCCG AGAACCTTCC TGAAAACGCC 
ACCTCGGTCG GCGACAAGGA CGTCAATATT CGCGTCTGGT CGAGCCAGGT GATCAAAAAC 
ACCGTCGAGG CCATGGGCTT TAACGCCACC ACGATGAACT GGGGTGAGGT TTTCCCCGCG 
ATCCAGTCCG GCGTCGTGGA CGGGGCCATC TGCTGCACCG CGCAGCTGGC CTATAGCGCC 
TTTGCCACCT CGGATGTGGG CAAGTATTTC ATCCCCTATG GCGCAGTGGT CGAGAACACG 
ACCTATTACG CCTCCATGGA AACATGGGAA GAGATGAACG ACGAACAGCG CGCCGCCGTA 
CAGGCCGCCT TCGACAAGGC CGCACAGACC TATTTTGCCG AGGCCAAGGC GAATGAGGCG 
GGCTATATCG ATAAGCTTAA AGAGACCGGT TACGAGGTCG TTGAAGTTTC TGACGCCGAA 
CGCAGCGCGA TTGCTGAAAC CGTGCGTAAG GACGTCTGGC CCGGCATTGC CGAGATCGTT 
GGTCAGGACG TCATCGACCG CCTGATGACC GCCAAGAACT GA

Protein sequence

MRKSLLTTAA TAAAFTLSLG AADAADMRLK LAGVVPVEHF GNDILKQIEA DIEGADVGLS 
VTLFEAGQLG SGEELFEDAA RGNVDLVHSV IYAHRDPVLE INSLPYLVSS FDEMEDIYLN 
KDSAFNEIFA ERLEGLGLKL LANAPEGFIG VVAENLPENA TSVGDKDVNI RVWSSQVIKN 
TVEAMGFNAT TMNWGEVFPA IQSGVVDGAI CCTAQLAYSA FATSDVGKYF IPYGAVVENT 
TYYASMETWE EMNDEQRAAV QAAFDKAAQT YFAEAKANEA GYIDKLKETG YEVVEVSDAE 
RSAIAETVRK DVWPGIAEIV GQDVIDRLMT AKN