Gene TM1040_1813 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1813
Symbol
ID	4076959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1905025
End bp	1906029
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	59%
IMG OID	638007128
Product	TRAP dicarboxylate transporter, DctP subunit
Protein accession	YP_613808
Protein GI	99081654
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.24254
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTTT TGACCGCTGC CGCAACCGCA CTGGCTCTGA GCGTGACCGC AGGTGTGGCG 
CAGGCCGATG CCTGTGATGA TGGCGAAATC GTCGTCAAGT TCAGCCACGT TACCAACACC 
GACAAGCACC CCAAGGGGAT CGCGGCGTCC TTGCTGGAAA AGCGTGTAAA CGAAGAGATG 
AACGGCACCA TGTGCATGGT CGTCTATCCG AACTCCACGC TGTATGACGA CAACAAGGTT 
CTCGAAGCGA TGCTGCAGGG CGACGTGCAG CTGGCGGCGC CTTCGCTGTC GAAATTCGAG 
AAGTTCACCA AGCAGTTCCG CCTGTTTGAC CTGCCGTTCA TGTTCAAGAA CATCGACGCC 
GTGGACGCAT TCCAGGCTTC TGAAAATGGT CAGGCCATGC TCGACAGCAT GCAGCGCCGC 
GGCCTGCAGG GTCTTGGCTA CTGGCACAAC GGCATGAAGC AGATGTCTGC CAACAAGCCG 
CTCGTGATGC CCGAAGACGC CAATGGCCTG AAGTTCCGCG TGCAGTCTTC GGACGTGCTG 
GTGGCGCAGA TGGAAGCGAT CGGTGGCAGC CCGCAGAAAA TGGCCTTCTC CGAAGTCTAT 
GGCGCGCTGC AGCAGGGCGT TGTGGATGGC CAGGAGAACA CCTGGTCCAA CATCTACGGC 
AAGAAGTTCT TTGAAGTTCA GGACGGTATC ACAGAAACCA ACCACGGCGT GCTCGACTAT 
CTGGTTGTGG CTTCGGTGGA CTGGCTCGAC AGCCTTGAGC CTGAGGTGCG TGACCAGTTC 
ATGACCATCA TGACCGAAGT GACCGCAACC CGGAACGCCG AATCCACCCG CGTCAACAAC 
GAAGCCAAAG AGGCCATCGT TGCGGCAGGT GGCGAAGTGC GCCAGCTTAC CGCTGAGCAG 
CGTCAGGCTT GGGTCGACGT GATGAAGCCC GTCTGGGAGC AGTTCTCCGG TGACGTGGGT 
CAGGACATGA TCGACGCTGC ACAGTCGATC AACGCCGGCT TCTAA

Protein sequence

MKFLTAAATA LALSVTAGVA QADACDDGEI VVKFSHVTNT DKHPKGIAAS LLEKRVNEEM 
NGTMCMVVYP NSTLYDDNKV LEAMLQGDVQ LAAPSLSKFE KFTKQFRLFD LPFMFKNIDA 
VDAFQASENG QAMLDSMQRR GLQGLGYWHN GMKQMSANKP LVMPEDANGL KFRVQSSDVL 
VAQMEAIGGS PQKMAFSEVY GALQQGVVDG QENTWSNIYG KKFFEVQDGI TETNHGVLDY 
LVVASVDWLD SLEPEVRDQF MTIMTEVTAT RNAESTRVNN EAKEAIVAAG GEVRQLTAEQ 
RQAWVDVMKP VWEQFSGDVG QDMIDAAQSI NAGF