Gene TM1040_3870 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3870
Symbol
ID	4074933
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008042
Strand	+
Start bp	124211
End bp	125185
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	56%
IMG OID	638004527
Product	TRAP dicarboxylate transporter, DctP subunit
Protein accession	YP_611262
Protein GI	99078003
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.427037
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGA CGTTTACCAC CGCACTGTCT GCGCTGGCAC TGACCGCGTC GGTTGGCGCG 
ACAGGCGCAA CCACCTTGAA ACTTAACCAC AATAACCCGC CAGATCATCC GGTCCACATC 
TCAATGCAGA TTATGGCAGA CCGTGTGGCA GAGCTGACCG ACGGCGAAAT CAAGATCCAA 
ATCTTCCCCA ATGCCCAGCT CGGCACTCAA CGGGAATCGA TGGAACTGGT CCAAAACTGC 
GCTTTGGAGA TGGCACGCTC CAATGCGTCC GAACTCGAAG CATTCGAGGA AAGCTATTCG 
GCGCTCAATC TGCCTTACAT CTTCTCGTCC GAAGAGCATT TCAACACGGT GATCACCGGC 
GACATCGGCC AGGATATCCT GAATTCTTCT GTCGATCAGG GTTTTCGCGG GGTCGCGTTC 
TATACCGAGG GTGCGCGTTC CTTTTATGCG CAAAAGCCGA TCATGTCCCC GGCAGACTTG 
CAGGGCGTAA AAGTGCGTGT TCAGCCAAGC CCCTCTGCCA TTCGCATGGT CGAACTTTTG 
GGCGGCAACC CGACACCGAT TTCCTGGGGT GAGCTTTATA GCGCGCTGCA GCAGGGCGTT 
GTGGATGCGG CAGAAAACAA CCCAACCGCA CTGACCACCG CACGCCATGG CGAAGTAGTC 
AGCGATTTTT CCTTGGATGA GCACACTATG ATCCCCTCGG TTGTTGTGAT CTCCAACTGC 
GCATGGGACG GTATGACTGC CGAACAGCAA AAGGCCCTGC AAACTGCTGC ACTCGACTCC 
ATGGCCGCGC ACCGCAAGGC GTGGAACGCA GCCTCCGACG CGGCGATTGA GGAAGCGAAA 
ACCACGCTGA ACGTCAATGT CCACATGGTC GACAAAGCGC CTTTCGCTGA GGCTGTCTTG 
CCAATGCATG AGGAAGTGGC GGCGAAATCC GAGCACCTTG CCGATCTGAT CGATCGCATC 
AAAGCAGCCC AATAA

Protein sequence

MTKTFTTALS ALALTASVGA TGATTLKLNH NNPPDHPVHI SMQIMADRVA ELTDGEIKIQ 
IFPNAQLGTQ RESMELVQNC ALEMARSNAS ELEAFEESYS ALNLPYIFSS EEHFNTVITG 
DIGQDILNSS VDQGFRGVAF YTEGARSFYA QKPIMSPADL QGVKVRVQPS PSAIRMVELL 
GGNPTPISWG ELYSALQQGV VDAAENNPTA LTTARHGEVV SDFSLDEHTM IPSVVVISNC 
AWDGMTAEQQ KALQTAALDS MAAHRKAWNA ASDAAIEEAK TTLNVNVHMV DKAPFAEAVL 
PMHEEVAAKS EHLADLIDRI KAAQ