Gene TM1040_2067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2067
Symbol
ID	4077994
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2170824
End bp	2172110
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	60%
IMG OID	638007386
Product	TRAP dicarboxylate transporter- DctM subunit
Protein accession	YP_614061
Protein GI	99081907
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1593] TRAP-type C4-dicarboxylate transport system, large permease component
TIGRFAM ID	[TIGR00786] TRAP transporter, DctM subunit

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTATTC TCGGCAGTCT TTTTATCCTG TGTGTGCTGC TCCTCATTGG GGTGAGCGTG 
CCTCTGGCCT TTGGTGGCGT GCTGGTCTTT ATCGGCGTCT TTGGCGGCCA TGATGTGACC 
GGGTTCCTGC CCACGGGGCA CTGGAAGATG AATTCCATCG TGCTGCTTGC GATTCCGCTG 
TTCATTCTGG CAGGTGCTAT CATGGAGCGG GGGCGGATCG CGGCGCCGCT GGTGTCGGTG 
GCGGAGCTTC TGGTGGGGCG CATCCACGGG GGGCTCAGCG CGGCGGCGGT GTTCGCCAGC 
GGTATCTTCG GCTCGATCTC GGGCTCTGCG GCGGCGACGC TGACCTGTAT CGGGTCGATT 
ATGATGCCGC ACCTGAAGGC CGCGAATTAC CCGCGCGGCC CGGCGGCGGC GCTGATTGTG 
GCGGCCTGTC CCTTGGGGCT CCTGATCCCG CCGTCGTCGT CGCAGATCCT TTATGCGTGG 
GTGGCGCAGC AATCGGTGCT GAAGTGTTTC CTTTCGACCG TGGTGCCGGG GCTTATCCTG 
ATTACGCTTT TGTGCATGGT GAACTACGTA CTGATGCGCA AGGCGGACCT GAAACTGCTC 
GAACGCCCGG CAAGCTACCC GCAGGAATTC GTGCGCCGCG GTGGGCGGGC CTTTCCGGCG 
CTGTTGATGC CGATCATCAT TCTTGGCGGT ATCTACGGCG GCATCATGAC CCCGACCGAG 
GCCGCAGGCG TGGCGGTGAT CTATGCCATT CCCGTTGGCC TGTTCATCTA TCGCGGCCTT 
ACGCCTCAGA ATATCTGGCC GACCCTGCGC TATGCGGGCA CCACCATCGG TGTGGTGATG 
CTGATGGTCT TTGTGGTAGT GATCGTCAGC CGCTTTCTGG TCTTTGAAGA CATCCCCGGG 
ATGGCCAAGG ATCTGATCTT CTCGATCTCG GACAACCCGA TCGTGATCTT GCTGATGGTC 
AATCTGGTGA TGATCCTCAT CGGTATGCTG ATGGATGATA TTTCAGGGCT GTTGCTGTCA 
GCACCGCTCC TGTTGCCCAT CGTACAAAGC GTCGGAATGG ACCCGGTGCA TTTTGCCGCC 
GTCCTTGGCG TCAACCTCGG CATGGCCAAC ATCACGCCGC CCACGGCACC GCTGTTGTAT 
CTAGGTGCAA AGGTCACCGA CACACCCGTG AGCGAGATGC TGAAGCCCAC CTTCATCATG 
ATCCTGTTTG CATGGCTGCC GACGCTGCTG ATCACCACAT TTGTGCCCGA GGTGGCGCTG 
TGGCTGCCCA ATTTTGTCTT TGGCTAA

Protein sequence

MIILGSLFIL CVLLLIGVSV PLAFGGVLVF IGVFGGHDVT GFLPTGHWKM NSIVLLAIPL 
FILAGAIMER GRIAAPLVSV AELLVGRIHG GLSAAAVFAS GIFGSISGSA AATLTCIGSI 
MMPHLKAANY PRGPAAALIV AACPLGLLIP PSSSQILYAW VAQQSVLKCF LSTVVPGLIL 
ITLLCMVNYV LMRKADLKLL ERPASYPQEF VRRGGRAFPA LLMPIIILGG IYGGIMTPTE 
AAGVAVIYAI PVGLFIYRGL TPQNIWPTLR YAGTTIGVVM LMVFVVVIVS RFLVFEDIPG 
MAKDLIFSIS DNPIVILLMV NLVMILIGML MDDISGLLLS APLLLPIVQS VGMDPVHFAA 
VLGVNLGMAN ITPPTAPLLY LGAKVTDTPV SEMLKPTFIM ILFAWLPTLL ITTFVPEVAL 
WLPNFVFG