Gene TM1040_3195 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3195
Symbol
ID	4075299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	190067
End bp	191065
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	57%
IMG OID	638004704
Product	TRAP dicarboxylate transporter- DctP subunit
Protein accession	YP_611431
Protein GI	99078173
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.166744
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.659935
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTGT TTTTGAAAGC CGTGGCCGTC GGCACGATGG CCCTCCACCT TGCCACGCCG 
GCCTTCGCCG ACGACATCAA GCTGCGCTTT GCAGGCGTGT TCCCCATCGA CCATCAAGGC 
ACAAAGATGA TGGAACAGGT CGCTGCAGAG GTGAACGCAG CGAATGTTGG TCTCGACATG 
ACGGTTTTTC CCGCCAGCCA GCTCGGCTCC GGTGAAGCCC TGTTCGAAGA CGTTGCGCGC 
GGCAACATCG ATTTTGCATC GGCTTTCATT TACTCCGATA CGGATCCCCG TCTGGAATTC 
CTGAACATGC CGTTCCTTGT CAGCAGCTAT GATGACATGG ACCGCGTCCT GCGCGACATG 
GATTCAGATT ACAATCGCAT CCTGCAGGAC ATTACCGCCG AATATGGTGT GCGCGTGATG 
GCCGCGAACC CCGAGGGCTT TGTCGGCATC GTGGCCTCCA AGGAGCCCGA CAACTGGAAC 
ACCTTCGACG ACAAAGGCAT GAACATCCGC GTCTGGTCGT CAAACGCTGT AAAGGCCACC 
GTCGAGTCCC TCGGCTATCG TGCGACCACA ATGGCATGGG GTGACATCTT CCCGGCGCTT 
CAGTCCGGCA TCGTCGACGG CGCGATCTGC TGCACAAAAA CCGCGACATA CTCGATCTTT 
GCTAAATCCG ACGTCGGCAG CCACTTCATC GAGTATAACT CTTTGCTGGA ACAGACATTC 
TACTATGGCT CCGAGCGCAC CCTCGCCAAG CTGAACGACG AGCAGCGCGA CGTCATTCAA 
GCTGCGATGA GCAAAGCCTC GGCCGACTTC TTCGCCTACA ACCGCGAAAA CGACGCAGCC 
TTCGGTCAAA AGCTGATCGA CAGCGGCTAC ACCATTTTGA AGCTCAACGA CGAGGATCAA 
CAGGCGATGG CCGAGTATGT GCGCAAAACC ATCTGGCCGA CAATGGAAAG CGCAGTCGGC 
AAAGACGTCA TCGATCGCGT GCTGGCGGCT GTTCAATAA

Protein sequence

MNVFLKAVAV GTMALHLATP AFADDIKLRF AGVFPIDHQG TKMMEQVAAE VNAANVGLDM 
TVFPASQLGS GEALFEDVAR GNIDFASAFI YSDTDPRLEF LNMPFLVSSY DDMDRVLRDM 
DSDYNRILQD ITAEYGVRVM AANPEGFVGI VASKEPDNWN TFDDKGMNIR VWSSNAVKAT 
VESLGYRATT MAWGDIFPAL QSGIVDGAIC CTKTATYSIF AKSDVGSHFI EYNSLLEQTF 
YYGSERTLAK LNDEQRDVIQ AAMSKASADF FAYNRENDAA FGQKLIDSGY TILKLNDEDQ 
QAMAEYVRKT IWPTMESAVG KDVIDRVLAA VQ