Gene Tmz1t_3398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_3398
Symbol
ID	7873889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	3716798
End bp	3717802
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	61%
IMG OID	643700337
Product	TRAP dicarboxylate transporter, DctP subunit
Protein accession	YP_002890369
Protein GI	237654055
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATCC GTTCGCTTCT GGTCGGTCTG GTTGCCGTGG GTCTGTCTGC TGCAGCGGTC 
GCCGCAGACC CCATCGTGAT CAAGTTCAGC CACGTGGTGG CGCAGGACAC GCCCAAGGGC 
AAGGCTGCCG AAAAATTCAA GGAGCTCGCC GAGAAATACA CCGGCGGCGC GGTCAAGGTC 
GAGGTGTACG CGAACAGTAC CCTCTACAAG GACAAGGAGG AGATGGAGGC GCTGCAACTC 
GGTGCCGTGC ACCTGCTGGC GCCGTCTCTG GCCAAGTTCG GTCCGCTCGG TGTCAAGGAG 
TTCGAGGTCT TCGATCTGCC CTACATCTTC GACGGCTACG AGGCGCTGAA CAAGGTCACC 
CAAGGTGCGG TCGGCCAGCA GCTGCTCGCC AAGCTCGAGC CCAAGGGCAT CAAGGGCCTA 
GCCTTCTGGG ACAACGGTTT CAAGTCGTTC TCGGCCAATA GCCCGATCAG GAAGCCGGAA 
GACCTCAAGG GCAAGAAGAT GCGCATCCAG TCGTCCAAGG TGCTGGAAGA GCAGATGCGC 
GAGATCAAGT CGCTGCCGCA GGTGATGGCC TTCTCCGAGG TCTACCAAGC GCTGCAGACC 
GGCGTCGTCG ATGGGACCGA GAACCCGCAC TCCAACCTCT ACACCCAGAA GATGCACGAG 
GTGCAGAAGC ACATGACCCT GACCGACCAT GGCTACCTGG GCTATGCGGT CATCACCAAC 
AAGAAGTTCT GGGACGGCCT GCCGGCCGAG GTGCGCACGC AGCTCGACAA GGCGATGAAG 
GAATCGACCG TCTACGCCAA CCAGATCGCC AAGGAAGAGA ACGACAAGTC GCTCGCGGCG 
GTGCGTGCCT CCGGCAAGAC CGAGGTCTAT GCGCCGACCG CCGAAGAGAA AGCCGCGTTC 
AAGAAGGCGC TCGTCCCGGT GCACAAGAAG ATGGAGTCGC GCATCGGCGC AGAGCTGATC 
CAGTCGATCT ACAAGGAAAC CGGGTTCGAT CCGGCCAAGC TCTGA

Protein sequence

MKIRSLLVGL VAVGLSAAAV AADPIVIKFS HVVAQDTPKG KAAEKFKELA EKYTGGAVKV 
EVYANSTLYK DKEEMEALQL GAVHLLAPSL AKFGPLGVKE FEVFDLPYIF DGYEALNKVT 
QGAVGQQLLA KLEPKGIKGL AFWDNGFKSF SANSPIRKPE DLKGKKMRIQ SSKVLEEQMR 
EIKSLPQVMA FSEVYQALQT GVVDGTENPH SNLYTQKMHE VQKHMTLTDH GYLGYAVITN 
KKFWDGLPAE VRTQLDKAMK ESTVYANQIA KEENDKSLAA VRASGKTEVY APTAEEKAAF 
KKALVPVHKK MESRIGAELI QSIYKETGFD PAKL