Gene Tmz1t_0431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_0431
Symbol
ID	7084941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	493185
End bp	494135
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	67%
IMG OID	643697463
Product	TRAP transporter solute receptor, TAXI family
Protein accession	YP_002354106
Protein GI	217968872
COG category	[R] General function prediction only
COG ID	[COG2358] TRAP-type uncharacterized transport system, periplasmic component
TIGRFAM ID	[TIGR02122] TRAP transporter solute receptor, TAXI family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTCCC TGATCCGCAA GTGCGCCCTC GGCACCGTGT TCGTCGCCAT GACCACCGCG 
GCCTCGGCCG CCACCTTCGT GAACGTGCTG ACCGGCGGCA CCAGCGGGGT GTACTACCCG 
CTCGGCGTCA CCCTGTCGCA GCTCTACGGC GAGATCATTC CCGACAGCAA GGTCCAGGTG 
CAGGCCACCA AGGCCTCGGC GGAGAACCTC AACCTGCTGC AGGCGGGCCG TGGCGAGATC 
GGCTTCTCGC TTGCCGACTC GGTGTCCGAC GCCTGGAAGG GCAACGCCGA TGCGGGCTTC 
GCCAAGCCGC TCGACAAGCT GCGTGCGATC GCCTCGGTCT ACCCCAACTA CATCCAGATC 
GTCGCCCTGG CCGACGCCGA CGTGAAGACG CTCGCCGACC TCAAGGGCAA GCGCATCTCG 
GTCGGCGCGC CGCGCTCGGG AACGGAGATC AACGCGCGTG CCATCCTGAA GGCCGCGGGC 
CTCTCCTACG CGGACTTCGC CAAGGTCGAA TACCTGCCCT TCGGCGAATC GGTCGAGCTG 
ATGAAGAACC GTCAGATCGA CGTCACCCTG CAGTCGGCCG GCCTCGGCGT GGCGGCGCTG 
CGCGACCTGT CGGCGGCGGT GAAGGTCAAC TTCGTGCCGG TGCCGGCCGA GGTGGTGGCC 
AAGGTGGGCG ACCCCGCCTA CCGTGCGGCC GCGGTCCCGG CCAACACCTA CGAGGGCCAG 
GCCGCCGAGG TGCCGACGGT GGCGATCAAC AACCTGCTCG TGACCAACGA CAAGGTCTCG 
AACGAGGTCG CCTACCAGAT GACCAAGGGC CTCTTCGACA ACCTCGAGCG GCTGGGCAAC 
TCGCACTCCG CCGGCCGCCA GATCAAGCTC GAGAAGGCGG TCGAAGGCCT GCCGATCCCG 
CTCCATCCGG GTGCGGAGAA GTTCTATCGC GAGAAGGGCC TGATCCAGTA A

Protein sequence

MKSLIRKCAL GTVFVAMTTA ASAATFVNVL TGGTSGVYYP LGVTLSQLYG EIIPDSKVQV 
QATKASAENL NLLQAGRGEI GFSLADSVSD AWKGNADAGF AKPLDKLRAI ASVYPNYIQI 
VALADADVKT LADLKGKRIS VGAPRSGTEI NARAILKAAG LSYADFAKVE YLPFGESVEL 
MKNRQIDVTL QSAGLGVAAL RDLSAAVKVN FVPVPAEVVA KVGDPAYRAA AVPANTYEGQ 
AAEVPTVAIN NLLVTNDKVS NEVAYQMTKG LFDNLERLGN SHSAGRQIKL EKAVEGLPIP 
LHPGAEKFYR EKGLIQ