Gene Tmz1t_1156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_1156
Symbol
ID	7084685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	1279579
End bp	1280520
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	72%
IMG OID	643698171
Product	Mammalian cell entry related domain protein
Protein accession	YP_002354811
Protein GI	217969577
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAACCC GCGCCCATCA TGTGCTGATC GGCCTCTTCA CCGTGCTCGT CGTCGGCGCC 
GCGCTGATGT TCGCGCTGTG GCTGGGCAAG AGCGACGCCG ACCGCCAGTT CGAGGTGTAC 
GACATCGTCT TCCAGGAGGC GGTCTCCGGC CTGTCCAAGG GTGGCACGGT GGAGTTCAAC 
GGCATCAAGA TCGGCGACGT GGTCAGCCTG CGCCTCGATC CCGCCGATGC GCGCCGCGTC 
ATCGCCCGCG TGCGCGTGGA CAGCGCCGCG CCGGTGCGCA GCGACACCCG CGCCCGCCTG 
GTGCCTGCCG GCATCACCGG CTTGACCATG ATCCGCCTGA CCAGCGGCGA GGATCCGGCG 
AGCACGCCCC TGGTGTCCAA GGGCGACGAG GTGGCGCGCA TCATCGCCGC GCCTTCGCCG 
CTGAGCCGCC TGCTCGCCGA CGGCGAGGAC GCGATCACCA ACGTGAACGA CCTGCTGGTG 
CAGGCGCGCG AGCTGCTCTC GGCCGACAAC GTGGCCTCGT TCGGGCGCAC GCTGGGCAAC 
CTGGAGCTGG CCACCGGCGC GCTCGCCGCG CAGCGCGAGG ACCTCAACGC CGCGTTGCGC 
GAGGTCACCC AGGCCAGCCG CGACGCCAGC ACTGCGCTCG CCGAGGCTGC CCGCATGCTC 
GGCTCGGCCA ACAGGCTGGT GGAGGTGCAG GGCACGCAGA CCCTGGACAG CGCACGCGAC 
GCGATGCGGG CCTTCGAGCG CGCGATGGGC ACGGTCGACC GCCTGATCGC CGACAACCGC 
GCGCCGCTCG ACGGCGGCAT GCGCGGCCTG GCCGAGATCG GCCCCGCGGT GGCGGAGCTG 
CGCACCACGC TGGCTTCGCT GCGCATCATC ACCCGCCAGC TCGAGAGCCG TCCCGCCGAC 
TACCTGCTCG GCCTCGAACC GACCAAGGAG TTCACCCCGT GA

Protein sequence

METRAHHVLI GLFTVLVVGA ALMFALWLGK SDADRQFEVY DIVFQEAVSG LSKGGTVEFN 
GIKIGDVVSL RLDPADARRV IARVRVDSAA PVRSDTRARL VPAGITGLTM IRLTSGEDPA 
STPLVSKGDE VARIIAAPSP LSRLLADGED AITNVNDLLV QARELLSADN VASFGRTLGN 
LELATGALAA QREDLNAALR EVTQASRDAS TALAEAARML GSANRLVEVQ GTQTLDSARD 
AMRAFERAMG TVDRLIADNR APLDGGMRGL AEIGPAVAEL RTTLASLRII TRQLESRPAD 
YLLGLEPTKE FTP