Gene Tmz1t_2356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_2356
Symbol
ID	7094278
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011667
Strand	+
Start bp	20799
End bp	21878
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	72%
IMG OID	643701044
Product	Tetratricopeptide TPR_2 repeat protein
Protein accession	YP_002364185
Protein GI	217980135
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5010] Flp pilus assembly protein TadD, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	0.337618
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.0354802
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCC GCCAAGCCCC AGAAATCTTC CAGATCCCGC TCGACGACCT CGACCCGGCG 
GGCCTGCCGC CGCGCGGCAC GCCCGAGTTC GAGCAGGCGG TGATCGGGCG CTACGCGCTC 
GACTACGCGG CGCGGGGCTG GCAGGCCGTG GTGGCGGTCG ATGAGGGTTT CGTGCGCGTG 
GTCGCGGTCC CCGAGCGCGG GGTCGAGCCG AAGGCCTACG TGCTGGGGCT GCTGCAAAAC 
GGCTTCCTGG AGGATGCGCT GCCGGTGCTC GAGGCGCTCG ACGGCATGCT GGACGACGCC 
GAGATCGCCT ACAGCCACGG GCTGTGCCTG TCCGAACTGA GGCGACCGGC AGAGGCGGTC 
GCCCCGCTGC AGCGGGCGGT CGAACTCGAC CCCACGCACG CGAACGCGTT CATCGCGCTC 
GGGGTAGCGT TCGCGCGCAC CGGGCGCGCC GACGAGGCCG CCGACGCGCT GCGCGACGCG 
GTCAAGCTCG AGCCGGAGAA CGCCTTCGCC AAGCGCAACC TGGCGGCGGT GCTGATGCGT 
TCCGGCCGGA CGGCCGAGGC GCTGCCGTTC TTCCGCCAGG CGGCGAGCCT CGCGCCGGCG 
GATCCGGGGG CGCAGCTCGG GCTCGCGCAG TGCCTGGAAG AGCTCGGGCC CTCGCACGTG 
AAGGAGGCGG CCGAGCAGTA CAAGGCGGTG GTCAAGCGTT TTCCCGAGCA CCAGGCGGGC 
GAGATGGCCG AAGAGGCGCT CACGCGCATC GGGCAGGACG AGCTGCGCGC GGCGGTCGAC 
GGCGGGCTGC GCATGGACGC GGTGATGTAC ATGCAGGCGG CGCTGGACCG CTTCGCCAAG 
CTCGACCAGG CGAAGGTCGG GCAGATCGTG ATGGAGATCG CGCTGCTCGG CCGCAACGGG 
CTCGAGATCA ACAAGCCGGC CGTGCGCTAC ACGCTCGAGA ACCTCGAGGG CGAGTTCTCC 
GGGCTGGCCC TGCTGGCGTA CATGCACGTG GGGTTCCGGA TGTTCGACGC CAAGGGCGAC 
GCCGGAACCG GGCTCGATCG CGAATACGAG GCGGCGGTGA AGATGCGCCG CGAGCGCTGA

Protein sequence

MTTRQAPEIF QIPLDDLDPA GLPPRGTPEF EQAVIGRYAL DYAARGWQAV VAVDEGFVRV 
VAVPERGVEP KAYVLGLLQN GFLEDALPVL EALDGMLDDA EIAYSHGLCL SELRRPAEAV 
APLQRAVELD PTHANAFIAL GVAFARTGRA DEAADALRDA VKLEPENAFA KRNLAAVLMR 
SGRTAEALPF FRQAASLAPA DPGAQLGLAQ CLEELGPSHV KEAAEQYKAV VKRFPEHQAG 
EMAEEALTRI GQDELRAAVD GGLRMDAVMY MQAALDRFAK LDQAKVGQIV MEIALLGRNG 
LEINKPAVRY TLENLEGEFS GLALLAYMHV GFRMFDAKGD AGTGLDREYE AAVKMRRER