Gene Tmz1t_0253 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_0253
Symbol
ID	7084375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	286815
End bp	288122
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	64%
IMG OID	643697296
Product	integrase family protein
Protein accession	YP_002353944
Protein GI	217968710
COG category	[L] Replication, recombination and repair
COG ID	[COG4973] Site-specific recombinase XerC
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000373788
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTAGCA TCCGTGCCAG AAAGGATAAC GGAATGCTCT TCATCGACTT CCGGTACCAG 
GACAAGCGTT ACCGCGAACA GACCGCGCTC GGCGACACCG CAGCCAACCG CAAGCGCTTG 
CAGAAGGTGC TTGACCGCAT CGAGGCCGAC ATCGCCGCCG GCACCTTCGA CTACCGCCGC 
TTCTTCCCAG GCAGCAAGAA CGCCGCGAAG TTCGATCCAG CCCCTGGGGG GATGGTCGGG 
CCGGTCAGCG CTGCTGCGGT TGCGTTGCCG TCGGCGGCAG CCAGCGTCGC GAGCACTCCG 
CTCTTCAAGG ACTTCGCAGA GACCTGGTAC GGCGAGAAAG AGGTGGAGTG GCGGCGTTCG 
TACAAGACCA CGCTGCGCGC GACCCTCGAT CGCGCCCTCA TCCCGAGGTT CGGGGAGAAG 
GAGGTCGGCC AGATCTCCAA GGCGGACGTC CTTGCCTATC GCGCCGAGCT CGGGAAAGCG 
ACCGCGAAAG GCAAGCAAAC CAAACTGTCT GCGGCAAGGA TCAACAAGAT GCTGAACCCG 
CTCAGGCAAG TCCTCAATGA AGCGGCCGAC CGGTTTGATT TTCGCACGCC CTTCGACAGC 
GTGAAACAGC TCAAGACGAA GCGCACCGAC GTCGATCCCT TCACCCTCGC CGAGGTCAAG 
CAGATCCTCG ACACCGTGCG GCCCGACTTC AGGAACTACT TCACCGTGCG CTTCTTCACC 
GGCCTGCGCA CCGGCGAGGT CGACGGACTG CAGTGGAAGT ACGTCGACTT CGACAACCGC 
CTCATCCTGG TTCGCGAGAC CATCGTCGGC GGTGAAGAGG AATACACCAA GACGGACGGC 
AGCCAGCGCG ACATCCAGAT GAGTCAGCTC GTCTTCGATG CGCTGCAGGC GCAGTTCGAG 
GCCACCGGCA AGCTCGGCAA GTTCGTGTTC TGCAATCGGC TGGGGACGCC GCTGGACCAC 
AAGAACGTCA CCAACCGGGT GTGGTACCCG CTGCTGCGGC ACCTCAACCT CAAGCAGCGC 
CGGCCGTATC AGTGCCGCCA CACCGCCGCC ACGCTGTGGC TCGCCAGCGG CGAGGCGCCC 
GAGTGGATCG CCCGTCAGCT CGGGCACACC ACCACCGAGA TGCTGTTTCG GGTGTATTCG 
CGCTACGTGC CCAACCTCAC GCGGCGGGAT GGCTCGGCCT TCGAGCGCCT CATCACGCAG 
ACCCTCGGCA CCCAGCTCCT GCCGGTGAAG ACCGCCCCTG CGGAGGAGGC GGAGCAGGAG 
GCCGAGCTGC TGGCAGAGAA CGCCGCTCAA GGAGGAGACC ATGAGTGA

Protein sequence

MASIRARKDN GMLFIDFRYQ DKRYREQTAL GDTAANRKRL QKVLDRIEAD IAAGTFDYRR 
FFPGSKNAAK FDPAPGGMVG PVSAAAVALP SAAASVASTP LFKDFAETWY GEKEVEWRRS 
YKTTLRATLD RALIPRFGEK EVGQISKADV LAYRAELGKA TAKGKQTKLS AARINKMLNP 
LRQVLNEAAD RFDFRTPFDS VKQLKTKRTD VDPFTLAEVK QILDTVRPDF RNYFTVRFFT 
GLRTGEVDGL QWKYVDFDNR LILVRETIVG GEEEYTKTDG SQRDIQMSQL VFDALQAQFE 
ATGKLGKFVF CNRLGTPLDH KNVTNRVWYP LLRHLNLKQR RPYQCRHTAA TLWLASGEAP 
EWIARQLGHT TTEMLFRVYS RYVPNLTRRD GSAFERLITQ TLGTQLLPVK TAPAEEAEQE 
AELLAENAAQ GGDHE