Gene Tmz1t_1089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_1089
Symbol
ID	7084618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	1186023
End bp	1187225
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	73%
IMG OID	643698105
Product	hypothetical protein
Protein accession	YP_002354745
Protein GI	217969511
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.806795
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCTT CCCCGACTTT CCGCTCTACG CTGCTCTCGC AACGCGCTGC CGACATCCAG 
CCCTTCCACG TCATGGAACT GCTGCGCCGC GCGCGCGAAC TCGAGGCGCA GGGGCGCGAC 
ATCATCCACA TGGAGGTCGG CGAGCCCGAC TTCGGCACCC CGGCGCCGGT GGTCGAGGCC 
GCCACCCGCT TCCTCGCCGG CGGCGACGTG CATTACACCC CGGCGCTCGG CCTGCCGGCG 
CTGCGTGAGG CGATCGCGCG CTTCTATCAC GACCGCTTCG GCGCCGACGT CGCGCCCGAG 
CGCATCGTCG TCACCGCCGG CGCCTCGGGC GCGCTGATGC TGGCGCTCGC CGCCACCACC 
GATCCGGGCG ACGAGTGGCT GCTGCCCGAC CCCGGCTATC CCTCCAACCG CCACCTGATC 
CGCGCCTTCG AAGGGGTCGC GCGCGCGCTC GCGGTCGATG CCGCGAGCCG CTACCAGCCC 
CGCCCCGAGC AGGTCGACGC CGCCTGGGGC AAGCGCACCC GCGGGCTGAT GGTGGCGACA 
CCGTCCAACC CCACCGGCAC GCTGCTCTCG GTCGCGGAGA TCGCCGCGCT GCACCGGCGC 
ACCCGCGCGC GTGGCGGCGT GCTGCTGGTC GACGAGATCT ACCAGGGGCT GACCTACGGC 
GTGGAATCGG CCAGCGCACT TGCCGACCCG GTGCTGAACG CGGCCGACGA CGTCTTCGTG 
GTGAACAGCT TCTCGAAGTA TTTCGGCATG ACCGGCTGGC GGCTCGGCTG GCTGGTGGCG 
CCGGCGGGCT TCGTGCGCGA GCTCGAGAAG CTCGCCCAGC ACTTCTTCAT CTCGCCGTCG 
ACGCCGGCGC AGCACGCCGC GCTCGCGGCC TTCGCGCCGG CGACGATCGC GATCCTGGAG 
GAGCGCCGCC ACAAGTTTGC CCAGCGCCGC GACGTGCTGC TGCCGGCGCT GCGCGCGCTC 
GGCTTCGGCA TCGCCGCGGA GCCGCAGGGG GCGTTCTACG TGTATGCGGA CGTGTCGGCG 
CTCGCCGACG ACTCGGAAGC GCTCGCGCGC CGGATGATCG AGGAAGCGGG CGTGGCCGCG 
ACGCCCGGCC TGGATTTCGG CCACCACCTG CCCCGCCGCC ACCTGCGCAT CGCGTACACC 
ACGCACGGCG CGCGACTGCT GGAGGCTGCG GAGCGGATCC GCCGACTAGG ACTGGGAAGC 
TGA

Protein sequence

MTASPTFRST LLSQRAADIQ PFHVMELLRR ARELEAQGRD IIHMEVGEPD FGTPAPVVEA 
ATRFLAGGDV HYTPALGLPA LREAIARFYH DRFGADVAPE RIVVTAGASG ALMLALAATT 
DPGDEWLLPD PGYPSNRHLI RAFEGVARAL AVDAASRYQP RPEQVDAAWG KRTRGLMVAT 
PSNPTGTLLS VAEIAALHRR TRARGGVLLV DEIYQGLTYG VESASALADP VLNAADDVFV 
VNSFSKYFGM TGWRLGWLVA PAGFVRELEK LAQHFFISPS TPAQHAALAA FAPATIAILE 
ERRHKFAQRR DVLLPALRAL GFGIAAEPQG AFYVYADVSA LADDSEALAR RMIEEAGVAA 
TPGLDFGHHL PRRHLRIAYT THGARLLEAA ERIRRLGLGS