Gene Tmz1t_2044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_2044
Symbol
ID	7083804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	2309297
End bp	2310565
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	68%
IMG OID	643699071
Product	glucose-1-phosphate adenylyltransferase
Protein accession	YP_002355688
Protein GI	217970454
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0448] ADP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR02091] glucose-1-phosphate adenylyltransferase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.11896
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGCCG AAGCCGCCAA CCGACGACGG ATCCTCACGC GCCGCACCCT CGCCCTCGTG 
CTCGCCGGCG GGCGCGGCTC GCGCCTGCGC GATCTCACCA ACGTGCGCGC CAAGCCGGCG 
GTGCACTTCG GCGGCAAGTT CCGCATCATC GACTTCGCGC TGTCGAACTG CATGAACTCG 
GGTCTGCGCC GCATCGGCGT GATCACACAG TACAAGTCGC ACTCGCTGCT GCGCCACCTG 
CAGCGCGGCT GGAGCTTCCT GCGCAACGAG ATGGGCGAAT TCGTCGACCT GCTGCCGGCG 
CAGCAGCGCA TCGACGAGGA ACAGTGGTAC CAGGGCACCG CCGACGCGGT GTTCCAGAAC 
CTCGACATCA TCCGCAACTC CACGCCGCCC GACTACATCG TCGTGCTCGC CGGCGACCAT 
GTGTACAAGA TGGACTACTC GATCATGCTC GAGGACCACG CCGCGAGCGG GCGCGGTGTC 
ACCGTGGGCT GCATCGAGGT ACCGCGCGAG GAGGCCAAGG CCTTCGGCGT GATGGCGATC 
GATGCACGGC GCCACATCAC CGCCTTCGTC GAGAAGCCCG CCGACCCGCC AGCGCTGCCG 
GGCAATCCCG GGCTGTCGCT CGCCAGCATG GGCATCTACA TATTCTCGGC CAACTACCTC 
TACCGCCTGC TCGAGGACGA CGCGAAGAAT CCGGACTCCA GCCACGACTT CGGCAAGGAC 
CTGATTCCGC GCGCGGTGGC GGAAAACCAG GCGCTCGCCC ACCCCTTCAC GCTGTCGGCG 
ATCGCCACCC CGCCCTTCTC CGGCCCCTAC TGGCGCGACG TCGGCACGGT GGACGCCTAC 
TGGGCGGCCA ACCTCGACCT CGCCTCGACC ACGCCGGCGC TCAACATGTA CGACAAGGAC 
TGGCCGATCT GGACCTACCA GGAGCAACTA CCGCCGGCCA AGTTCGTGCA CGATCTCGAC 
GGTCGCCGCG GCGAGGCGCT CAACGCGCTG GTCTCGGGCG GCTGCATCGT CTCCGGATCG 
GTCGTGCGCG AGTCGGTGCT GTTCTCCAAC GTGCTGGTGC GCTCCTACAG CACGATCGAG 
CAGGCGGTGG TGCTGCCCGA CGTGCAGATC AACCGCCACT GCCGCCTGAA GAAGGTCGTC 
ATCGATCGCC ACTGCGTGAT CCCCGAGCGC ACGGTGATCG GCGAGGACGC CGAGGCGGAT 
GCGCGCCGCT TCCACCGCAC CGAGGGCGGC GTGGTGCTGG TGACGCGCGA AATGCTCGAC 
CGACTGTGA

Protein sequence

MPAEAANRRR ILTRRTLALV LAGGRGSRLR DLTNVRAKPA VHFGGKFRII DFALSNCMNS 
GLRRIGVITQ YKSHSLLRHL QRGWSFLRNE MGEFVDLLPA QQRIDEEQWY QGTADAVFQN 
LDIIRNSTPP DYIVVLAGDH VYKMDYSIML EDHAASGRGV TVGCIEVPRE EAKAFGVMAI 
DARRHITAFV EKPADPPALP GNPGLSLASM GIYIFSANYL YRLLEDDAKN PDSSHDFGKD 
LIPRAVAENQ ALAHPFTLSA IATPPFSGPY WRDVGTVDAY WAANLDLAST TPALNMYDKD 
WPIWTYQEQL PPAKFVHDLD GRRGEALNAL VSGGCIVSGS VVRESVLFSN VLVRSYSTIE 
QAVVLPDVQI NRHCRLKKVV IDRHCVIPER TVIGEDAEAD ARRFHRTEGG VVLVTREMLD 
RL