Gene Tmz1t_2004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_2004
Symbol
ID	7083759
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	2264818
End bp	2266557
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	69%
IMG OID	643699029
Product	TrkA-N domain protein
Protein accession	YP_002355651
Protein GI	217970417
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0569] K+ transport systems, NAD-binding component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.88767
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCAGCAGG CCCTCGCCCG CCACCACAGC ATCTTCCTGC TGATCCTGCG TCGCCTGCGC 
GCACCGCTGA TCCTGCTGAT CGTGCTGTTC GCGATCGCGG TGCTCGGCCT CACCCTGGTG 
CCCGGCCCGG TCGTCGACGG CGAGACGAGC TATCTCAGCT TCTTCCACGC CTTCTACTTC 
ATCAGCTACA CCGCGACCAC GATCGGTTTC GGCGAGATTC CCTACACCTT CTCCGACCAG 
CAGCGGCTGT GGGTGATCGT CAGCATCTAC CTGTCGGTGA TCGGCTGGGC CTATACGCTG 
GGCTCGGTGT TCAGCCTGCT CGCCGACCGC AGCCTGCGCC AGGCGATCGC GATGCAGGGT 
TTCGTGCGCG CGGTGCGGCG GCTGCGCGAG CCCTTCTACC TGGTGTGCGG CTACGGCGAG 
ACCGGCCGCC TGATCTGCGA CGCGCTCGAC CGCATGGGCC TGCGCGTCGT GGTGATCGAG 
GTCGACGAGA CCAAGCTCGG CGAGCTCGAT CTGCACAGCT ATTCGGCCGA CGTGCCCGCG 
CTGTGCGCGG ACGCCGCAAA CCCCGAGACG CTCCAGTTCG GCGGCCTCAC CCACGCGAGC 
TGCATCGGCG TCATCGCGCT CACCAACGAC GACGCCACCA ACCTGGCGAT CGCGATCGCC 
GCACGCCTGC TGGCGCCGAA GGTGCCCGCA CTGTGCCGCG CCGAGCACAC CGCGACCTCG 
GCCAACATGA CCTCCTTCGG CACCCGCCAC ATCCTCAACC CCTTCGAGCG CTTCAGCGAA 
ACGCTCGCAC TCTCGCTGCA CGCGCCCAAG GCCTCGCAGC TCTTCGACTG GCTCACCGGC 
CTGCCCGGCA GCCACGTCGA GCAGCGCCGC GATCCGCCGC GCGGCAACTG GATCGTCTGC 
GGCCACGGGC GCTTCGGTCG CCTGCTGGTC GATGCGATGG ACTCCGAGGC AGTGCCGGTG 
ACCATCATCG ACATCGACCC CAAGCCCGAC GGCATTCACC GCTGGGTGCA GGGCGACGGC 
ACCGGTGCCG CATCCCTGCT CGAGGCCGGC GTGCGCGAGG CGACCGGGAT CGTGTGCGGC 
ACCAGCTCGG ACGTGGACAA CCTTTCGATC GCGGTGACGG CGCGCGAGCT CAACCAGGAG 
CTCTTCGTGA TCCTGCGCCA GAACCACGAA TCCAACCGCG CGCTCTTCGA GGCCTTCGAA 
TCCGACATCA CCGTGGTCCC GAGCCGGGTG ATCGCGCACG AATGCATCGC GATCCTGAGC 
ACACCGCTGC TCGCGCCCTT CCTGGCCGAA ATCCGCCGCC GTGACGAGGA GTGGTGCGGC 
GCACTGCTGC ATCGCCTGAC CCGCCACCTC GGCTGGAGGG TTCCGCGGAT CCGCAGCCAG 
CGCGTCAACC TGTCGAGCGC GCCGGCGCTG TATCGCCGCC TGATGCGCGG CGAGACGATC 
ACGCTCGAAC GCCTGCTGCG CTCGCCCGCC GACCGCTCGA TGGCGCTCGA CTGCGCGGTG 
CTCTACCTCG AGCGCGACGA CGACGACCAC CGGATGACGC CCGCCGCCGA CGAGAAGCTC 
CGCCCCGGCG ACGAATTGCT CTTCGCCGGC ACCCGCCGCG CGCTCGAGGA TGTCGCCCTG 
ATCTTCGCCA ACGAGCACAC CCTCGAATAC ATCCTCACCG GCCGCGACCT GCCCGGCGGA 
CGGGTCTGGG AAATGCTCGC GCAGCGCAAG CACGGGAAAC GCTCGCCGCA GCTGCCCTGA

Protein sequence

MQQALARHHS IFLLILRRLR APLILLIVLF AIAVLGLTLV PGPVVDGETS YLSFFHAFYF 
ISYTATTIGF GEIPYTFSDQ QRLWVIVSIY LSVIGWAYTL GSVFSLLADR SLRQAIAMQG 
FVRAVRRLRE PFYLVCGYGE TGRLICDALD RMGLRVVVIE VDETKLGELD LHSYSADVPA 
LCADAANPET LQFGGLTHAS CIGVIALTND DATNLAIAIA ARLLAPKVPA LCRAEHTATS 
ANMTSFGTRH ILNPFERFSE TLALSLHAPK ASQLFDWLTG LPGSHVEQRR DPPRGNWIVC 
GHGRFGRLLV DAMDSEAVPV TIIDIDPKPD GIHRWVQGDG TGAASLLEAG VREATGIVCG 
TSSDVDNLSI AVTARELNQE LFVILRQNHE SNRALFEAFE SDITVVPSRV IAHECIAILS 
TPLLAPFLAE IRRRDEEWCG ALLHRLTRHL GWRVPRIRSQ RVNLSSAPAL YRRLMRGETI 
TLERLLRSPA DRSMALDCAV LYLERDDDDH RMTPAADEKL RPGDELLFAG TRRALEDVAL 
IFANEHTLEY ILTGRDLPGG RVWEMLAQRK HGKRSPQLP