Gene Tmz1t_3000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_3000
Symbol
ID	7874390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	3251556
End bp	3252989
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	73%
IMG OID	643699921
Product	AMP-dependent synthetase and ligase
Protein accession	YP_002889976
Protein GI	237653662
COG category	[I] Lipid transport and metabolism
COG ID	[COG0365] Acyl-coenzyme A synthetases/AMP-(fatty) acid ligases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCCG CCGAATGGCT GCTCGCCGGC GATCCCGCGC GGATCGCGCT GATCGAGGGC 
GATGTCCGCA TCGACTACGC CGGCCTGCGT GCCGATTCCA TCCGCAGCGC CGCGGCCCTG 
CTCGACGCCG GGCTGCGCCC CGGCGACGCC TGCGTGCTCG CGCTGCCCGA CGGCATCGAA 
TGGGCCGCCG CCTTCATCGG CATGCTGTGG GCGGGGGTGC GGCCGATCGC GATCAACCCG 
CGCACCGCCA CCACGCAACT CGCCGACCTG ATGCTGGACT CGGGCGCCGC CGCGGCGCTG 
CTCGAGGACG AAGCCGCGCG TGCGCTCGGC GACAAGCGCG CGATCGACCT CGGCGAATGG 
CGCCGCCGGG TGGAGCGCGC CACCGCGACG CCCGCAGCCG CGCAGGCAGC CGACGACGAT 
CCGGCGTTCC TGCTGTACTC CTCCGGCACC ACCGGCCGCC CCAAGGGCAT CCTCCATGCC 
CACCGCGCGA TCCGTTATGC CCACGTGTTC GCCCGCGACC TTCTCGGTGC GCGCCCGGAG 
CACCGCTTCT ATTCCAGCTC CAAGCTGTTC TTCGCCTACC CGCTCGCCAA CGCCTTCTTC 
GCCGGCCTGC GCCTGGGCGC CACCGTCGTG CTCGACCCCG AATGGCCCGA CCCGGCGCGC 
GTCGCGGCGA TGGTCGAGCG CCACGAGCCG CACATCTTCT TCAGCGTGCC CACCCTCTAC 
CGCCGCCTGA TCGATGCCGG CGTGCGTTTC CGCGGCGTGC ACGCCGCGGG CTCCGCCGGT 
GAAGCCTGTC CGCCCGCGCT TGCGCGCGAC TGGCAGGCGA TGACCGGAGT GCCGCTGGTC 
AATGGCTACG GCACCACCGA GACGCTGTCG CTGGTGCTCT ACCGCACGCC GGAGATGGAC 
GCCGCGTGCC CCACTCCACT CACCGAGATC CATCCGGAGC AGCTCACCAG CGGCGAGCTC 
GAGACCTGGC GGCTGTGGTT CTCCCACCCC GCAGTCGCGC TCGGTTATAC GCGCGTGGTC 
ACCCACGACA GCGCGCGCTT CGCCGACGGC CGCTTCGCCC CCGGCGACGT GTTCCGCCGT 
GCCCCCGACG GGGAAGGCTG GCTGTTCGCC GGCCGCAGCG ACCAGCTCGT CAAGGTGTTC 
GGCCGCTGGG TGGACGTGGT CGCGGTCGAG CAGGCCGTGC AGGAACGCAT GCGCGGCAAG 
GCCGAGGAGG TGTGCGTGAT CCCGGCGCAG GGCGAGGACG CGGACATGAT CCGCCTGCAC 
CTCTTCGCCA TTCCCGGCGA CCTGCCGCCA CCGCAGGTGC TGGCCGCCGC GCAGGCCGCG 
ATCGAGAGCC TGCCGCCCTA CCAGCGCCCC GAGAAGATCC ACCTCGTGGA CCACTTCCCG 
CGCACCGACA CCGGCAAGCT GCGCCGCAAC GAGCTCGCGC GCAGCACCGG CTGA

Protein sequence

MNAAEWLLAG DPARIALIEG DVRIDYAGLR ADSIRSAAAL LDAGLRPGDA CVLALPDGIE 
WAAAFIGMLW AGVRPIAINP RTATTQLADL MLDSGAAAAL LEDEAARALG DKRAIDLGEW 
RRRVERATAT PAAAQAADDD PAFLLYSSGT TGRPKGILHA HRAIRYAHVF ARDLLGARPE 
HRFYSSSKLF FAYPLANAFF AGLRLGATVV LDPEWPDPAR VAAMVERHEP HIFFSVPTLY 
RRLIDAGVRF RGVHAAGSAG EACPPALARD WQAMTGVPLV NGYGTTETLS LVLYRTPEMD 
AACPTPLTEI HPEQLTSGEL ETWRLWFSHP AVALGYTRVV THDSARFADG RFAPGDVFRR 
APDGEGWLFA GRSDQLVKVF GRWVDVVAVE QAVQERMRGK AEEVCVIPAQ GEDADMIRLH 
LFAIPGDLPP PQVLAAAQAA IESLPPYQRP EKIHLVDHFP RTDTGKLRRN ELARSTG