Gene Tmz1t_3548 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_3548
Symbol
ID	7873054
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	3888506
End bp	3889537
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	73%
IMG OID	643700489
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_002890519
Protein GI	237654205
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.927154
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGTGC CGCACATCGA CCGGATGAAC GCCGGTGGCG ACCTGCCGCT GCTGTCGGTA 
CGCAACCTGC GCGTGGAATT TCCCCGCCGG CGCGGGACGC TGGTGGCGCT CGACGACGTC 
TCCTTCGACA TCGCGCGCGG CGAGGTGCTC GGCGTGGTGG GCGAGTCGGG TGCGGGCAAG 
TCGCTCACCG GCGCGGCCAT CATCGGCCTG CTCGAGCCCC CCGGGCGTAT CGCCGGCGGC 
GACATCCTGC TCGATGGCGA GGCCATCCAC GCGCTGCGCG GCGAGGCCAT GCGGCGCCTG 
CGCGGACGCC GCATCGCGAT GATCTTCCAG GATCCGCTCA CCAGCCTGAA CCCGCTATAT 
ACGGTGGGCG AGCAGCTGGT CGAGACCATG CTGACCCACC TCGACCTGAC GCCCGCCGCC 
GCGCGCGAGC GCGCGCTCGC GCTCCTCGAC GAGGTCGGCA TCCCGGCGCC GGCGCAGCGC 
ATCGACCATT ACCCCCACCA GTTCTCCGGC GGCATGCGCC AGCGCGTGGT GATCGCGCTC 
GCCTTGTGCG CCGAGCCCGA GCTGATCATC GCCGACGAGC CCACCACCGC GCTCGACGTC 
TCGGTGCAGG CGCAGATCAT CGCGCTGCTG CGTCGCCTGT GCCGCCAGCA CCGCACCGCG 
GTGATGCTGA TCACCCACGA CATGGGCGTG ATCGCCGAGA CCGCCGACCG CGTCGCGGTG 
ATGTACGCCG GGCGGGTGGT GGAGATCGGG CCGGTGGCCG AGGTGGTGCG CGCTCCGGCG 
CATCCCTACA CCCGCGGCCT GATGGGCGCC ATTCCCGTGC TCGGCGCCGA GGTCGAGCGC 
CTGGTGCAGA TCGACGGCGC GATGCCGCGC CTGGATGCGA TCCCGTCCGG CTGCGCCTTC 
CATCCGCGCT GCACCGAGGC CAGCGCGCGC TGCCGCGTCG AGCGCCCGGA GTTGCTGCCG 
GCCGGCGCCA CGCGCGCGGC GTGCTGGTTG TACGCGCCGG CGCGCGAGAA CACCGACGGA 
GGCCCGCAGT GA

Protein sequence

MNVPHIDRMN AGGDLPLLSV RNLRVEFPRR RGTLVALDDV SFDIARGEVL GVVGESGAGK 
SLTGAAIIGL LEPPGRIAGG DILLDGEAIH ALRGEAMRRL RGRRIAMIFQ DPLTSLNPLY 
TVGEQLVETM LTHLDLTPAA ARERALALLD EVGIPAPAQR IDHYPHQFSG GMRQRVVIAL 
ALCAEPELII ADEPTTALDV SVQAQIIALL RRLCRQHRTA VMLITHDMGV IAETADRVAV 
MYAGRVVEIG PVAEVVRAPA HPYTRGLMGA IPVLGAEVER LVQIDGAMPR LDAIPSGCAF 
HPRCTEASAR CRVERPELLP AGATRAACWL YAPARENTDG GPQ