Gene Tmz1t_1451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_1451
Symbol
ID	7083534
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	1617386
End bp	1618729
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	72%
IMG OID	643698469
Product	peptidase M24
Protein accession	YP_002355106
Protein GI	217969872
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.582435
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCAC CCGGCACCGC CCCCATGGAC ACCACCCCCT TCCGCGCCCG CCGCGCCCGC 
CTGCTGCAGC GCATGCAGGC CGCCGGCGGC GGCGTCGCCA TCCTGCCCAC CGCCCCCGAG 
CGCGTGCGCA ACCGCGACGC CCACTACGCC TACCGCCACG ACAGCTACTT CTACTACCTC 
AGTGCCTTCC GCGAACCCGA GGCCGTGGTC GTGCTGGTGG CGGGCAAGGA GACGAAGCAG 
ATCCTCTTCT GCCGCGAGAA GAACGAGGAA CGCGAGATCT GGGACGGCTA CCGCTGGGGC 
CCCGAGGCCG CGCGCGCGGC CTTCGGCTTC GACGAGGCGT GGACCATCGG CGACCTCGAA 
AAACGCCTCC CCGACTACCT CGCCGACCAG CCCCTGCTGT GGACCAGCCT CGGCTACGAC 
AACGACTGGG ACGCGCGCGT ACTCGGCGCG CTCAACGCCG TGCGTGACAA GGCCCGCACC 
GGCCTCACCC CGCCGCACTC GGTGCGCGAC CTGCGCGCCG AGCTCGACGA GATGCGCCTG 
GTCAAGGACG CGTCCGAGCT CGCCACCATG CGCCAGGCAG CACAGATCTC CGCCGCCGCC 
CACTGCCGCG CGATGCGCGC CACCCGCCCG GGCCGGCACG AGTACGAGAT CGAGGCCGAG 
CTGCTGCACG CCTTCCGCGC CGCCGGCAGC CAGGCCCCCG CCTACACCAG CATCGTCGCC 
GGCGGCGCCA ATGCCTGCGT GCTGCACTAC GTCGACAACG ACCAGCGCCT CAATGACGGC 
GACCTGTTGC TGATCGACGC CGGCTGCGAG CTCGACGGCT ACGCCTCCGA CATCACCCGG 
ACCTTCCCGG TGAGCGGCCG CTTCTCAGGT CCGCAGCGCG CGGTCTATGA GCTCGTGCTC 
GCCGCCCAGG CCGCGGCGCG CGAGGCCACC CGCCCCGGCG CGCACTGGAA CCAGCCGCAC 
GACGCCGCGG TGAAGGTGCT CGCCCAGGGC ATGCTCGACC TCGGTCTCCT CCAGGGCAGC 
CTGGACGGCG TGCTCGAGAA CGGCGACTAT CGCCGCTTCT ACATGCACCG CACCGGCCAC 
TGGCTGGGCA TGGACGTGCA CGACGCCGGC GAATACAAGC TCGGCGGCGA ATGGCGGCCG 
CTGGTCGAGG GCATGGTGCT GACCATCGAG CCGGGCTGCT ACATCCGCGC GGCCGAGGAC 
GTGCCCGAGG CCTTCTGGAA CATCGGCATC CGCATCGAGG ACGACGCGAT CGTCACCGCC 
GACGGCTGCG CGCTGATCAC CGAGGACGCG CCCAAGGCGG TTGCGGACAT CGAGGCCCTG 
ATGCGGGACG CCCGTCATGG CTGA

Protein sequence

MNAPGTAPMD TTPFRARRAR LLQRMQAAGG GVAILPTAPE RVRNRDAHYA YRHDSYFYYL 
SAFREPEAVV VLVAGKETKQ ILFCREKNEE REIWDGYRWG PEAARAAFGF DEAWTIGDLE 
KRLPDYLADQ PLLWTSLGYD NDWDARVLGA LNAVRDKART GLTPPHSVRD LRAELDEMRL 
VKDASELATM RQAAQISAAA HCRAMRATRP GRHEYEIEAE LLHAFRAAGS QAPAYTSIVA 
GGANACVLHY VDNDQRLNDG DLLLIDAGCE LDGYASDITR TFPVSGRFSG PQRAVYELVL 
AAQAAAREAT RPGAHWNQPH DAAVKVLAQG MLDLGLLQGS LDGVLENGDY RRFYMHRTGH 
WLGMDVHDAG EYKLGGEWRP LVEGMVLTIE PGCYIRAAED VPEAFWNIGI RIEDDAIVTA 
DGCALITEDA PKAVADIEAL MRDARHG