Gene Tmz1t_1785 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_1785
Symbol
ID	7085755
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	2007655
End bp	2008755
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	73%
IMG OID	643698807
Product	iron-sulfur cluster binding protein
Protein accession	YP_002355433
Protein GI	217970199
COG category	[C] Energy production and conversion
COG ID	[COG1600] Uncharacterized Fe-S protein
TIGRFAM ID	[TIGR00276] iron-sulfur cluster binding protein, putative

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.280211
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAACAA AATTGCCGAC GCCGGACGGG GCGGCGGTCG ACGGGACCGT CCTCGACGGT 
GCGGCACTTG TTGCGCGGAT CAGACAGTGG GGGCGCGAAC TCGGCTTCGA CGCGGTCGGC 
GTGGGCGGGG TCGATCTCGC CGACGCCGAA CCCGGCCTGG TCGCCTGGCT GGAGGCCGGC 
TTCCACGGGG ACATGGATTA TATGGTGCGC CACGGCATGA AACGCGCGCG CGCCGCCGAA 
CTCCTGCCCG GCAGCGTGCG CGTGATCAGC GTGCGCATGG GCTACTGGCC GGATGCCGCG 
CCGGCCATGG ACGTGCTCGG CGACCCCGAG CGCGCCTATG TGTCGCGCTA CGCGCTCGGC 
CGCGACTACC ACAAGCTGGT GCGCAACCGC CTGCAGAAGC TCGCCGACCG CATCAGCGCG 
GAGGTGCCGC ACCAGTACCG CGTGTTCACC GACTCGGCGC CCATCCTCGA AGTCGAGCAC 
GCCAGTCGCA AGGGCCTGGG CTGGCGCGGC AAGCACACCC TGCTGCTCGA TCGCACCGCC 
GGTTCGTGGT TCTTCCTCGG CGAGATCCTC ACCGACCTGC CGCTGCCGGT GGACGCGCCG 
GTGGCGTCGC ACTGCGGGCG CTGCACGGCC TGCATCGACG CCTGCCCCAC CGGCGCCATC 
GTCGCGCCCT ACCGGCTCGA CGCACGGCGC TGCATCTCCT ACCTCACCAT CGAGCTGCAC 
GGCGCGATCC CCGAGGAGCT GCGCCCGTTG CTCGGCAACC GCATCTACGG CTGCGACGAC 
TGCCAGCTCG TGTGCCCGTG GAACCGCTTC GCCCAGCTTG GCCGCGAGCC CGATTTCGCC 
CCCCGCCAGG GCCTCGACGA CGCCCGGCTG GCCGAGCTCT TCGCGTGGAC CGCGGCGGAG 
TTCTCCGAGC GCACCGCAGG CAGCCCGATC CACCGCATCG GCCACGCGCG CTGGCTGCGC 
AACATCGCGG TCGCGCTCGG CAACGGCCCG GCGACGCCCG CCGCGCGCGC GGCCTTGCAG 
GCGCGCGCGG ACGACGAGGA TGCGGTGGTG CGCGAGCACG TCGCCTGGGC GCTCGCCCGC 
CTGGCCGCCG CCGCCGGCTA G

Protein sequence

METKLPTPDG AAVDGTVLDG AALVARIRQW GRELGFDAVG VGGVDLADAE PGLVAWLEAG 
FHGDMDYMVR HGMKRARAAE LLPGSVRVIS VRMGYWPDAA PAMDVLGDPE RAYVSRYALG 
RDYHKLVRNR LQKLADRISA EVPHQYRVFT DSAPILEVEH ASRKGLGWRG KHTLLLDRTA 
GSWFFLGEIL TDLPLPVDAP VASHCGRCTA CIDACPTGAI VAPYRLDARR CISYLTIELH 
GAIPEELRPL LGNRIYGCDD CQLVCPWNRF AQLGREPDFA PRQGLDDARL AELFAWTAAE 
FSERTAGSPI HRIGHARWLR NIAVALGNGP ATPAARAALQ ARADDEDAVV REHVAWALAR 
LAAAAG