Gene Gmet_3332 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_3332
Symbol
ID	3740725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	-
Start bp	3746145
End bp	3747284
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	67%
IMG OID	637780622
Product	Ni-Fe hydrogenase, small subunit:twin-arginine translocation pathway signal
Protein accession	YP_386270
Protein GI	78224523
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	57
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAAGA ATGGTGATGA GCATGACGAG ATGAAGCAGC ATTGTTCCGG CACGTCGGGG 
CCCTGGGAGG AGCGGGGGGT ATCCCGGCGC GACTTCCTGA AGTTCTGCAC CGCCATGTCG 
GCGGCCTTGG CCCTGCCGGT CTCCCTGGCG CCACGCATTG CCGAGGCGCT GGAGAGCGAC 
AGTCGGCCGT CGGTGATCTG GCTCGAATTC CAGAGTTGCA CCGGCGACAC CGAGGCGCTC 
CTGCGGGCCG CTAACCCCAC GGTGGGTGAG ATCGTCCTCG ACGTCCTCTC CATTGATTAT 
GCCGAGACCA TCATGGCCGC CGCCGGCCAC CAGGCCGAGG AGGCGCGGCT GAAGACCCTG 
AAAGAGCGAA GTGGCAAGTA CATCGCCGTC GTCGAGGGGG CGATCCCCAT GAAGGACAAC 
GGCGTCTACT GCTGCGTCGG CGGGAGATCG GCCGTGGATA TCGCCCGGGA GGTCTGCGGC 
GGCGCCATGG CCACCATCAC CGTCGGCACC TGCGCCTCCT ACGGCGGCAT CCCGGCTGCA 
TCCCCCAACC CCACCGGCGC CGTGGGGGTC AAGGACGCGG TCCCCGGCGC CACGGTCATC 
AACCTTCCCG GCTGCCCCGT CAACACCGAC AATCTGGTGG CCACCGTGGT CCATATCCTC 
ACCTTCGGCA AGCTCCCGGC CACCGACAGC AAGGGACGCC CCCTTTTCGC CTACGGCAAG 
CGGATTCACG ACAACTGCGA ACGCCGCCCC CACTTCGACG CCGGCCAGTA CGTGGAGCAA 
TGGGGCGACC AGGCCCACCG TGCCGGCCAC TGCCTCTACA AGATGGGGTG CAAGGGGCCC 
GAAACCTTCC ACAACTGCCC GACCCAGCGC TACAACGAGA AGACGAGCTG GCCAGTGGGA 
TCAGGCCACG GCTGTGCCGG CTGCTCCGAG CCCCACTTCT GGGACACCAT GACCCCCTTC 
TACCGGCGGC TTCCCAGCGT TCCCGGTTTC GGGATCGAGG CCACGGCCGA CAAGATCGGC 
CTTGGCGTCG CTGCGGCCAC GGCGGCGGTC TTCGGCATCC ACGGCGTGGT GAGCGCGCTG 
CGCAAGGGAG ATGAATCCGA CGGGGAAGGA GGGGTAGACC ATGGCCAGGA TCGTCGTTGA

Protein sequence

MAKNGDEHDE MKQHCSGTSG PWEERGVSRR DFLKFCTAMS AALALPVSLA PRIAEALESD 
SRPSVIWLEF QSCTGDTEAL LRAANPTVGE IVLDVLSIDY AETIMAAAGH QAEEARLKTL 
KERSGKYIAV VEGAIPMKDN GVYCCVGGRS AVDIAREVCG GAMATITVGT CASYGGIPAA 
SPNPTGAVGV KDAVPGATVI NLPGCPVNTD NLVATVVHIL TFGKLPATDS KGRPLFAYGK 
RIHDNCERRP HFDAGQYVEQ WGDQAHRAGH CLYKMGCKGP ETFHNCPTQR YNEKTSWPVG 
SGHGCAGCSE PHFWDTMTPF YRRLPSVPGF GIEATADKIG LGVAAATAAV FGIHGVVSAL 
RKGDESDGEG GVDHGQDRR