Gene GM21_1314 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1314
Symbol
ID	8136641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	1541999
End bp	1544134
Gene Length	2136 bp
Protein Length	711 aa
Translation table	11
GC content	63%
IMG OID	644868928
Product	protein of unknown function DUF162
Protein accession	YP_003021132
Protein GI	253699943
COG category	[C] Energy production and conversion
COG ID	[COG1139] Uncharacterized conserved protein containing a ferredoxin-like domain
TIGRFAM ID	[TIGR00273] iron-sulfur cluster-binding protein

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.000000000000036921
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAAAAG AGTTCAAGGC ATCGATCGAC CGGGCCCTCA ACGACGCCAA CCTGACCGGC 
GCGCTGGGGA AGTTTTCCGA AGCGTACAAG GTGAACCGCG CCAAGGCCTA CGAGGGAATC 
GACTTCGAGG CGCTCCGCTC CACCGTGGCC GATGCGAAGT CCAAGGCGGC CTGCCATCTG 
GACGAGGTGG CCGATCTCTT CAAGGCGAAC GCCGAGGCGC TCGGGGCCAA GGTGTTCCGC 
ACCCGGGACC CCCAGGAGGT GAAACGCTAC ATCCTGCAAC TGGCCAAGGA GAAGGGGGTC 
CGGAGCGTGG TGAAGTCGAA GTCCATGGCG ACCGAGGAGA TCCACCTGAA CCGGGCACTG 
CTGGAGGAGG GAATCGCGGT CGCCGAGACC GACCTCGGCG AGTGGATCAT CCAGCTCGCC 
GGCCAAACTC CGTCGCACAT GGTCATGCCG GCGATCCACA TGACCAAGGA GGAAGTGGCG 
GAGATCTTCA GCAAGGAGGT CGACGAGCGG CTCTCCACCG ACATCCCGAG GCTGGTGAAG 
GTGGCCCGTA ACGAACTCCG CCCTAAGTTC CTGGCGGCGG ACATGGGGAT CTCCGGCGGC 
AACATCGCCG TCGCCGAGAC CGGAAGCATA GTGCTCGTGA CCAACGAAGG GAACGCGAGG 
CTCGTGACCA CCCTTCCCAA AATCCACGTG GCGCTGATCG GCGTCGAGAA ACTGGTGGAG 
AAGTTCGAGA GCGTCGCTCC CATCCTGGAC GCGCTCCCCA GGAGCGCCAC GGCGCAGCTT 
CTCACCAGCT ACGTCTCCAT CATCACCGGC CCCACGCAGA ACGACGACGG GAGCGACAAG 
GAGCTGCACA TCATCCTGAT GGACAACCGG CGCACCGAAA TGGCGCAGGA TCCCAAGTTC 
AAGCAGGCGC TGCAATGCAT CCGCTGCGGC TCCTGCCTGA ACGTCTGTCC CATCTTCCGG 
CTGGTTGGGG GGCACGTCTT CGGCAGCATC TACACCGGGG GGATCGGCAC CATCCTCACC 
GCCTGGTTCG ACGAGCTGAA GAAGTCCGAG GATATACAGG GGCTGTGCAT CCAGTGCGGC 
AACTGCAAGG AGGTCTGCCC AGGGAAGCTC GATATCCCCG AGATGATCAT GGAGATCCGG 
CGCCGGCTGG TGCTGGAAAA AGGGCAGCCG CTGCTGCAGA AGGCGATCTT CGGCGTGGTG 
AACAACAGAA GGCTTTTCCA CGGCATGCTG CGCGCCGCCT CCGTCGCCGC AAAGCCCTTC 
AGCACCGCCG GTTTCATCCG CCACCTGCCG CTGTTTCTTG CCGACTTAAC CGACGGCCGC 
AGCCTCCCTG CCATCGCGGA GAAGCCGTTC AGGGACATCT TCCCGGAGAT CGTGCAGCCG 
CAGGCAAAGG AAAAGGCCGT CTTCTACGCG GGCTGCCTGA TCGACTTCGC CTACCCCGAG 
ACGGGTGTCG CGCTGGTGCG GCTTCTCAAT AAGGCGGGGA TCGAGGTGAT CTTCCCCGAG 
GAACAGACCT GCTGCGGAGC CCCCGCACTC TACAACGGGG CCTACGAGGT CGCGGCGCAA 
AACGCGATCG ACAACATAGA AGTGCTCTTG CAGCACGAGG CGCAGTACGT GGTTTCCGCC 
TGCCCCACCT GTACGGTGGC GCTGGCGCAC GAGTTCGGTA AGACCCTGGA AAGCGTGGGA 
CAGACCAAGT GGCTGGAGAA GGCGCAGGAA CTGGCCGCGA AGACGGTGGA TCTATCCACA 
CTCGTGAAGC GGTTAACGGA TGAAGGAAGG CTGAGCTTTG AGGAAGGGGA AGGGCTTGCG 
AAAATCACCT ACCACGACTC CTGCCACCTC AAACGGACGC TCAAGGTGTC GGAAGAGCCG 
CGCGAACTGC TGCAAAAGGC GGGCTACCAG TTGGAGGAGA TGTTCGAGTG CGACATGTGC 
TGCGGCATGG GAGGCTCCTA CTCCATGAAG CTTCCCGAGA TCTCGGCGCC GATCCTGAAG 
CGCAAACTGC AGAACATAAA GGATACGGGG GCGCCGGTAG TGGCGATGGA CTGCCCGGGG 
TGCGTGATGC AGATACGCGG CGGGTTCGAC CAGCAGGGCG GAGAGGTGAA GGTGAAGCAC 
ACCGCCGAGC TTTTGGCCGA GCGGTTGAAA GGCTAA

Protein sequence

MKKEFKASID RALNDANLTG ALGKFSEAYK VNRAKAYEGI DFEALRSTVA DAKSKAACHL 
DEVADLFKAN AEALGAKVFR TRDPQEVKRY ILQLAKEKGV RSVVKSKSMA TEEIHLNRAL 
LEEGIAVAET DLGEWIIQLA GQTPSHMVMP AIHMTKEEVA EIFSKEVDER LSTDIPRLVK 
VARNELRPKF LAADMGISGG NIAVAETGSI VLVTNEGNAR LVTTLPKIHV ALIGVEKLVE 
KFESVAPILD ALPRSATAQL LTSYVSIITG PTQNDDGSDK ELHIILMDNR RTEMAQDPKF 
KQALQCIRCG SCLNVCPIFR LVGGHVFGSI YTGGIGTILT AWFDELKKSE DIQGLCIQCG 
NCKEVCPGKL DIPEMIMEIR RRLVLEKGQP LLQKAIFGVV NNRRLFHGML RAASVAAKPF 
STAGFIRHLP LFLADLTDGR SLPAIAEKPF RDIFPEIVQP QAKEKAVFYA GCLIDFAYPE 
TGVALVRLLN KAGIEVIFPE EQTCCGAPAL YNGAYEVAAQ NAIDNIEVLL QHEAQYVVSA 
CPTCTVALAH EFGKTLESVG QTKWLEKAQE LAAKTVDLST LVKRLTDEGR LSFEEGEGLA 
KITYHDSCHL KRTLKVSEEP RELLQKAGYQ LEEMFECDMC CGMGGSYSMK LPEISAPILK 
RKLQNIKDTG APVVAMDCPG CVMQIRGGFD QQGGEVKVKH TAELLAERLK G