Gene GM21_0134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0134
Symbol
ID	8135437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	163019
End bp	165007
Gene Length	1989 bp
Protein Length	662 aa
Translation table	11
GC content	63%
IMG OID	644867753
Product	excinuclease ABC subunit B
Protein accession	YP_003019977
Protein GI	253698788
COG category	[L] Replication, recombination and repair
COG ID	[COG0556] Helicase subunit of the DNA excision repair complex
TIGRFAM ID	[TIGR00631] excinuclease ABC, B subunit

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	94
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACAAAT TCGAACTGGT AACGAGTTTC GAGCCACGCG GCGACCAACC CAGGGCCATC 
GCAGAACTGG CGGACGGAGT GCTGCGGGGC GACCCGCACC AGGTGCTCCT CGGGGTCACC 
GGGTCGGGCA AGACCTTCAC CATGGCCCAG GTGATTGCAC GCTGCAACTG CCCCACCCTG 
GTTCTGGCCC CCAACAAGAC TCTGGCCGCT CAGCTTTACG GCGAGTTCAA GGAACTCTTC 
CCCAACAACG CCGTCGAGTA TTTCGTCTCC TATTACGACT ACTACCAGCC GGAAGCCTAC 
CTCCCCTCCT CAGACACCTT CATCGAGAAG GACTCCTCGA TAAACGACGA GATCGACAAG 
TTCCGGCACT CCGCCACCAG GAGCCTTTTG ACCCGCCGCG ACGTCATCAT CGTAGCCTCG 
GTTTCCTGCA TCTACGGCAT AGGCTCCCCC GAGTCTTACC AGGAGATGCA GATCCGTTTC 
CGCGAAGGGG ACGAGGTCGG GCGCGACGAG ATGCTGCAGC GGCTTGTCGC GATCCAGTAC 
CAGCGAAACG ACGTCGATTT CCACCGCGGC TCCTTCCGGG TTCGTGGGGA TACGGTCGAG 
GTCTTCCCCG CCCACGACGA CGAGCGGGCG CTCAGGATCG AGTTCTTCGG GGACACGGTG 
GACGCCATCT CCGAGATAGA CCCCCTGCGC GGGGTGCAGC TGCAGAAACT TTCCCGCTGC 
GCCATCTACC CCGCCTCCCA TTACGTCGCC AGCCGTCAGA CCCTGGAGCG GGCCGTGGAG 
CTGATTCGGC TCGAACTGGA GGAGCGGATC CGCTACTTCA ATGCGCAGAA CATGCTCCTT 
GAGGCGCAGC GCATCGAGCA GAGAACCTTC TTCGACATCG AGATGATGGA GGAGATGGGC 
TTTTGCCAGG GGATCGAGAA CTACTCGCGC CATTTCGACG GTCGCGCCGC GGGGGAACCC 
CCTTACACGC TGATCGACTA TTTCCCCAAG GACTTCCTGC TGGTGATCGA CGAGTCCCAC 
ATCACCGTTT CGCAGGTGGG GGGGATGTAC CGCGGCGACC GCAGCCGAAA AGAGACCCTG 
GTGAACTACG GTTTCAGGCT CCCCTCGGCC TTGGACAACC GCCCGCTCAC CTTCCAGGAG 
TTCCAGAAGA AGCTGCATCA GACCATCTAC GTTTCCGCGA CCCCGGCGGA CTACGAGCTG 
AAGCAGGCGG GAGGGGTCGT GGTGGAGCAG TTGATCCGCC CGACCGGCCT CATCGACCCG 
GCCATCGAGG TGCGCCCGGC CGCGGGGCAG GTGGACGACC TCCTGCACGA GGCGCGCGAG 
ACGGCGGCCA GGGGAGAGCG GGTGCTGGTC ACCACCCTTA CCAAGCGGAT GGCCGAGGAA 
CTCACCGACT ACTATCGCGA GCTCGGTATC CGCGTCCGTT ACCTTCACTC CGACATCGAC 
ACCTTCCAGC GCATGGAGAT CCTCAGGGAC CTAAGGCTCG GCGAGTTCGA CCTGTTGGTC 
GGGATCAACC TGCTCAGGGA AGGGCTCGAC CTCCCCGAGG TCTCGCTGGT GGCGATCCTC 
GATGCCGACA AGGAAGGCTT CCTCCGCTCC ACCAGGTCGC TGATCCAGAC CTGTGGGCGC 
GCGGCGAGGA ACTTGTCCGG ACGCGTGCTC ATGTACGCGG ACAAGGTGAC CGGCTCCATG 
CAGGCTGCCA TCGACGAGAC CGTGAGGAGG CGCGCACTGC AGACGGCCTA CAACGAGGAG 
CACGGCATCA CGCCGGAGAG CGTGCGGAGG ATCATCGGCA ACGTGCTGCA GGCCCCCGAG 
GAGAAGGATT GGGTCACGGT GCCGGCCTCG GCTGAGGAGT TCGTGAGCGC CAAGGAGCTG 
GAGAAGACGC TGAAGAGGCT GAGAAAGGAG ATGCTGGCGG CGGCGAAGGC TCAGGAATTC 
GAGAGGGCGG CGGAGCTGAG GGACAAGATC AAGCGGCTGG AGGTCGCGGA AATCATGAGA 
AGCAATTGA

Protein sequence

MDKFELVTSF EPRGDQPRAI AELADGVLRG DPHQVLLGVT GSGKTFTMAQ VIARCNCPTL 
VLAPNKTLAA QLYGEFKELF PNNAVEYFVS YYDYYQPEAY LPSSDTFIEK DSSINDEIDK 
FRHSATRSLL TRRDVIIVAS VSCIYGIGSP ESYQEMQIRF REGDEVGRDE MLQRLVAIQY 
QRNDVDFHRG SFRVRGDTVE VFPAHDDERA LRIEFFGDTV DAISEIDPLR GVQLQKLSRC 
AIYPASHYVA SRQTLERAVE LIRLELEERI RYFNAQNMLL EAQRIEQRTF FDIEMMEEMG 
FCQGIENYSR HFDGRAAGEP PYTLIDYFPK DFLLVIDESH ITVSQVGGMY RGDRSRKETL 
VNYGFRLPSA LDNRPLTFQE FQKKLHQTIY VSATPADYEL KQAGGVVVEQ LIRPTGLIDP 
AIEVRPAAGQ VDDLLHEARE TAARGERVLV TTLTKRMAEE LTDYYRELGI RVRYLHSDID 
TFQRMEILRD LRLGEFDLLV GINLLREGLD LPEVSLVAIL DADKEGFLRS TRSLIQTCGR 
AARNLSGRVL MYADKVTGSM QAAIDETVRR RALQTAYNEE HGITPESVRR IIGNVLQAPE 
EKDWVTVPAS AEEFVSAKEL EKTLKRLRKE MLAAAKAQEF ERAAELRDKI KRLEVAEIMR 
SN