Gene GM21_2167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2167
Symbol
ID	8137503
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2529323
End bp	2530699
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	64%
IMG OID	644869782
Product	hydrolase, TatD family
Protein accession	YP_003021977
Protein GI	253700788
COG category	[L] Replication, recombination and repair
COG ID	[COG0084] Mg-dependent DNase
TIGRFAM ID	[TIGR00010] hydrolase, TatD family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	134
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACTGA TCGACAGCCA CGCACACATA TACGGCAAGG AGTACGCCGC CGATTTCGAG 
GAGATGATGG AGAGGGCCGC GGAGGCTGGA GTCCGCACCA TCGTGGCGGT GGGAGCGGAT 
CTGGAGTCGA GCCAGGAAGC CCTTGCCCTT GCCGGGGCGC GCGAAAACGT CTACTGTTCG 
GTCGGCATCC ATCCGCACGA CGCGGACCGG GTGACCGAGC GCTGCTACGA ACTGGTGCGC 
GAGATGGCGC TCTCATGCCC CAAAGTGGTC GCCATCGGCG AAATCGGCCT CGACTTCTTC 
AGGGACCGCT CCTCGCGCGA CAACCAGGAG GAGGTCTTCC GGCGCTTCAT CAGGATGGGG 
CGCGAGCTCT CTCTGCCGCT CATCATTCAC GATCGGGACG CCCACGACAG GATCATGGCG 
ATCCTCAAGG AGGAGAAAGC GGGCGAGGTG GGAGGCGTGC TGCACTGCTT CTCCGGCGAC 
CTCGCCATGG CGCAGGAGTG CATCGAGCTC GGATTCAAGA TTTCCATCCC GGGGACGGTC 
ACCTACCCCT CCAACGAGGC GCTCAGGGAA GTGGTGCGCG GGGTAAAGAT CGAGCAGCTC 
ATGGTGGAGA CGGACGCTCC CTACCTGACG CCGGTGCCGC ACCGCGGCAA GAGGAACGAG 
CCTGCCTTCG TGCGGCTCAC GGCCGAGCGG GTGGCGCAGG TCAAGGGGCT CTCGGCCGAG 
GACGTCGGCA GGATCACCTC TTTTAACACC AGGAAGCTCT TCGGGATCCC GCAACCGGCC 
GAGCAAGACA CCATTGCTTA CATGATCCGC AATTCGCTCT ACCTGAACGT CACCAACCGC 
TGCTCGAACC GCTGCACCTT CTGCCCCAAG TTCGACGATT TCGCGGTGAA GGGTCACGAG 
CTGAAGCTCT CCCACGAACC CAGTTTCGCC GAGGTGATAG CTGCGGTGGA CAGGGCCACC 
GGTTTCGAAG AGGTCGTTTT CTGCGGCTAT GGCGAGCCGC TGGTCCGGCT CGACCTGGTG 
AAGGAGGTGG CCGCCGAATT AAAGCGCCGC GGCATCAAGG TCCGAGTCAA CACGGACGGG 
CAGGCGAACC TCGTGCACGG CAGGAACATC CTCCCCGAAC TCGCAGGCCT TGTGGACGTC 
CTCTCGGTGA GCCTCAACGC GGCCAACGCC GAGGACTACC AGCGCTTGTG CAATACTCCC 
TTCGGAGCGG CCGGCTTCCA GGGGGTGTGC GATTTTCTCA AGGAAGCGCC CAAGCACGTG 
CCCCAGGTGA CGGCAAGCGC CGTGACGGTG CCCGGATTGG ACGTCGGGAA GGTGCGGGAA 
CTGGCGCTGT CGCTGGGAGT GGATTACCGC GAGAGGGAAT ACGCGGAGGT AGGCTGA

Protein sequence

MELIDSHAHI YGKEYAADFE EMMERAAEAG VRTIVAVGAD LESSQEALAL AGARENVYCS 
VGIHPHDADR VTERCYELVR EMALSCPKVV AIGEIGLDFF RDRSSRDNQE EVFRRFIRMG 
RELSLPLIIH DRDAHDRIMA ILKEEKAGEV GGVLHCFSGD LAMAQECIEL GFKISIPGTV 
TYPSNEALRE VVRGVKIEQL MVETDAPYLT PVPHRGKRNE PAFVRLTAER VAQVKGLSAE 
DVGRITSFNT RKLFGIPQPA EQDTIAYMIR NSLYLNVTNR CSNRCTFCPK FDDFAVKGHE 
LKLSHEPSFA EVIAAVDRAT GFEEVVFCGY GEPLVRLDLV KEVAAELKRR GIKVRVNTDG 
QANLVHGRNI LPELAGLVDV LSVSLNAANA EDYQRLCNTP FGAAGFQGVC DFLKEAPKHV 
PQVTASAVTV PGLDVGKVRE LALSLGVDYR EREYAEVG