Gene GM21_1921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1921
Symbol
ID	8137255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2227961
End bp	2229226
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	63%
IMG OID	644869535
Product	metallophosphoesterase
Protein accession	YP_003021732
Protein GI	253700543
COG category	[L] Replication, recombination and repair
COG ID	[COG0420] DNA repair exonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	0.666866
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGTCA GATTCATCCA CACCTCAGAC ATCCACCTGG GAAAAACCTA CCGCTGCCTG 
GGCGGCGACG CCGAGCGCTA TCAGGACTTT TTCACCACCT TCGCAGCCAT CATCGCCGAC 
GCCGTCGAGG AGCGGGTCGA TTTCGTCCTG ATCGGCGGCG ACCTCTTCCA TACCGGCCAA 
ATCCTCCCCA AGACTTTCGC CAAAACCATC GAAATCCTGC AGCCGTTGAA GGACGCGGGC 
ATCCCCTGCC TTGCGGTCGA GGGAAACCAC GACTGGATAC ACCGTCGCGA CAGCGTCTCC 
TGGATGGAGG CGCTTTCCCA ACTGGGGTAC ATCCGCCTGC TGCGCCCCTC CCGTACCGGC 
GACGGCGATT ACCTTTTCGC GCCCTTCGAT CTGGAGCAGG GAGCGGGGGG GCACCTCGAA 
ATCGGCGGGG TGAATATCTA CGGGCTCGGT TATATCGGCT CCCAGGCGGC CAACCACGTG 
GCGCGCATCT GCGAGGCGGT CGATACCCGC CGAAACATAT TGCTCTTTCA CGTCGGCGTC 
TGGAGCTACT CTCCCGTGGA GATCGGCAAC ATCCGTCCTG AGGAGGCGCT CCCCTTGTCG 
GAGTGCTTCG ACTACGTGGC GCTCGGGCAC GGCCACAAGC CTTACGTCGT CAGCACCCCC 
GACGGCCGCC CCTATGCCTT CAACCCCGGA TCACCCGACT GCGTCAACTT CGGCGAGGAG 
CGCTACGACA AGGGGTACTA CCTTGTCTCG TTGGAGGAGG GTGGGGAGAC CCTTCATGAA 
TTCCGGCGCT GTTCCCCCCG CCCTATGCTG GTTCTCACGG TGAACCTGGA AGGCGCCAAG 
AATGCCGACG AGGCGCTGCA GCGCTTCGCC TCCGGGGTCG CCGAGAAGCT TGGCGGCAGC 
TCCGATCCGC GTTCTCCGCT GATAGAGGTG CGGCTTTGCG GCAAGGTAGG CTTCCACCCC 
TTCGAGCTCA GCCGCGACCG TTTGCGGCTG GCCCTCTTCG AGGTCTGCCA ACCGCTGCAC 
CTGGAGATAA AGAACCACCT CTCCCAGGTC TCCGGCGGGG GAGGGGAGGA GAAGGTCAAG 
AAGAGCCTCG CCGAGATCGA GCGGGATGTA TTGGCCGAGC TGGTAGGGGC GAACAGCCAG 
TACCAGGGTA GGGAAGAGGA GCTGGTGCGT CTTTCCCTGG CTCTTCGCGA CCTGGTGCTC 
AAGGGGGAGG TCGAGGGAGA GGAACTGCTG GCCCTGCTCC CGTCGGGAGG TGCCGAATGC 
GCATAA

Protein sequence

MPVRFIHTSD IHLGKTYRCL GGDAERYQDF FTTFAAIIAD AVEERVDFVL IGGDLFHTGQ 
ILPKTFAKTI EILQPLKDAG IPCLAVEGNH DWIHRRDSVS WMEALSQLGY IRLLRPSRTG 
DGDYLFAPFD LEQGAGGHLE IGGVNIYGLG YIGSQAANHV ARICEAVDTR RNILLFHVGV 
WSYSPVEIGN IRPEEALPLS ECFDYVALGH GHKPYVVSTP DGRPYAFNPG SPDCVNFGEE 
RYDKGYYLVS LEEGGETLHE FRRCSPRPML VLTVNLEGAK NADEALQRFA SGVAEKLGGS 
SDPRSPLIEV RLCGKVGFHP FELSRDRLRL ALFEVCQPLH LEIKNHLSQV SGGGGEEKVK 
KSLAEIERDV LAELVGANSQ YQGREEELVR LSLALRDLVL KGEVEGEELL ALLPSGGAEC 
A