Gene GM21_4093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_4093
Symbol
ID	8139467
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4672478
End bp	4673788
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	64%
IMG OID	644871708
Product	metal dependent phosphohydrolase
Protein accession	YP_003023866
Protein GI	253702677
COG category	[T] Signal transduction mechanisms
COG ID	[COG2206] HD-GYP domain
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	147
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGACG GGCTGCAGCA TGCACAACGC CTGGCGACGC TCCTGTCGGG CGCGATCAAG 
GGGGCCGGGC TCTATCCGCC TGGGCACCCC GCCTCGTTGC AGCCCTTCCG GGAAATGGAA 
GCGTTGATGC TGACGCTGCA GCGAAACGGC GGAGACCTGC GCCTGGCTGT GGTGGATGGA 
GTTCTCTCTG TCGGCGAGCA TCTCTTCTTC GCGCCCCCCG CTCCGCTGCA GGAGCTGATC 
AACCGTCTCG AGGAGAAGGG GATAGCGGGC CTGGTCCTCA AACCGGGGGT GCTGGCGCCG 
GATCTGACCG TGTTGGCGCG CCTGATGGCG GAGGGAAGCG GCGAGGCCTG CGACCTCACG 
CGCGGACTCA AGGAGGCCGG GGTAAAACTG ATCGAGGTGA TGGAGGAGAA TTCCCTCTCC 
CATACCTACA ACGAGGCGGT CAGCGCGGTG CGCGACATCT TCGAGGAGAT CGGCAAGGGG 
CGCATACCCA ACTCCCGGCG CATGCTTACC GTGGTGAGCA GCCTCGCCTC GGCGGCCATC 
AAGGAGCCGG CGGCGCTCTT GGGCCTGGCC CTGATCAAGG ATTACGACAA CTACACCTTC 
CAGCACAGCG TCAACGTCGG CGTACTCTCC ATGGCGCTCT CAGCGTCCAT GGGACAAGAG 
GAGGTCAAGG TGGAGGAGTG CGGCCTGGCC GGTTTTCTCC ACGACATCGG CAAGACCCGG 
GTGGACAAGG ATATCCTCAA CAAGCCGGGG AAGCTTAGCA GCGACGAGTT TGTGGAGATG 
AGGAAGCATC CGGAATTCGG CGCCGCCATC GTCCGGGAGA TGGAAGGGGT TTCGGAAGGG 
GTGGCCGAGG CGGTCCTGGG ACATCACATC CGTTACGACC GGGCAGGATA CCCCGATTGG 
GCCAGGGAGA AGGAGTTCGG GACCACCAGC AAGATCGTCG CCGTCGCCGA CTTCTACGAC 
GCCACCACCA CGCTGAGAAG CTACCAGCGC CCCATGCTCC CCGACCAGGC GATGAAGGAA 
ATCAGGAAAG CGGTGGGGGG AAGCCTCGAC GGCACCATCG TGGAGCGGTT CATGGAGTTG 
ACCGGGAAGT ACCCCACAGG GAGCCTGGTT CGGCTCGACA GCAACGAGAT CGCGGTCGTT 
TTCTCCCCCA GCAGCCAGCC CTGCGGCGCG GCGGTGGTGA AGGTGGTCAT GGACCGGCAC 
GGGAGCCTGC TCGGCGACCC CGAACTGAGA AGCCTCATCA CGAGCGGCGA CAACATCGTC 
GACCTGGTGG ATCCTCTGGT CAAGGGGATC GACGTGGCGC AGTACTTTTA G

Protein sequence

MTDGLQHAQR LATLLSGAIK GAGLYPPGHP ASLQPFREME ALMLTLQRNG GDLRLAVVDG 
VLSVGEHLFF APPAPLQELI NRLEEKGIAG LVLKPGVLAP DLTVLARLMA EGSGEACDLT 
RGLKEAGVKL IEVMEENSLS HTYNEAVSAV RDIFEEIGKG RIPNSRRMLT VVSSLASAAI 
KEPAALLGLA LIKDYDNYTF QHSVNVGVLS MALSASMGQE EVKVEECGLA GFLHDIGKTR 
VDKDILNKPG KLSSDEFVEM RKHPEFGAAI VREMEGVSEG VAEAVLGHHI RYDRAGYPDW 
AREKEFGTTS KIVAVADFYD ATTTLRSYQR PMLPDQAMKE IRKAVGGSLD GTIVERFMEL 
TGKYPTGSLV RLDSNEIAVV FSPSSQPCGA AVVKVVMDRH GSLLGDPELR SLITSGDNIV 
DLVDPLVKGI DVAQYF