Gene GM21_3072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3072
Symbol
ID	8138422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3561119
End bp	3562189
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	61%
IMG OID	644870676
Product	diguanylate cyclase
Protein accession	YP_003022858
Protein GI	253701669
COG category	[T] Signal transduction mechanisms
COG ID	[COG3605] Signal transduction protein containing GAF and PtsI domains [COG3706] Response regulator containing a CheY-like receiver domain and a GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.000000000986718
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCGAGT GTGGTTGCGG TACCCAAAAA GAATCGCTCG AATCGCAGGT TAAGGCGCTC 
AAGGACCTGA TAGAGGTCGC CAAGGCGGTC GTCTCGACGC TCGATCTGGA TACGGTGCTG 
CAGGCTATCC TCAACAGCGC CATGGGATTT GCCGAGACCC CCGCCGGGAG CGTCGCCCTT 
TATTACGACG CCAAGCGTGA GTTGAGCCTG CATGCCCACT CGGGGCTTAC GGCGGACTTC 
GTAAAGAAGG AGCGATGGGA GGTGGCCCCG GGCGGGCTTA CCGAACAGGT GCTTTCTGCG 
GGGGAGATCT TCCTGATCGA GGACACGGAG AAGACCCCGT TCTTCAAGAA CCCGATAGCG 
CTAAACGAAG GTATCCGCTC TCTGGTCTGC GTGCCGCTCA TCTTCCAGTC GCGCATCGTG 
GGGATACTCT ACCTTGACGA CTTCAAGCCG AGGGAGTTCG ACCGGGAGAA GATGAACATG 
CTCTCGATCC TCGCCTCGTT CGCCGCCATG GCGATACACA ACGCGACGCT GCACAAGCGG 
ACCAAGCTCC TGGCGATCAC CGACTCGCTC ACCGGGCTGC ACAACCACCG CTACTTCAAG 
CAGTACTTCA GGCAGGAGAT GGGGCGCGCC AAGCGCTACC ACAAGCCCTT CTCCATCATC 
ATGATGGACG TGGACGACTT CAAGTCCTAC AACGACAGCT TCGGCCACGC CACCGGCGAC 
AGGCTGCTGG CCTTCATGGG CGAGATTATC CTGCAGACCA TCCGCGGCGT GGACGTCGCC 
TTCCGCTACG GCGGGGAAGA ATTCATCGTG CTGCTCCCCG AGACCAAGCT CGACAAGGCT 
ATTCTCGCCG CCGAGCGTCT GCGCGAGAGC GTGCAGGCCG GAACTGCTAA CCGGCCGGTG 
GACGGGTCGG GTCGCGGCGT GACCGTCAGC ATCGGCGTGG CGAGCTACCC CGACAATGCC 
GACAAGATGG ACGAACTCTT CAACATCGTC GATTCTCTCC TTTACCTTGC CAAGCGCTGC 
GGCAAGAACA AGGTATATCA CCAGGAAAGC CTACAGATCC CCGCGCCATG A

Protein sequence

MSECGCGTQK ESLESQVKAL KDLIEVAKAV VSTLDLDTVL QAILNSAMGF AETPAGSVAL 
YYDAKRELSL HAHSGLTADF VKKERWEVAP GGLTEQVLSA GEIFLIEDTE KTPFFKNPIA 
LNEGIRSLVC VPLIFQSRIV GILYLDDFKP REFDREKMNM LSILASFAAM AIHNATLHKR 
TKLLAITDSL TGLHNHRYFK QYFRQEMGRA KRYHKPFSII MMDVDDFKSY NDSFGHATGD 
RLLAFMGEII LQTIRGVDVA FRYGGEEFIV LLPETKLDKA ILAAERLRES VQAGTANRPV 
DGSGRGVTVS IGVASYPDNA DKMDELFNIV DSLLYLAKRC GKNKVYHQES LQIPAP