Gene GM21_3597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3597
Symbol
ID	8138970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4175860
End bp	4177017
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	61%
IMG OID	644871217
Product	diguanylate cyclase
Protein accession	YP_003023376
Protein GI	253702187
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	134
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGAAG AAAAGGAGTG GGTTAGCTCT GATGCTATGG CCAGATACGC CGGCCACGAC 
CGGGTCCTGG GCGTCATAAC ATGGCTCTTG GTAGCGCTGG TGCTGCTCGA CATATCGCTT 
TTGCACGTCG GTCACCGCAG CACCATCGTT GTGCTCTTCT GCTCCCTGGG GCTTGTCTGC 
TACAAGGCTT CGGCGCGGTT CCTCGTGCGC CGGGGCGAAA CGAAAAGTTT GCTCGATCTG 
GTCCTGCTCC TTTTGTACGC CATCGCCGTC AGTTGGTTTA CCGGCAAAAC TTCCAGCCCC 
TTCATCTCGG TTTTGTACCT GATCCTGATG GCGACCTCGC TCACCCTCGG GCGCTGGATC 
GCCTTCATCA TGACCGGCCT GACCATTGCC CTCTATACCT TGCTCGCCTC CTTCCAGTCC 
CCTAGCTTCT GGTACGACAT CGGCGGACAC CTCGTGAAGA TATTCCCCTT CATCCTGATC 
GCGCACCTGG GTGCGCTGCT GCGAGGCGAG GCGGAGAGCG CGCGCGCCGA GGTGGAGCGG 
CTTTCACTCA CCGACGACCT CACCGATCTC AACAACATGC GCAGCTTCGA GGCCCTTGCG 
CTGCAGCAGG AGAAGATCTC GAAACGCTAC GGCACCCCGT TTTCCATCTG CATGCTGGAC 
GCAGACAATC TGAAGCAGAT AAACGACCGG CACGGGCATC TGGCGGGGAC GGCGCTGATC 
AAGTGGACCG CGCGCATCAT AGCCTCCAAT ATCAGGGAGA GCGACGTCGC CGCCAGGTTT 
GGCGGCGACG AATTCATCAT CATGTTCGCC GGCCGGGAGC AGCAAAATAT CCTCGCTGCC 
GTGGAGAGGA TCGTTCGCGC CATGAACGAC TCTCCTTTCT CCTTCGAGGG TGAGTTGGTC 
CAGGGGACGC TGTCGGCCGG GGTGGCGTCG TTTCCGGCTG CCGGCGAGGA CCTGCGCAGC 
ATTGTGAAGA AGGCGGACCT GGCGATGTAC CGAAGCAAGA GGCTGGGCAA GAACCGGGTT 
TCGCTCTTCG ACGATCAGGA AGGGGAGGCT GTGCCGAGCG GGTTACAGGT AGGGGGAGAA 
AAGCTTTGCC GCGGCGTCCC TCAGCTTGAT GGCGAGGGGG CGTCCGTCCA TCTCGGCGAG 
GGTGACCTCC CGGGATAG

Protein sequence

MIEEKEWVSS DAMARYAGHD RVLGVITWLL VALVLLDISL LHVGHRSTIV VLFCSLGLVC 
YKASARFLVR RGETKSLLDL VLLLLYAIAV SWFTGKTSSP FISVLYLILM ATSLTLGRWI 
AFIMTGLTIA LYTLLASFQS PSFWYDIGGH LVKIFPFILI AHLGALLRGE AESARAEVER 
LSLTDDLTDL NNMRSFEALA LQQEKISKRY GTPFSICMLD ADNLKQINDR HGHLAGTALI 
KWTARIIASN IRESDVAARF GGDEFIIMFA GREQQNILAA VERIVRAMND SPFSFEGELV 
QGTLSAGVAS FPAAGEDLRS IVKKADLAMY RSKRLGKNRV SLFDDQEGEA VPSGLQVGGE 
KLCRGVPQLD GEGASVHLGE GDLPG