Gene GM21_2103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2103
Symbol
ID	8137439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2447136
End bp	2448284
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	62%
IMG OID	644869718
Product	histidine kinase
Protein accession	YP_003021913
Protein GI	253700724
COG category	[T] Signal transduction mechanisms
COG ID	[COG4251] Bacteriophytochrome (light-regulated signal transduction histidine kinase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	84
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGATGG AGCTCGCCGA GCGGCTTTAC AGACTGATGT TCACCAACAT GCGGGAAGGG 
CTGGCCATCC TGCGCGTCGA CCCCGATGAT GGCGAAGCAT CACCGGCGGT GATCGAGATG 
AACCCCGCCG CCGTGAAACT CTGCAGTTGC AGCTCGTTCA ACTTCGGCAA CTGCAAGGTC 
GTCGACTGTT TCCCCGGCTG GTTCGACGAG GACCGGCTTC GTGAAACCTG CAGACGCCTG 
GCGGCCTTCG GCGGCATGGT GGAACTGGGC GAGGTCTCCT GGGGAGGGTC CAGTTATCGG 
GCCCGTATCT TCGGGTTGTC GGAGGAGCAT TTAGGGCTCG TCGTAGACGA CGTTACGCGG 
CAGAAAAAGG GGGAGGGGGA GATAGCGAGG CTCTCAACCC AGGTCGAGCA GCAGACAGCG 
GGGCTGGAAA AGCGCGTGGC GGAGAGGACC GCGCAGTTGC AGGAGATGAA CGAGGAACTC 
GACAGCTTCG CCTACTCGGT TTCCCACGAC CTGCGCGCGC CACTGCGCGC CATGCGGGCC 
TTCGCCGGGA TACTGCTGGA GGAGGAGCAA AGCGAGGCCG AGCGGGTAGC GTACCTGAAA 
CGGATCCAGG GGGCGGCGGA GGGAATGGAG CGCCTGATCC AGGATCTCCT CGCCTACAGC 
CGCGTCGGCC GCCAGGAACT GGTGCTGCAG CGCGTCAGCC TCGATGAGGT GCTCGCCGAC 
GCGGCTAAGC AACTGGATCT AACCAGCGGG GGCAAGAGCT ACCGTTTGGA GGTGCAGGAC 
CATCTTCCCG ATGTGGTCGG GCACCATACG GTGCTGGTCC AGGTGGTTTT GAACATCATG 
GGGAACGCCA TAAAGTTCGT TCCCAAAGGG GTGGTCCCGG CGCTGGAAGT GTGGGCCGAT 
GAGATGGACG GAGAGTGCCG CCTTAACATC GCCGACAACG GCATCGGTAT TGCGCCTGAG 
CACCAGGAGC GGATCTTCAA GATCTTCGAA AGGCTGCACG GCATCGAAAG CTACCCCGGC 
ACAGGAATCG GGCTAGCCAT CGCACGTAAG GCGGTCACCA GGCTTGGGGG AAGGATAGGG 
GTAGAGTCGT TGGAAGGGGA AGGGAGCAGG TTCTGGATCG AGCTTAAAAA AGCCGTTCGC 
TCGTCCTGA

Protein sequence

MEMELAERLY RLMFTNMREG LAILRVDPDD GEASPAVIEM NPAAVKLCSC SSFNFGNCKV 
VDCFPGWFDE DRLRETCRRL AAFGGMVELG EVSWGGSSYR ARIFGLSEEH LGLVVDDVTR 
QKKGEGEIAR LSTQVEQQTA GLEKRVAERT AQLQEMNEEL DSFAYSVSHD LRAPLRAMRA 
FAGILLEEEQ SEAERVAYLK RIQGAAEGME RLIQDLLAYS RVGRQELVLQ RVSLDEVLAD 
AAKQLDLTSG GKSYRLEVQD HLPDVVGHHT VLVQVVLNIM GNAIKFVPKG VVPALEVWAD 
EMDGECRLNI ADNGIGIAPE HQERIFKIFE RLHGIESYPG TGIGLAIARK AVTRLGGRIG 
VESLEGEGSR FWIELKKAVR SS