Gene GSU3437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU3437
Symbol
ID	2686873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	3781828
End bp	3783429
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	65%
IMG OID	637128132
Product	sensory box histidine kinase
Protein accession	NP_954477
Protein GI	39998526
COG category	[T] Signal transduction mechanisms
COG ID	[COG4251] Bacteriophytochrome (light-regulated signal transduction histidine kinase)
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGAGCG AACACATCTG CAAATTGCTG CTCGATTTCG CAGCTGACTG GGAGTTCTGG 
CTCGACCCCG AGGGGGCCTG TCGCTATGTC TCCCCGGCCT GCGAGCGGAT TACCGGGTAC 
CGTCCCGACG AGTTCATGGG TGAAGCGGGC CTGCTGCGGC GGATTGTCCA TCCTGAGGAC 
CGGGAGGCCG TGGAGAGCCA TCTGACGGAT GCTCTGGCCA ATCGAGAGGG GGTCTGCCCC 
ATTGACTTCC GCATCATCAC GCGCACCGGT GAGGTGCGTT GGATCAGTCA TCACTGTCAG 
CCGGTGCACG ACGGCGCCGG AACGTTTCTC GGCCGGCGGG GGAGCAATCG GGACATTACC 
GACCGCATGG CGGCCCAGGA GGAGAACCGG CGGCTCGGCG GGCTCATGGA GCGGCTTGTC 
CGCGTAGTGC AGGAGCTTTC CCGGGCCCGC AGCCTCGACG AGATTACGGC GGTGGTCCGG 
ACTGCCGCCC GGGAGTTGGT GAGCGCCGAC GGGGCCACGT TTGTCCTGCG GGAAAACGGT 
AACTGCTTCT ATGCGGACGA AGATGCCATC GCCCCGCTCT GGAAGGGGCT CCGGTTCCCC 
CTTGAGCGCT GCATCAGCGG GTGGGTCATG CTCAACCGGC AGGCGGCGGT CATCGAGGAT 
ATCTACCAGG ATCAGCGGAT ACCCGTGGAG GCCTATCGCC CTACGTTCGT GCAGAGCCTT 
GCCATGGTCC CCATCCGGGG GGAAGACCCC ATCGGCGCCA TCGGCACCTA CTGGGCCAGG 
CGCCATCGCC CCTCCGAGCA GGAGATCAGC GTCATTCAGG CCCTTGCCGA CACGACGTCG 
GTGGCCATGG AAAATGTGCG GGTCTACGCG GATTTGGAGC AGCGCGTGCG GGAGCGCACC 
GAGGCCCTGG AAACCGCCAA CCGCGAACTT GAGGCGTTCG GTTTTTCAGT TTCTCACGAC 
CTGCGCGGCC CGCTCCGGAG GCTGGACGGG TACAGCCGCA TGCTCTATGA GGACTACGCC 
GACCGCCTGG AGGGGGAGGG GCGGGACATC CTCATCCGTA TGATCCGGCT GGCAACGCGG 
ATGGAACAGC TGATAGACGA TCTTCTCAGG TTTTCCCGGA GCGTGAAGGG TGAGGTCGTC 
CACGAGGCGG TGAACCTGAG CCGCCTGGCG CGGAGCATTG CCCGTGAGCT GAGTGACGGG 
GAGCCCGGTC GGGCAGTGGA TTTCATCATA GCCGACGGCC TGACGGTCGA GGGGGATCCG 
GGGTTGCTGC GGGCTGCCAT GGAGAATATC CTTAGGAACG CCTGGAAATA TACGGCCCCA 
AAGGAGAACG CAGTCATCGA GTTCGGCCGT TGCGAGGGCG AGGGAGAGCG GCTCTACTTT 
ATCCGCGACA ACGGCGTCGG CTTTGACATG GCCCACAAGG ACAAGCTTTT TCAGCCCTTC 
GAGCGCCTCC ACGACGCGCG CGCGTTCGAG GGGACCGGCA TCGGCCTTGC CACGGTCAAG 
CGGATCATCG ACCGCCATGG AGGGCGCATC TGGGCGGAGG GAACGCCCGG CGCCGGCGCC 
ACGTTTTACT TCACGTTGCC GGAACCCGGC GGGGAGTCAT GA

Protein sequence

MESEHICKLL LDFAADWEFW LDPEGACRYV SPACERITGY RPDEFMGEAG LLRRIVHPED 
REAVESHLTD ALANREGVCP IDFRIITRTG EVRWISHHCQ PVHDGAGTFL GRRGSNRDIT 
DRMAAQEENR RLGGLMERLV RVVQELSRAR SLDEITAVVR TAARELVSAD GATFVLRENG 
NCFYADEDAI APLWKGLRFP LERCISGWVM LNRQAAVIED IYQDQRIPVE AYRPTFVQSL 
AMVPIRGEDP IGAIGTYWAR RHRPSEQEIS VIQALADTTS VAMENVRVYA DLEQRVRERT 
EALETANREL EAFGFSVSHD LRGPLRRLDG YSRMLYEDYA DRLEGEGRDI LIRMIRLATR 
MEQLIDDLLR FSRSVKGEVV HEAVNLSRLA RSIARELSDG EPGRAVDFII ADGLTVEGDP 
GLLRAAMENI LRNAWKYTAP KENAVIEFGR CEGEGERLYF IRDNGVGFDM AHKDKLFQPF 
ERLHDARAFE GTGIGLATVK RIIDRHGGRI WAEGTPGAGA TFYFTLPEPG GES