Gene GSU1050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1050
Symbol
ID	2688693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1137432
End bp	1138790
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	63%
IMG OID	637125719
Product	sensory box histidine kinase
Protein accession	NP_952103
Protein GI	39996152
COG category	[T] Signal transduction mechanisms
COG ID	[COG4251] Bacteriophytochrome (light-regulated signal transduction histidine kinase)
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAACAA TGAGTGACCC GCCTAAAAAC GGTATTGAAT CGATCATCGT CACGACCCTC 
GTGGCGCTTA CGGCCTTCTG GTTCGCCGAC ACGGTGATCG ATGCCGTCAT TCCCCAGATG 
GGATGTGAAT GCGGCCTCCT TCACGCTCCG ACCGTGCGTG CCTCTCTGTT CCACCTGATC 
CCCCTCATTG CGCAACTGCT GCTCATTTTC TTCGTCCGCA GACTGTTCAG GGAGCGCCGG 
CTGCTGGTCC GGAAGCTGGA AGCGGCGGTG GCCACTACCC TGGATGAAAA GGCCAGGACC 
GATGCCGTCA TTGCCGCGGT CGGCGACGGA GTCTGCATGC TCGACCGGGG TTTCCGCATC 
GTCTACCAGA ACCGGGCCCA TGAGCGCCTG CTCGGCGAGC ACGGTGGAGA ACGCTGCTCC 
GACGCATACG GCGAAGACCC GGATGCCTGC CGTGACTGTC CCATGGCCCG CGCCATGGAT 
ACGGGCGAGG TATGCACGGG AAGCCGCCGG TTCATCAGCA AGGGGGAGAC GCGTCTTCTG 
GAGATCACCT CCTCGCCGGT GCGCAATGCC GCCGGTGAAA TCGTCGCCGG CGTCGAGGTG 
GTTCGCGATG TGACCGAGCG CAGGCGCAGC GAGGAGGAAA TCAAGTCCCT CAATGCCGCC 
TTGGAGCGCC GCGCCAGGGA TCTGGCAGCC AATAACCGGG AGTTGGAGGC GTTCAGCCAT 
TCTCTCTCCC ACGATCTGAG CGCCCCGCTC GCCAAGATAT CCTGCGCTGT TGAGACGCTG 
CGGGAAACCT ACGGCGAGCA AATGGGCGAC GACGGTCGGT TCCTGTTGTC GTGTATCTGC 
GAAGGGAGTT CCCAGATGGA TGACCTCATG GAAGCCCTCC TTGCCTTGAA CCAGGTTTCG 
CGAAAAGACC TCCGCCGTGA AAAAGTCGAC ATGGGAGCAC TAGTCAGCCA GCTCGCTCTG 
GACCTGCGCC GGTCGGAGCC GGCCCGCCGG ATCGATTTTG TCATTGCCCC CGATCTGACG 
GCCGAGGGGG ACCCCTCAAT GCTCCGTGTG GCCTTGCAGA ACCTGCTGTC CAATGCCTGG 
AAATTCACCC GGAACGTGGA TGGCGGCCGG ATAGAATTCG GCTCCGTTGA CCGCAACGGC 
GAACGAGTCT TTTATCTTCG CGACAATGGC GCCGGTTTTG ACATGAGGCA AGTGGGACGG 
ATATTCGAGG TGTTCCAGCG GCTCCACGAC GAGAGCCTGT TCCCGGGCAC CGGAGTGGGG 
CTCGCCACCG TACAACGGGT CATCGAGCGG CACGGCGGCA CCGTTACCGC CCACGGCGTG 
CCGGGCCATG GGGCAACCTT CACCTTCACC CTGCCGTAG

Protein sequence

MKTMSDPPKN GIESIIVTTL VALTAFWFAD TVIDAVIPQM GCECGLLHAP TVRASLFHLI 
PLIAQLLLIF FVRRLFRERR LLVRKLEAAV ATTLDEKART DAVIAAVGDG VCMLDRGFRI 
VYQNRAHERL LGEHGGERCS DAYGEDPDAC RDCPMARAMD TGEVCTGSRR FISKGETRLL 
EITSSPVRNA AGEIVAGVEV VRDVTERRRS EEEIKSLNAA LERRARDLAA NNRELEAFSH 
SLSHDLSAPL AKISCAVETL RETYGEQMGD DGRFLLSCIC EGSSQMDDLM EALLALNQVS 
RKDLRREKVD MGALVSQLAL DLRRSEPARR IDFVIAPDLT AEGDPSMLRV ALQNLLSNAW 
KFTRNVDGGR IEFGSVDRNG ERVFYLRDNG AGFDMRQVGR IFEVFQRLHD ESLFPGTGVG 
LATVQRVIER HGGTVTAHGV PGHGATFTFT LP