Gene GSU1004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1004
Symbol
ID	2686090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	1084304
End bp	1085395
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	63%
IMG OID	637125674
Product	sensory box histidine kinase
Protein accession	NP_952058
Protein GI	39996107
COG category	[T] Signal transduction mechanisms
COG ID	[COG3852] Signal transduction histidine kinase, nitrogen specific
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.27324
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACCG AAGAAAAGAA AGAGGAATTC CTTGCCACCG TGATCGACAG CGTCGGAGAC 
GGCGTCATCG TCATCGACCT GGACGGACGG ATCGCCCTGA TGAACCCCGC TGCGGAGGAG 
ATCTCCGGCA TTTCGCGGCG GCAGGCCGTG GGACATCGCT TCGCCCTCGT CTTCCACCGG 
GAGGCGGTGC TGCGGGAGAT GGTCGGCAAG ACCGCCACCA GCGGCATGAC CATCTCCGAC 
CACGAGAACA TCGTCATCCG GAAGCTGAAG CAGCTGACGC CGGTTTCGGC GACCACCTTC 
CCACTTATGC TTCCTCACGG CGAAACCACC GGGACGATCC TGGTGCTGCG CGACATCACC 
AGCATCCGGG AGCTGGAAGA TGCCGTCCGC AATGCCGACC GGCTTTCCAC CCTGGGAACC 
CTGGCCGCGG GATTGGCCCA CGAGATCAAG AACCCCCTGG GGGGCATCAA GGGAGCGGCC 
CAGCTCCTGG AGCTGGAACT GCCCACCGAA AGCGAGTTGC GCGACAACGT CCGGATCATG 
CTCAAGGAGG TGGAGCGGGT CAACCGGATT GTTGAGGAGC TTCTGGCCTT GGCCTCGCCC 
CGGGGACTGC AACTGAGCAA GGTGAACCTC CATAAGGTCA TCGGCGACAT CCTCACGCTC 
CAGAAGCGCT CGACCGAAGG GAAGAACGTC GCCTTCCAGC AGCAGTTCGA TCCCAGCATC 
CCGCCCATCC TTGCCGACGA GGGGCTGTTG ACCCAGCTTT TTCTGAACCT CGTGAAAAAC 
GCGATGGAGG CGGTGGATGA CGGCGGCTGC ATCCGGGTCG CCAGCCGGGT GATATCCGAC 
TACTCAATGA CCCAGAAGGG CGAGCGACGC TCGCGGATGG TGGCCATCGA CGTGGCCGAC 
GATGGACCTG GCATCCCGCC GGAGCGGCTC GAGCAGCTCT TCACGCCCTT TTTCACCACC 
AAGACCAAGG GGACGGGCCT GGGGCTGGCC ATCTGCCAGA AAATCGTGAC GGAGCATCGG 
GGAATGATCA AGGTGGAATC GTACCCCGGC AAAGGGACCA CCTTCACGGT GATGCTCCCC 
CTGATTCAGT AG

Protein sequence

MTTEEKKEEF LATVIDSVGD GVIVIDLDGR IALMNPAAEE ISGISRRQAV GHRFALVFHR 
EAVLREMVGK TATSGMTISD HENIVIRKLK QLTPVSATTF PLMLPHGETT GTILVLRDIT 
SIRELEDAVR NADRLSTLGT LAAGLAHEIK NPLGGIKGAA QLLELELPTE SELRDNVRIM 
LKEVERVNRI VEELLALASP RGLQLSKVNL HKVIGDILTL QKRSTEGKNV AFQQQFDPSI 
PPILADEGLL TQLFLNLVKN AMEAVDDGGC IRVASRVISD YSMTQKGERR SRMVAIDVAD 
DGPGIPPERL EQLFTPFFTT KTKGTGLGLA ICQKIVTEHR GMIKVESYPG KGTTFTVMLP 
LIQ