Gene GSU1038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1038
Symbol
ID	2688721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1124101
End bp	1125642
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	63%
IMG OID	637125707
Product	sensory box histidine kinase/response regulator
Protein accession	NP_952091
Protein GI	39996140
COG category	[T] Signal transduction mechanisms
COG ID	[COG3852] Signal transduction histidine kinase, nitrogen specific
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACTC ACGTGCGGAT GAAACATGTT ATGGATGAAT GTGCTCTGGA AAATGCACCT 
CCTCTGATCC TCCTGGTGGA CGATGATGCG GTGACCCGCA AGATGCTGCG CAACCTCTTC 
ACGCTTTCGG GATACCGCGT GGCCGACGCG GAAGACGGCG CCCGGGCGGT TGAGATGTTT 
CGCGAACTTT CACCGGATCT GGTCCTTCTC GATATCATGA TGCCGGTCAT GGACGGGTAT 
GGCGCCTGTG CGGCGATCCG CGGCCTGCCG GGCGGCGAGC ATGTCCCGAT CATCATCATG 
ACTGCCCTGG ACGATGCTAA CTCAATCGGC CGTGCCTTTG ACGCCGGGGC CACCGATTTC 
ATCGAGAAGC CCGTGAACTG GATGCTTCTC AACCACCGCC TTCCCTATCT GCTGCGGGCG 
CGGGACGCCT TTGTCTCCCT CCAGCGCAGC GAGGCTACCA GCCGCCTGCT TTCGGGCGAG 
CTGATGGCGC TCCTGAACTC AATCAACGAC AGCCTTGTCC TGTTCTCCAC CGATCTGAAA 
CTGCTCTGGG CCAACCGGAG CGCCGAGCAT CTCTACGGCG ATTACGTCGA GCAGCTCGTT 
GGTCAGGAGT TCACTTCCCT CAAGGGGGCG CGGGGCATCC CGTCCGATGC CATTGCCGTA 
CGCGCGTCGC TCGGCTCGGG CGAGCCCTGC TACGAGCGCG TATCAGCCGC CGACGGCAGG 
ATCTGGGACA TGAAGTATTT CCCCGTGCGC GGCGAAGACG GCACCGTGCG CGGCATCATC 
GAGCTCGCCT CGGACATGAC GGAGGTGGTC TCACTCCAGG CGGAGGCCCT CCGGTCGGGA 
CAACTGGCAG CCCTGGGCGA ACTGGCAGCC GGCGTGGCCC ACGAGATCAA CAACCCCATC 
AACGGCATCA TCAACTATGC GCAACTGCTG GTGAACTGGC TGCCGTCCGC CTGCAAGGAG 
CGCGACATCG CCGAACGGAT CATCCGGGAG GGAGATCGGG TGGCGGGGAT CGTCCGGGGG 
CTTCTCTTCT TTGCCCGGGA GGGCATGGGG GCGCGCCTGC CCTGCAATGT CGCCGACGTC 
CTGACCGACA CGCTCACCCT CACCGAGGCC CAGATCCGCA AGGACGGCAT TACTCTCAAG 
GTCGGGGTGC CGGCTGACCT GGGTCGCGTG AGAGCCAGCC ACCAGCAGCT CCAGCAGGTC 
TTCCTCAATA TTATCAGCAA CGCCCGCTAT GCGCTCAACG AGAAGTTCCG CGGTTTCCAT 
TCCGCCAAGA TCCTGGAGAT CCGGGGCGAG CGCGTGCTCA TCGATGACCG GCCGTACATC 
CGGATCGGCT TCAACGATAC CGGTACCGGT ATCCCGGAAG CCATCAAGGA CAAGGTGATG 
ACGCCGTTTT TTTCGACCAA GCCTACCTGC AAGGGGACAG GCCTGGGGCT CAGCATCAGC 
CAGAACATCA TCCGCGACCA TGACGGCAAC CTCTCCATCG AGAGCCGCGA GGGGGAATTC 
ACCCTCGTGA GCATCGACCT TCCCGCCGAG GAGACGCCAT GA

Protein sequence

MTTHVRMKHV MDECALENAP PLILLVDDDA VTRKMLRNLF TLSGYRVADA EDGARAVEMF 
RELSPDLVLL DIMMPVMDGY GACAAIRGLP GGEHVPIIIM TALDDANSIG RAFDAGATDF 
IEKPVNWMLL NHRLPYLLRA RDAFVSLQRS EATSRLLSGE LMALLNSIND SLVLFSTDLK 
LLWANRSAEH LYGDYVEQLV GQEFTSLKGA RGIPSDAIAV RASLGSGEPC YERVSAADGR 
IWDMKYFPVR GEDGTVRGII ELASDMTEVV SLQAEALRSG QLAALGELAA GVAHEINNPI 
NGIINYAQLL VNWLPSACKE RDIAERIIRE GDRVAGIVRG LLFFAREGMG ARLPCNVADV 
LTDTLTLTEA QIRKDGITLK VGVPADLGRV RASHQQLQQV FLNIISNARY ALNEKFRGFH 
SAKILEIRGE RVLIDDRPYI RIGFNDTGTG IPEAIKDKVM TPFFSTKPTC KGTGLGLSIS 
QNIIRDHDGN LSIESREGEF TLVSIDLPAE ETP