Gene GSU1940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1940
Symbol
ID	2685487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	2123258
End bp	2124625
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	58%
IMG OID	637126631
Product	sigma-54 dependent DNA-binding response regulator
Protein accession	NP_952989
Protein GI	39997038
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID	[TIGR02915] putative PEP-CTERM system response regulator

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.525901
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAAC TGCTGATCGT CGACGACAAC GAAGATATTC GCAAACAGCT GAAATGGGGC 
ATCGGCAAGG AGTACACGCT GTTCCTGGCG GCCGATGCCC GGGAGGCCAT TGATGTTTTT 
CGCAAACAGC GGCCGACGGT GGTTACCCTT GACCTGGGGC TGCCACCCCA TGAGGATAGC 
TCCGAGGAGG GGTTCCGCTG TCTGGAGGAG ATGCTGCGCA TCGCTCCCGA TGTGAAGGTA 
ATCGTCATTA CCGGCAACGA TGGCAGGGAA AACGCGGTCA AGGCGGTTCA ACTGGGGGCC 
TACGATTTTT ATCAGAAACC GATCAATCTC GACGAGTTGA AGGTGATCGT GAAGCGGGCG 
TTCCACCTTC AGACGTTGGA GGAGGAGAAT CGGCGCCTCC AGAGTGCGCT GGACGGCGGC 
TCCACTGAAT TCAGGGGGTT TGTCGGCCAA TGTCCCGAGA TGCAGCAGGT ATTTTCCACA 
ATCCGCAAGG TAGCGGCTTC CGATATCTCG GTACTGATCC ACGGCGAGAG CGGCACGGGC 
AAGGAACTGG TGGCCCGGGC GATCCACGCC ATGAGTCTGC GCAAGGACGG GCCGTTTATT 
CCCATCAACT GTGGCGCCAT CCCTGAAAAC CTTCTGGAGG CGGAGCTCTT CGGACACGAG 
AAGGGGGCGT TCACCGGCGC CCTCAATCGA GTGCTGGGGA AGGTCGAGTA CGCCCACAAA 
GGGACCCTGT TCCTCGACGA AATCGGAGAG TTACCGCTTA ATCTTCAGGT AAAGCTTTTA 
CGTTTTCTGC AGGAGAAGGT TATCCAGCGG GTCGGCGGCA GGGAGGACAT CGCCGTTGAT 
GCCCGGATCG TGGCTGCCAC TAATGTTGAC ATCGCCCGCT CCATGGCCGA GGGGACCTTC 
AGGGAAGACC TGTTCTACCG GATCGGTGTG GTTTCCATCA CCCTGCCTCC CCTCAGAAGC 
CGGGGAGAAG ATGTAATGCT CCTGGCGAAT CTGTTCCTGA AACGATTTTC GATTGAGTTG 
CGCAAGAAGA CCAAGGGGTT CAGCTCAACA TCGCGTGAAT ATCTCGAAGC CTACGCCTGG 
CCCGGCAACG TGCGGGAGTT GGAGAACAAG GTCCAGCGGG CCGTGCTCAT GGCAGCGTCG 
CCGATTATCG AGCCGGATGA CCTGGGATTC ACCGAACGGC CGATACCGAG GGCATCCACA 
TCGCTGGAGG GCGTATCGCT CCGTGAGGCA CGGGATCGAG TTGAGCGTGA GATGGTACGC 
GAGGCCATAT CAAGGTGCAA GGGGAACATT GCCCGAGCAG CCGAGGAGTT GGGGATCAGC 
CGGCCAACTA TCTACGACCT GATGAAAAAA CACGGGATAA GTGGGTAA

Protein sequence

MEKLLIVDDN EDIRKQLKWG IGKEYTLFLA ADAREAIDVF RKQRPTVVTL DLGLPPHEDS 
SEEGFRCLEE MLRIAPDVKV IVITGNDGRE NAVKAVQLGA YDFYQKPINL DELKVIVKRA 
FHLQTLEEEN RRLQSALDGG STEFRGFVGQ CPEMQQVFST IRKVAASDIS VLIHGESGTG 
KELVARAIHA MSLRKDGPFI PINCGAIPEN LLEAELFGHE KGAFTGALNR VLGKVEYAHK 
GTLFLDEIGE LPLNLQVKLL RFLQEKVIQR VGGREDIAVD ARIVAATNVD IARSMAEGTF 
REDLFYRIGV VSITLPPLRS RGEDVMLLAN LFLKRFSIEL RKKTKGFSST SREYLEAYAW 
PGNVRELENK VQRAVLMAAS PIIEPDDLGF TERPIPRAST SLEGVSLREA RDRVEREMVR 
EAISRCKGNI ARAAEELGIS RPTIYDLMKK HGISG