Gene GSU0471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0471
Symbol
ID	2686187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	500664
End bp	501923
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	64%
IMG OID	637125138
Product	sensor histidine kinase
Protein accession	NP_951530
Protein GI	39995579
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.328588
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTCGA CAACAATCCT ACGTATGCGC GGCAATATCG TTTCCCTCAT CGCCCTTGCG 
GCCGGAGTCA TCCTGTCACT GCTTCTCGGC TGGTTCGCCG TGGGAAACTA CCGGAGCGCA 
CGCCCCATTG CCGAAGGGAA CCTCCGGGGG CTTGCCCTTT CACTCACGTC GGCGCTGGAA 
TCGATTGCGG CACGCGACTC GTCCCTGGCT TCACTGGCCG CCTTTCGCGC CCGGGACATC 
GCCTATATCT CGGTCATCGA CCGCAACGGC ACCATCGTCT TTCACTCCAA TGCCGACCTG 
ATCGGATCGC GGGTGACGGA TCAACGGTAC GTGACGGTTC TCGGCGGACG GGGCTTGGCG 
GAAAACCGCA TCAGACTCGG CACGGGCGAA GAGGTGTACG AATATCATGC CCCCCTCCAC 
CTCCCCGGCC GAACCCTGGC CCTGCGCCTG GCACTTCACC CCTGGCGAGC CGATGCGGTG 
ATCCACCGGG CCAGGGTAGG CATGGTCGTG CTGTTTTCGC TGCTGGCGGC GGCCTGGACG 
ATGGGGGTGC TCCTCTATCG CTACGCCCGC CGGGCCCAGG AGCACCGGCT CGAAATGGTC 
CGACGGGAGC GGCTTGCGCA ACTGGGAGAA ATGGGGGCGG TGCTTGCCCA CGAGGTGCGC 
AACCCCCTGT CCGGGATCAA GGGCTACGCC CAACTGCTCA TGGAACGGAG CAACGACGAT 
GAAAACCGGG AGTTCTCCGC ACTGATCGTC ACCGAGGCAA TCCGGCTCGA ATCGCTCGTC 
AGCGACCTTC TTGCCTACGC CCGGCCGGAG CCCGGGCCAG AAGGGCCGCT CCAGGTAAAC 
GCGGTGATTG ACCATGTGCT GGCACTGGTG GACCCCGAAG CGCGGGCCGC CGGCGTCACC 
ATTGCGGCAT CCCTTGCCGA AGGATTGGCC ACAAGAGGAA ATGAAGCGCG GTTGGAGCAA 
CTCATTCTCA ATCTGGCAAA GAACGGCATT CAGGCCATGC CGGACGGGGG AACGCTCACC 
GTTGTCACCC GGCGCGAAGG TAAAACGGTC GAGATCAGTG TGGCAGACCA CGGCCACGGC 
ATCGCCCCCC ACGACCGGGA GCGGATATTC ACCCCGTTCT TCACCACAAA GGCCCGGGGC 
AGCGGCCTGG GGCTCGCCGT CTGCCGCAAG ATAGCCGAAG CCCATGGGGG GAGCATCAGC 
GTGGCGGATA ATCCCGGCGG CGGCACCGTT TTTCGGGTAA CACTCCCCCT TCACCGATGA

Protein sequence

MDSTTILRMR GNIVSLIALA AGVILSLLLG WFAVGNYRSA RPIAEGNLRG LALSLTSALE 
SIAARDSSLA SLAAFRARDI AYISVIDRNG TIVFHSNADL IGSRVTDQRY VTVLGGRGLA 
ENRIRLGTGE EVYEYHAPLH LPGRTLALRL ALHPWRADAV IHRARVGMVV LFSLLAAAWT 
MGVLLYRYAR RAQEHRLEMV RRERLAQLGE MGAVLAHEVR NPLSGIKGYA QLLMERSNDD 
ENREFSALIV TEAIRLESLV SDLLAYARPE PGPEGPLQVN AVIDHVLALV DPEARAAGVT 
IAASLAEGLA TRGNEARLEQ LILNLAKNGI QAMPDGGTLT VVTRREGKTV EISVADHGHG 
IAPHDRERIF TPFFTTKARG SGLGLAVCRK IAEAHGGSIS VADNPGGGTV FRVTLPLHR