Gene GSU3199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU3199
Symbol	cheA-3
ID	2688365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	3506196
End bp	3507881
Gene Length	1686 bp
Protein Length	561 aa
Translation table	11
GC content	66%
IMG OID	637127892
Product	chemotaxis protein CheA
Protein accession	NP_954240
Protein GI	39998289
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0643] Chemotaxis protein histidine kinase and related kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACATGT CCCAGTACCG GGACCTCTTC GTTGCCGAGG CCCGGGAACA CCTGGAGCGC 
CTGGGCGAAG AGGTACTGGC CCTGGAAAAG GACCCGGCCA ACGGCGAACG CCTCGACTCG 
CTCTTCCGCA CCGCCCACTC CATCAAAGGC ATGGCGGGCT CCATGGGATA TGACGGCATA 
GCCGACCTTT CCCACCGCAT GGAAGACCTG ATGGACCGCG TCCGCAAGGG CCGGATTCCC 
TTTGGCCGGG ACATCGCCGA CCTGCTGCTG GCCTGCGCGG ACCAGTTGGG ACGAATGGTG 
GAAGACGTGA CCGGCGGCGG GAACGGCTCC CTCGACGCGA CAGACCTCTG CGCCAGACTC 
GCCCTGGTTG CCGGGCAGGA GGCCGCAGCC CCGGCGGCTC CAGCCGATGC AGAGACATCC 
CCCTCCCCGC AGCCATCCGA CCAGCCGGAA CCGGCACGTC GCGACGAAAG CGACGGGGCG 
CGAACCGTCC GGATCCGGTC AGAGCTTCTT GACCGATTTG TCAACATAAC CGGCGAACTG 
GTCACCGGCA AGAACCGGAT CATGGAACTG GCGGCGGGAC TCGAATCCGA ACCACTGCGG 
GATGCGGCGG CCGAACTGTC GAAACTGGTC CGCGACCTGC AGCGCGAGGT CATGTCGGCC 
AGAATGATGC CCTTCGGCAC CATCTGCGAC CGTTTCCCCC GCATGGTGCG GGATCTGGCT 
CGCCGTAGCG GGAAAGAGGC GACGCTGGCC ATCGACGGCA AGGATCAGGA ACTGGATCGC 
GGCATTCTGG AAATTCTCCC CGACCCTCTG CTCCATGCCC TGCGCAATGC CGTCGATCAC 
GGCATCGAGT CGCCGGAGGA ACGGAGTGCG GCCGGAAAGG GAGCGGGGGG TCGGATCGTC 
CTGTCGGTTC GCAGGGAAAA AGACCATCTG GACGTGACAG TGACGGATGA CGGGCGGGGC 
ATGGATCCGG CAGCTCTCGT CAACGCCGCC CTTGCCAAGG GAATCATCAC CCCGGAAGAG 
GCGGCGACGC TCAGCCGGCA GGAGGCGTTG ATGCTCGTCT GCAGGCCGGG CTTTTCCACG 
GCCAGGAGCG TCACCGAGGT ATCCGGAAGA GGGGTGGGGA TGGATGCGGT GCAAGCCGCT 
GTAAGTCGGG CGGGTGGCAG CCTGTCCATC CAGTCCGAGC GAGGCCGGGG AAGCAGGATC 
ACCCTTCGGC TCCCCCTGAG CGTGGCGATC ATCCAGGTGC TCCTGGTGGG CTGCGGCCCG 
CTGACCATGG CGGTTCCCGT CAACGCCGTC CGCCGGACCG TCGAGCTGGA CCGGCGGCTC 
CAGCGCATCG AAGATGGGCG GGCTGTTTTT GATCTGGGCG GGGAAACCCT CCCGCTGGTT 
GACCTGGGCC TGCTCGTGGG GACCGGCCCG ACTGCCGGCG GGGATTTCTC GCCCGTTCTG 
ACGGCCGACG TTGCAGGACG CACAATGGGG TTTGCCGTGG ACCGTTTTTT CGGACAGGCA 
GAGGTATTCA CCAAGCCGCT CGGCACGCCG CTCAACCGTG CCAGGGGGCT TGCGGGAGGA 
GCTATACTGG GAGACGGTCG GGTCATCTTC ATCCTCGACC TCCCCAATCT TGTCGACGGG 
GCCACCAGCC GGCGCCGCGT TTTCATGCAC CCTGACGGTG CGCACAAAGG GGGAACGACC 
GCATGA

Protein sequence

MDMSQYRDLF VAEAREHLER LGEEVLALEK DPANGERLDS LFRTAHSIKG MAGSMGYDGI 
ADLSHRMEDL MDRVRKGRIP FGRDIADLLL ACADQLGRMV EDVTGGGNGS LDATDLCARL 
ALVAGQEAAA PAAPADAETS PSPQPSDQPE PARRDESDGA RTVRIRSELL DRFVNITGEL 
VTGKNRIMEL AAGLESEPLR DAAAELSKLV RDLQREVMSA RMMPFGTICD RFPRMVRDLA 
RRSGKEATLA IDGKDQELDR GILEILPDPL LHALRNAVDH GIESPEERSA AGKGAGGRIV 
LSVRREKDHL DVTVTDDGRG MDPAALVNAA LAKGIITPEE AATLSRQEAL MLVCRPGFST 
ARSVTEVSGR GVGMDAVQAA VSRAGGSLSI QSERGRGSRI TLRLPLSVAI IQVLLVGCGP 
LTMAVPVNAV RRTVELDRRL QRIEDGRAVF DLGGETLPLV DLGLLVGTGP TAGGDFSPVL 
TADVAGRTMG FAVDRFFGQA EVFTKPLGTP LNRARGLAGG AILGDGRVIF ILDLPNLVDG 
ATSRRRVFMH PDGAHKGGTT A