Gene GSU0683 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0683
Symbol
ID	2685391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	718970
End bp	720676
Gene Length	1707 bp
Protein Length	568 aa
Translation table	11
GC content	60%
IMG OID	637125355
Product	methyl-accepting chemotaxis protein, putative
Protein accession	NP_951740
Protein GI	39995789
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.268569
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTGGT TCGAGGAACT CAAGGTTTCA AGCAAGCTGG CCGTGTCATT CATGGTGGTC 
ATAGTTCTGA CGACTTTCCT TGGAATCTTT TCCATATTCG AGCTGTCGCG AGTCAATGAG 
ACGGGAACCG ACATGGCGGA GAACTGGATC CCCAGCCTCA ACGCGATATC GGCCATGCAA 
CTGGATTTCG CCAGCTACCG CCGTCTTGAG CTGCAGCATA TTCTGGAGGT GGAGAGCGCC 
GGGCAGAAAA CGTACGAAGA GAGAATGGCG GGGCTCGTCA AGAGTATTGC CGAGCACCAG 
AAAGAATACG AACCATTGCT GTCAACGCCG GAAGAGAAGC AAATGCTTCA GGAGTTCAGC 
ACAAAATGGC AGGAATACCT GAACGAAGGC AAGCCGGTCC TTGAGCTGTC CCGGCAGAAT 
AAGGCCCAGG AAGCAGCCGC CCTCCTGAAT GCAAACTCGC GCAAACTGTA CAACGAAGCC 
GGAGCCCTGA TCGACAAGCT CAAGACGCTG AACACGCAGG AGGCCAAAGA TGCCAGCGCA 
CGTGGCGATA AACTCTATTC CTCGGCACGT ATCTGGATCA TCGGTTCGCT GATCGCCTGT 
ATTGTCCTTG CAGTAGTCAT GGGGCTGGTA ATTACGCGGG TGCTTCTCAG GCAGCTTGGC 
GGGGAGCCGA CGGCAATTGC CGATATTGCC AACAAGCTTG CGGATGGCGA TTTGCGCATC 
GCCTTTGACA CCACCGGCAA GGCGGAAACG GGCGTGTATG CGGCGATGCA CAACATGGTT 
GAGAAGCTGA AGGGAGTGGT TGCGGACGTG AAGAGCGCGG CGGACAACGT TGCCGCCGGC 
AGCCAGGAGC TCTCCTCCAG CTCCGAGGAG ATGAGCCAGG GTGCCACCGA GCAGGCGGCC 
GCGGCCGAAG AGGCCTCCAG TTCCATGGAG CAGATGAGCT CCAACATCCG GCAGAACGCG 
GACAACGCCA CCCAGACCGA GAAGATCGCC CTGAAGAGCG CCTCCGACGC CAAGCAGGGG 
GGCACGGCCG TGGCTGAAAC CGTCGTGGCC ATGAAGGAAA TCGCCTCCAA GATCTCGATC 
ATCGAGGAGA TCGCCCGTCA GACGAACCTG TTAGCGCTGA ACGCGGCCAT TGAAGCGGCG 
CGAGCCGGCG AGCACGGCAA AGGGTTCGCG GTGGTGGCGG CCGAGGTCAG AAAGCTTGCC 
GAGCGGAGCC AGAAGGCGGC GGGCGAGATC AGCGAGCTGT CTGCCTCCAG CGTGCAGGTG 
GCGGAAGACG CCGGCGAGAT GCTGACGCGG ATCGTGCCGG ATATCCAGCG TACCGCGGAG 
CTGGTGCAGG AGATCAGTGC CGCGTGCAAG GAGCAGGACA CGGGCGCGGA GCAGATCAAC 
AAGGCGATCC AGCAGCTTGA CCAGGTGATC CAGCAGAATG CCAGCGCCAG CGAAGAGATG 
GCGTCCACCA GCGAAGAACT GGCCAGCCAG GCCGAACAAC TGCAGGCAAC CATTTCATTC 
TTCCGGACCG ATGATCGTGG CGCGTCGAGC CGGAGTGCGG CCCGTCGGCC CGTTGCCAAG 
AAAAAGGCAG CGATCTCTCA TTTGGGTCAC GGTATGTCCA ACGGCTACCA CACCGAGCCC 
GCGACGTCGC GAAAAGTAGC GGTAGGCGGC GGGGTGGATC TGAACCTGGA CACCGATCAC 
CTGGATGACC AGTTCGAGAA ATTCTAG

Protein sequence

MKWFEELKVS SKLAVSFMVV IVLTTFLGIF SIFELSRVNE TGTDMAENWI PSLNAISAMQ 
LDFASYRRLE LQHILEVESA GQKTYEERMA GLVKSIAEHQ KEYEPLLSTP EEKQMLQEFS 
TKWQEYLNEG KPVLELSRQN KAQEAAALLN ANSRKLYNEA GALIDKLKTL NTQEAKDASA 
RGDKLYSSAR IWIIGSLIAC IVLAVVMGLV ITRVLLRQLG GEPTAIADIA NKLADGDLRI 
AFDTTGKAET GVYAAMHNMV EKLKGVVADV KSAADNVAAG SQELSSSSEE MSQGATEQAA 
AAEEASSSME QMSSNIRQNA DNATQTEKIA LKSASDAKQG GTAVAETVVA MKEIASKISI 
IEEIARQTNL LALNAAIEAA RAGEHGKGFA VVAAEVRKLA ERSQKAAGEI SELSASSVQV 
AEDAGEMLTR IVPDIQRTAE LVQEISAACK EQDTGAEQIN KAIQQLDQVI QQNASASEEM 
ASTSEELASQ AEQLQATISF FRTDDRGASS RSAARRPVAK KKAAISHLGH GMSNGYHTEP 
ATSRKVAVGG GVDLNLDTDH LDDQFEKF