Gene GSU2942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2942
Symbol
ID	2688428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	3238978
End bp	3240612
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	62%
IMG OID	637127635
Product	methyl-accepting chemotaxis protein
Protein accession	NP_953984
Protein GI	39998033
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGTTA TCAGGAACTT GCATCTGAGC ACAAAACTGG TGGCGGGTTT CGTACTCGTG 
GCCGTTATAG CAGGATTGGT CGGCCTCATC GGCACCCTGA AGATCCGCGT CATGGAAACG 
GCCGGCACTG AAATGTACGA TCTGGTTACC GAACCCCTCG GCACCATGGG CGGAGTGGCC 
ATCGCCTTCC AGAAGGCACG GGTCAACATT CGCGGCATGA TCCTTGACGA CAATCCCGCC 
CGAGCCCAGG CCAACGCAAA CTCCATCGCC AAGTTCTACA AGGAGATCGA CGAAGGGCTG 
GCGGATTTCG GCAAGAGCAT CCTCAGCAAA GATATCCGGC AGGAATTCGA CGCCCTCAGA 
AACACCATCG CTGAGTATGC ACCGGTGCGG GAAGAAATCG TCACCGCGAC CCTTGACGGA 
GACCGGGAAA CAGCGCTGGC TCTCATGCGG AGCCAGGGGC TGGCCTTCGA AAAGAAGATC 
GATGAATCGA TCAAGAAGCT CTTCGACATG AAGATCGCCG GGGCGAAAAA GCGAAAAGAC 
ATGAATGCGG CAGCGGCACA AAGCGCACTG ACCCAGATGA TGCTTCTTGC CCTCATCGGC 
ATGGTTGTCG CCGTGGTCCT CGGCCTCTTT GTCTCTCGCC AGATCACGGT ACCGCTCAGG 
AAGGTCGTAG ACTTTGCCCA GGCCATCGCC CAGGGCGACC TGGCTCACCG CCTGGATATG 
GAACAGAATG ACGAGACCGG GCAACTGGCC GAGGCCGTCA ACACCATGGC GGATCGGCTC 
AACCGGCTCA TTGCCGGCGT GGCCGAAAAT GCATCCCAGG TGGCGGCGGC GGCGAGCCAG 
CTCACCTCCA ATGCAGAGCA AATGGCGACC GGCGCGGAGG AGGTGGCGGC ACAAACCGGT 
ACCGTGGCCA CGGCCAGCGA GGAAATGGCG TCCACCTCGG CGGAGATCGC CCAGAACTGC 
ACCGCCGCTG CTGAAGAGTC CCGACGGGCA AGCGATACGG CGGTCCAGGG TTCGGAGGTC 
ATTCGCCATA CGGTCGGCGA GATGGAGCGA ATCGCCGAGC GGGTCCGCGA GACGGCCAGA 
ACCGTGGAAA GTCTCGGGGC CCGGAGTGAT CAGATCGGTG AAATCATCGG CACCATTGAG 
GATATCGCCG ACCAGACGAA CCTTCTGGCC CTGAACGCGG CCATCGAGGC GGCCCGGGCC 
GGTGAACAGG GGCGCGGCTT CGCCGTGGTC GCCGACGAGG TCCGGGCACT GGCGGAGCGG 
ACATCCCGCG CTACCAGGGA AATCAGTACC ATGATCAAGG CGATCCAGCA GGAGACCAAG 
GGGGCCGTCG CCTCCATGGA GCAGGGGGTG CGGGAAGTGG AACGCGGCAC GGCCGAGGCA 
TCCCAGTCGG GCAAGGCCTT GGAAGAGATC CTGGAGCAGG TGGGCTGTGT GACCATGCAG 
ATCAACCAGA TAGCAACGGC AGCCGAGCAG CAGACCTCGA CCACGTCGGA GATCAGCGGC 
AACATCCAGC AGATTACCGA TGTGGTTCAG CAGACGGCCC GGGGTGCCCA GGAAACCGCG 
GCGGCCGCGC GGCAACTCTC GCAGCTGTCG GCAGAGCTGC AGCACCTGAT CGGCCAGTTC 
CATCTCGCAG CCTGA

Protein sequence

MRVIRNLHLS TKLVAGFVLV AVIAGLVGLI GTLKIRVMET AGTEMYDLVT EPLGTMGGVA 
IAFQKARVNI RGMILDDNPA RAQANANSIA KFYKEIDEGL ADFGKSILSK DIRQEFDALR 
NTIAEYAPVR EEIVTATLDG DRETALALMR SQGLAFEKKI DESIKKLFDM KIAGAKKRKD 
MNAAAAQSAL TQMMLLALIG MVVAVVLGLF VSRQITVPLR KVVDFAQAIA QGDLAHRLDM 
EQNDETGQLA EAVNTMADRL NRLIAGVAEN ASQVAAAASQ LTSNAEQMAT GAEEVAAQTG 
TVATASEEMA STSAEIAQNC TAAAEESRRA SDTAVQGSEV IRHTVGEMER IAERVRETAR 
TVESLGARSD QIGEIIGTIE DIADQTNLLA LNAAIEAARA GEQGRGFAVV ADEVRALAER 
TSRATREIST MIKAIQQETK GAVASMEQGV REVERGTAEA SQSGKALEEI LEQVGCVTMQ 
INQIATAAEQ QTSTTSEISG NIQQITDVVQ QTARGAQETA AAARQLSQLS AELQHLIGQF 
HLAA