Gene GSU3156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU3156
Symbol
ID	2688397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	3463071
End bp	3464168
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	59%
IMG OID	637127849
Product	methyl-accepting chemotaxis protein, putative
Protein accession	NP_954197
Protein GI	39998246
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAGC AGTTGGAGGA AAAAGACGCC GAGCTTGATG TGCTCAAGCA AATGCTTGAA 
AATGTGAAAA ACATTGTGAT GCTCTGCGAT GCAACCCCTG AAAATACTAT CTTCTACATG 
AACAAGGCGG CGAGGGAGCT GCTGGCAAAA TACCGTGGCG ACCTGAACGC CGGCCTGCGC 
GGGGCCGACG TGGCAGCAGC CATGGACCAT TCCATTCACC AGTTCCACAA GGATCCGAAC 
CGCGTACGCA TGATCCTGGG CAAACCGGGC GAAATGCCCC ATTCGGCCGA AATCCCCATC 
GGGGGAATAA CGCTCCGCAC CACATCCTTC CCCATCTGGG ACAAGAAGAA TCCCGGCAGG 
GTCAAATGCT ACATGGCATG CTGGGATGAC ATCACCGCCG AAAAGGAAGT GGTGGAGCGC 
AACCATCAGG AGCTGCAGCG CAAGGAATAT CTGGAGGAGC GGGTGGCCCA GATCGCCACG 
GCCATGGAAG AGATGAGCAT GACCGTGACC GAGGTGGCCC GCAACACCTC GAACGCTTCC 
GATTCGGCGG TCCAGGTTGC CCAGAACGCC CACGAGGGTC AGGAAATCGT CAACCGGTCG 
GTCCAGGAGA TGCAGAAGGT TGCCCAGATC GTCCGCGATT CGGCTGCCAT CGTCGACTCG 
CTGGGGGGCA AATCGGAGAA GATTGGCGAG ATCATCAACG TCATCAATGA AATCGCTGAC 
CAGACAAACC TCCTGGCTCT CAACGCCGCC ATCGAGGCGG CCCGCGCCGG CGAACAGGGG 
CGCGGCTTCG CCGTGGTGGC CGATGAGGTC CGCAACCTGG CGGTCAAGAC CATGAACTCC 
ACCAAGCAGA TCAACGCCAT GGTGGCCGAA ATCCAGCGGG AAACCCGCCA GGCCGTGGGT 
TCCATCGAGA ACGCCAAGCA GGAGGCCGAA GTGAGCGAAA GCCTCTCGCT CCAGGCGGAA 
TCGTCGCTGG TGACCATCGT TCAGGCCATC GAGGAGATCA AGAACGTCAT CACCCAGATC 
GCCACCGCCT CAGAGGAGCA GGCAGCCACC GCCTCGGTGA TTGCCGGCAA TCTGGAGGAA 
ATCTCGCGCA ACGGCTGA

Protein sequence

MKKQLEEKDA ELDVLKQMLE NVKNIVMLCD ATPENTIFYM NKAARELLAK YRGDLNAGLR 
GADVAAAMDH SIHQFHKDPN RVRMILGKPG EMPHSAEIPI GGITLRTTSF PIWDKKNPGR 
VKCYMACWDD ITAEKEVVER NHQELQRKEY LEERVAQIAT AMEEMSMTVT EVARNTSNAS 
DSAVQVAQNA HEGQEIVNRS VQEMQKVAQI VRDSAAIVDS LGGKSEKIGE IINVINEIAD 
QTNLLALNAA IEAARAGEQG RGFAVVADEV RNLAVKTMNS TKQINAMVAE IQRETRQAVG 
SIENAKQEAE VSESLSLQAE SSLVTIVQAI EEIKNVITQI ATASEEQAAT ASVIAGNLEE 
ISRNG