Gene GSU1033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1033
Symbol
ID	2685619
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1113816
End bp	1115417
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	64%
IMG OID	637125703
Product	methyl-accepting chemotaxis protein
Protein accession	NP_952087
Protein GI	39996136
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCA GGACCAAATT CGTAGTCGTC AATCTGTTGA TCGTCTGCTG CGCCCTTGCC 
GCCGTGGCGG CCGCCTGCCT CGTGGAGTTC AACCGCGAGT TGCGCCGCCA GGCCGTGACC 
TCCCAGGAGA TCAGACTCAA GACCTTCTGG GAGCTGTTAC GCCAGAAGGG GGACGGCTTC 
ACCGTCGCCG ACGGTAAACT GATGGCAGGC AGCTATGTCA TCAACGATAA TTATGAGCTT 
CCCGACAAGC TGAAGGAGCT GACCGGGGGG ACCGCCACCA TTTTCATGGG GGATACGCGG 
GTCTCCACCA ACGTGCTCAA GCCGGACGGA AGCCGCGCCG TCGGAACCAA GCTGCAGGGC 
GCCGCCTACG ACGCCGTAAT AAAGGAAGGC AAACCCTACC GGGGGGAGGC GGATATCCTC 
GGCGTTCCCT ACTTCACCGC CTACGACCCG ATCCGCGATT CCCGGGGCGA AGTAATCGGC 
GTACTCTACG TGGGGGTCAA GAAAGGCGAT TTCTATGCGT CCTACGAGAG TCTCAAACTG 
ACAGTGGTCG GAATCGTGCT GGTCATCGTG CTGCTGGCCG CCGTTGCCAG TAAGGTAATC 
ATCCACCGGC TCTTCACCCC CCTCAATCGT ATGCACGACG TGCTGCGGGA CGTGGCCCAG 
GGTGAGGGTG ACCTGACTCA GCGGCTCGAT TACCTCGCAC AGGACGAGGT CGGCGACATG 
AGCCGGTCGT TCAATTCATT CATGGACAAG CTCCACGGTA TCATCACCCA TGTTGCCCGG 
ACCGTGGAGC AACTCGCCTC GTCCGCGTCC CAGGTACACG GCTCTGCCGA GCAGATGGCC 
GCCGGCGCGG GAGAGGTGGC CTCCCAGGCG GGGACGGTGG CCACGGCTGG CGAGGAGATG 
GCCGCCACGT CCACCGAGAT CGCCCAGAAC TGCGCCATGG CCGCCGAAGG GGCGCGCCGG 
GCCAGCAGCA CGGCCACTGC CGGGGCTGAG GTGGTTGGGA ACACGGTAAC GGTGATGGAC 
CGGATCGCCG AAAAAGTTAA GAACTCCGCC CGCACGGTGG AACGGCTGGG GGAGCGCAGC 
GACCAGATCG GAGAAATAGT CGGCACGATC GAGGATATTG CCGATCAGAC CAATCTGCTG 
GCGCTCAACG CTGCCATCGA GGCGGCCCGC GCCGGAGAGG CGGGGCGCGG CTTCGCCGTG 
GTGGCCGACG AAGTGCGGGC CCTTGCCGAA CGGACCACTA AAGCGACCCG TGAAATCTCC 
GGCATGATCA GGGCCATCCA GGCGGAAACC CTGGAGGCGG TTTCCTCCAT GGACGAAGGA 
GTCAGGGACG TGGAGACCGG CACCGCCGAA GCTGCCCGTT CGGGGGAGGC TCTGCGGGAA 
ATTCTCGACC AGATTACGGC GGTGTCGATG CAGGTGAACC AGATCGCCGT GGCCGCCGAG 
CAGCAGACGT CCACCACCCG AGAGATCAGC GGCAACATCC AGCAGATCAC CGAGGTTGTG 
GAGGGGACCG CCCAGGGCGC GGACGAGTCG GCATGCGCGG CCGGCGGGCT GAATCGGCTG 
GCGGAGGACC TCCAGCGCAT GGTGGGGCAG TTCCGGCTGT AG

Protein sequence

MKIRTKFVVV NLLIVCCALA AVAAACLVEF NRELRRQAVT SQEIRLKTFW ELLRQKGDGF 
TVADGKLMAG SYVINDNYEL PDKLKELTGG TATIFMGDTR VSTNVLKPDG SRAVGTKLQG 
AAYDAVIKEG KPYRGEADIL GVPYFTAYDP IRDSRGEVIG VLYVGVKKGD FYASYESLKL 
TVVGIVLVIV LLAAVASKVI IHRLFTPLNR MHDVLRDVAQ GEGDLTQRLD YLAQDEVGDM 
SRSFNSFMDK LHGIITHVAR TVEQLASSAS QVHGSAEQMA AGAGEVASQA GTVATAGEEM 
AATSTEIAQN CAMAAEGARR ASSTATAGAE VVGNTVTVMD RIAEKVKNSA RTVERLGERS 
DQIGEIVGTI EDIADQTNLL ALNAAIEAAR AGEAGRGFAV VADEVRALAE RTTKATREIS 
GMIRAIQAET LEAVSSMDEG VRDVETGTAE AARSGEALRE ILDQITAVSM QVNQIAVAAE 
QQTSTTREIS GNIQQITEVV EGTAQGADES ACAAGGLNRL AEDLQRMVGQ FRL