Gene GSU1029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1029
Symbol
ID	2685753
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1107913
End bp	1109562
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	62%
IMG OID	637125699
Product	methyl-accepting chemotaxis protein
Protein accession	NP_952083
Protein GI	39996132
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.392996
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCAT GGCGGGACTT GAAGGTGAGA ACAAAAATTT TCGTCCTGGT GATTGCCGGA 
TGTCTGGGGC TCGTGGTACT GGGATCGGTG GCGCTTTACA ATATGCGCAA CCTGAGCGGC 
AGCGTGAAGG AAGCCAACAT CGGCATGGAG CACGTGGCGG GGCTTTCCGG TATGAAGAGC 
GACTTTCTCG AGATGAGGCT GGCGCTCGTC TACATGCTTG CCCTGAAAGA TGCGGAAAAG 
ATCGGCGGCA AGGAACAGGA TTTCCTGAAG GCCGCTGACA GGATCAAAAA GACACTCGAC 
GACCTGGGCA AGCAGGAACT GACTGACACC GAGAAAAAGT CCCTCGTCGA GTTCAGGGGT 
GGCTTCGAGT CTTATGTCGA GAAGGGAACG AGACTCGCCG AGCTAATCAA GGACGCTACC 
GCCAAGGGAG ACGAGGTGGG CCGGGCCGAT GCCATGACCT TCGCCACCCA GAGCGTGGCC 
CCCCTCTACG ATACCCCGGC CAAGATCATT GCCTCGATGG TGCAGGAAAA TATCGGCGAA 
GCTCATAAGA TGTATGAGCA GGACATGGCC TCGTACCGAG CTTCCTTCAT TATGATGGTG 
GTGATCATTC TGGGGGTGAT CGGCGTCGCC GCTGCGGCGG GCCTGGCCAT CGCCGGTTCC 
ATCAGCGGTC CTCTCAACAA GGTGCTCGAT GTACTCACCC GCGTGGCCGC CGGTGACCTG 
ACAGCCCGGG CCGACGTCGT CAGTGCCGAC GAAATGGGGC TGCTGGCGCG TGAGGTGAAC 
ACTACCGCGG CCAAGATCAA CGAGATCATC GGCCTTGTTG CCCACAATGC CTCCCAGGTG 
ACTGCCGCGG CGACCCAGCT CCATGCCACC TCCACCCAGA TGTCCACCGG CGCTGAGGAG 
GTGGCCCAAC AGGCCGCCAC CGTGGCCACG GCCAGTGAGG AGATGGCTGC CACCTCGGCC 
GAGATCGCCC ATAACTGCTC CCTGGCGGCT GAAAGCTCCC GACACGCCAA CGATCGGGCC 
GAGAACGGTT CGGATGTGGT GCAGGAAACC CTGACCGTCA TGAACCGCAT CGCCGAGCGG 
GTGAAGGATT CGGCACGCAC CGTCGAATCT CTGGGCGAGC GGAGCGACCA GATCGGCGAG 
ATCATCGGCA CTATCCAGGA CATCGCCGAC CAGACCAATC TCCTTGCTCT CAACGCGGCC 
ATCGAAGCCG CCCGCGCTGG CGAACAGGGA CGCGGCTTCG CCGTGGTCGC CGACGAGGTT 
CGGGCCCTGG CCGAGCGGAC AACCAAGGCC ACCAAGGAGA TATCCCAGAT GATCAAGGCG 
ATCCAGGGGG AAACCAAGGG CGCCGTCACT TCCATGGAGG AGGGGGTCAA AGAGGTGGAA 
AAGGGAACCT CGGACGCATC CAAATCGGGC GAGGCCCTGC AGGCGATCCT GGAGCAGATC 
GGCGGCGTTA CCATGCAGGT GAGCCAGATT GCCACTGCCG CCGAGGAACA GACCGCGACC 
ACGGGTGAGA TCAACAACAA CATCCAGCAG ATCACGGAGG TGGTCCAGCT CACCGCGCGG 
GGCGCCGAAG AGTCGGCCCA GGCCGCCGAG CAGCTGGCGA AACTGGCCGA GGAACTGCAG 
GACCTGGTGT ACAAGTTCAA ACTCGCCTGA

Protein sequence

MSAWRDLKVR TKIFVLVIAG CLGLVVLGSV ALYNMRNLSG SVKEANIGME HVAGLSGMKS 
DFLEMRLALV YMLALKDAEK IGGKEQDFLK AADRIKKTLD DLGKQELTDT EKKSLVEFRG 
GFESYVEKGT RLAELIKDAT AKGDEVGRAD AMTFATQSVA PLYDTPAKII ASMVQENIGE 
AHKMYEQDMA SYRASFIMMV VIILGVIGVA AAAGLAIAGS ISGPLNKVLD VLTRVAAGDL 
TARADVVSAD EMGLLAREVN TTAAKINEII GLVAHNASQV TAAATQLHAT STQMSTGAEE 
VAQQAATVAT ASEEMAATSA EIAHNCSLAA ESSRHANDRA ENGSDVVQET LTVMNRIAER 
VKDSARTVES LGERSDQIGE IIGTIQDIAD QTNLLALNAA IEAARAGEQG RGFAVVADEV 
RALAERTTKA TKEISQMIKA IQGETKGAVT SMEEGVKEVE KGTSDASKSG EALQAILEQI 
GGVTMQVSQI ATAAEEQTAT TGEINNNIQQ ITEVVQLTAR GAEESAQAAE QLAKLAEELQ 
DLVYKFKLA