Gene GSU1035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1035
Symbol
ID	2685770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1117662
End bp	1119311
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	65%
IMG OID	637125704
Product	methyl-accepting chemotaxis protein
Protein accession	NP_952088
Protein GI	39996137
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.640997
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATGC CTGCACGGCT GGCAGCACTG AAGTTGTCCC ACAAACTGAT CCTGGCCCTG 
GCGGTACTGA ATCTGTTCGT CATCGCCGCG GTGGCCGCCT CCAGCTACCA GGGACAGAAA 
ACGGCGGTAC AGCATGCCGT GGACGAAAAG CTGCTCGCCT GCGCCCAGGG GGTCCGGCTT 
CTGGGGGATG CCTTCCATGA CCGGCTCGGG CAGTCAGCTG ACATCAACCA GGAAGAGTAC 
GTGGCCATGC TCGACAATCT TTCGGCGTTT GCCGAAGGGG CGGGCGTCAA GTACGTCTAC 
ACCGTGGTGG TGAAGGACGG CAAGGTTGTC TTTACCACCT CAAGCCATAC CAGGGAGGAA 
AAGGAAAAGG GAGATATCGC CGCCCTGTAC GACCCCTACG ACGACGCGAG CAGTGCTCTC 
AAGGATGCCA TTGCCGACGG CAAGCCCCGC TACGATACCT ATTCCGACCA GTGGGGTACG 
TTCCGGTCCC TGTTCCTTCC GGTTCGCTCC AGCGGCGGCG CGACGTACGT CATCGGCGTC 
GACGTCTCAA CCGCGGACGT GAACGCCGTC CTCCGTTCAA GCCTGATCAC CACCGTTGTC 
ATGGGCGCTG TCCTGTTCGT GGCCGGCACG CTGCTCATGC TCCTGGTGAT CAGACCCGTT 
TCCGCCGCAG TCCGGATGCT TGCCGAAAAG GTCAACCATG TTGCCGATGG TGATCTGAAC 
GTTACCGTCG ATTATGCGAG CGGTGACGAG CTCGGCATGC TGGCGGGCGA CATGAACCGT 
ATGGTTGAAA AACTCCGGGA CATGGTTGCG GGCGTTGCGG GGGCGGCGGC CGAAGTGACC 
ACGGCCGCCC GTCAGCTGTC GTCCACCTCA GAGGAGATGG CGGCGGGCGT CCAGTCTGCC 
GCCGCGGAGG TCGTCGGCGT TTCCACGGCA GGCGAAGAGA TGGCGGCCAC GTCCTTCGAG 
ATTTCCTTCA ATTGTTCCAC CGTGGCCGCG GATGCCCGTC AGGCCACTGA GTCGGCCACG 
GCGGGCGAGG AGGTCGTGTC GGCCACGGTC TGCATCATGG CGAACATTGC CGCGCTGGTG 
CGGGATTCGG CCCGGACGGT CGAAAGCCTG GGCGCGCGGA GCGATCAGAT CGGGGAGTTG 
GCCGGTTCCA TCGAGGATAT CGCCGATCAG ACCAATCTCC TGGCCCTGAA CGCCGCCATC 
GAGGCGGCCC GGGCAGGGGA GCAGGGGCGC GGGTTCGCCG TGGTTGCCGA CGAGGTAAGG 
GCGCTTGCCG AACGGACGGC CCGGGCCACC CGCGAGATCA CGGCCGTGAT CCGCTCCATC 
CAGCAGGAAA CCCAGGGGGC TGTTACCGCC ATGACCGCGG GTGTTGTCGA GGTTGAGCGG 
GGGACGGCCG AGGCGTCCCG GTCGGGCGAG GCCCTGAGGG GCATCCTTGA ACGAATCCAT 
GCCGTGGAGG AGCAGGTTGT CCAGATTGCC GCGGCCGCTG ACCAGCAGAC CGCCACCACC 
ACCGAGATCA GCGGCAATAT CCTGCGGATC TCCGACGTAG TCCAGAGCAC TACCCGCGGC 
GCCCAGGATT CGGCCGATGC CGCCGCGCAC CTGCAGGGTC TTGCCGAAGA GCTTCATGCC 
GCCGTGGGCC GGTTCAGGGT CGCCGGGTAG

Protein sequence

MRMPARLAAL KLSHKLILAL AVLNLFVIAA VAASSYQGQK TAVQHAVDEK LLACAQGVRL 
LGDAFHDRLG QSADINQEEY VAMLDNLSAF AEGAGVKYVY TVVVKDGKVV FTTSSHTREE 
KEKGDIAALY DPYDDASSAL KDAIADGKPR YDTYSDQWGT FRSLFLPVRS SGGATYVIGV 
DVSTADVNAV LRSSLITTVV MGAVLFVAGT LLMLLVIRPV SAAVRMLAEK VNHVADGDLN 
VTVDYASGDE LGMLAGDMNR MVEKLRDMVA GVAGAAAEVT TAARQLSSTS EEMAAGVQSA 
AAEVVGVSTA GEEMAATSFE ISFNCSTVAA DARQATESAT AGEEVVSATV CIMANIAALV 
RDSARTVESL GARSDQIGEL AGSIEDIADQ TNLLALNAAI EAARAGEQGR GFAVVADEVR 
ALAERTARAT REITAVIRSI QQETQGAVTA MTAGVVEVER GTAEASRSGE ALRGILERIH 
AVEEQVVQIA AAADQQTATT TEISGNILRI SDVVQSTTRG AQDSADAAAH LQGLAEELHA 
AVGRFRVAG