Gene GSU2975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2975
Symbol
ID	2687072
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	3267264
End bp	3268916
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	65%
IMG OID	637127668
Product	putative manganese-dependent inorganic pyrophosphatase
Protein accession	NP_954017
Protein GI	39998066
COG category	[C] Energy production and conversion
COG ID	[COG1227] Inorganic pyrophosphatase/exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAGC AGATTTACGT CATCGGGCAC CGCAATCCCG ACACCGATTC CATTGCGTCG 
GCCATTGCCT ACGCCCAATT CAAGAAGAAG CAGGGGGTGG CGAACGTGAC CGCCGCCATG 
GCCGGCCAGC CGAACCCCCA AACCCGCTAC ATCCTGGAGC GGCTCGGGAT CGAGCCGCCG 
GTCTACCTGG CCGATGTAAA TCCCAAGGTG CGCGACGTGC TGAACCGCCG CCCGGTCACC 
GCCCGGCCGG AGGTCGCCCT CAGGGACGCT CTGGGGCTCT TTCACCGCCA CGGGATTCGT 
GTTCTGCCGG TGGTCGACGC CGAGGGAACC CCGGTGGGGG TGGTTTCGCT TCTGAGGCTG 
TCGGAAAAGC ACTTGGTGGC CGGCACCGAC CGCAGGCGGG GTGTCGACAC CTCACTGCGC 
TCCCTTGCCG CCTGCCTCGA CGGAACCTTC CTTTCCGGCG GGCCTGCCGA CGAGGTGGAG 
CACCTGCACC TGTTCATCGG CGCCATGCTG GAAGAATCCT TTTCCAGCCG GATCGAGGGG 
TATGACCCGG CAACGCTCCT GATCATGACC GGCGACCGGC GGAGTATCCA CCAGGCCGCC 
ATCGAGCGGG GTGTGCGCCT GCTGGTGGTG ACCGGCGGGC TCCCCATTGC CGACGAGCTG 
GTGGCCCGCG CCCGGGAGAA GGGCGTAGTC GTCCTTTCAA CCCCCCATGA TACCGCCACC 
GCCGCCTGGC TGGCACGGCT CGCCTCTCCT CTCTCCCTGT TCATGGAGCC CGGCTTCGAA 
CGGATCGGCG TGGCCGAGCC ACTGGAGCAC CTGCGGCTCA AGCTCCTCCA TAGTCAGGAG 
CCGGCGGTCA TTGCGGTGGA GGAAGACGGC ACCATCGCCG GGGTGGCCAC CAAGTCGTCC 
CTGCTGGCGC CGGTCCCCTA CGCATTGATC CTCATGGATC ACAATGAGCT GAGTCAGGCG 
GTGCCCGGCG CAGAAACAGT GGATATCCTC GAGGTCATCG ACCATCACAA GCTCGGCAAT 
CCGCCCACCA ATCAACCCAT CACCTTCATG GCGGCGCCGG TGGGGAGCAC CTGCACCGTG 
GTTGCCTCCC TCTACCGCGA GGCCGGGATC GAGCCGGGCG AGCGGACCGC GGCCCTGCTG 
CTTGCCGGCA TCCTCACGGA TACGGTGATC CTCAAATCTC CCACCAGCAC CGTCCGGGAC 
CGTGAGATGA TCGCCTGGCT AGAGGAACGG TCCGGGCTGG AACATCTTGC CTTTGGCAAG 
GAGATCTTCT CCGCCTGCGG CGGATTTGCC TCCCATGGTA CGCCGGAGCA GGCCCTGCGC 
TCCGATTTCA AGCAGTTCAC CGCTGGCGGC ATGCAGTTCG GCGTGGGGCA GGTGGAGGTG 
GTGGGCTTCG ACGAGTTTTT CGAGCTGAAG GATGCCCTGC GCGACTGTCT CCGGCGGGTG 
AAGGAGGTCG ACCGCCTCGA CCTGGCCGGC CTCATGGTGA CCGACATCTA TACCGAAACC 
ACGCTGTTCC TGGCCGAGGG GAAGAACGAG ATCGCCCACG TGATGGGGTA TCCCCAAGTG 
GAGCCTCACC TCTATGAGCT CAAGGGGGTC ATGTCCCGCA AGAAGCAGAT GGTTCCCCAC 
TTGCTCGGGG TGCTCGGGAA GGTGCAGGCA TGA

Protein sequence

MKKQIYVIGH RNPDTDSIAS AIAYAQFKKK QGVANVTAAM AGQPNPQTRY ILERLGIEPP 
VYLADVNPKV RDVLNRRPVT ARPEVALRDA LGLFHRHGIR VLPVVDAEGT PVGVVSLLRL 
SEKHLVAGTD RRRGVDTSLR SLAACLDGTF LSGGPADEVE HLHLFIGAML EESFSSRIEG 
YDPATLLIMT GDRRSIHQAA IERGVRLLVV TGGLPIADEL VARAREKGVV VLSTPHDTAT 
AAWLARLASP LSLFMEPGFE RIGVAEPLEH LRLKLLHSQE PAVIAVEEDG TIAGVATKSS 
LLAPVPYALI LMDHNELSQA VPGAETVDIL EVIDHHKLGN PPTNQPITFM AAPVGSTCTV 
VASLYREAGI EPGERTAALL LAGILTDTVI LKSPTSTVRD REMIAWLEER SGLEHLAFGK 
EIFSACGGFA SHGTPEQALR SDFKQFTAGG MQFGVGQVEV VGFDEFFELK DALRDCLRRV 
KEVDRLDLAG LMVTDIYTET TLFLAEGKNE IAHVMGYPQV EPHLYELKGV MSRKKQMVPH 
LLGVLGKVQA