Gene GSU2002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2002
Symbol
ID	2688105
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	2194489
End bp	2195592
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	61%
IMG OID	637126693
Product	hypothetical protein
Protein accession	NP_953051
Protein GI	39997100
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0492] Thioredoxin reductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.158281
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACAGC AGATGTATGA CGTCCTCATC GTGGGGGGCG GTCCGGCAGG GATCGCCTGT 
GCCTACCTGT GTCACAGAAA CGATCTCTCC TATCTCCTCA TCGAACAGGG GAAGAGTGTT 
TTTCAGGGAA TCACCAACAC CTACCCCGAA GGGAAGAACG TCTACCCGTC GCGGCCCAAG 
GAGAGCCCCG AGCCGTTCCT GGTTGAAGAG CTCCGCCCCC CCGACAAGCC GGTGGCCGTG 
GAAAAGTACA TCCAGTATGT GCAGCACTTC GTCCAGCACG AGAACCTGAA TATCCGGACC 
GAGGTCCAGT TCGAGGACCT AAAGGACGCC CGCGATCACC TCATCGTCCA GACCTCTGTG 
GGGAATTTCG CCGCCCGCAA GGTGGTCCTG GCCTTCGGCA GCAGCATTCC CCGGGAACTT 
TCGGTCTACG GCGATGCCAA GATGGTGGCC AAGACCCTGG ATGACCCGAA GAAGTACGTG 
GGGGCCCGGA CCCTGGTCAT CGGCGGCGGC AACACGGCGG CGGACGTAAT CATTTCCATC 
CTCAGGGCCA AACGCGAGGC CGGGGACACC CAGTCGGTCT ACTGGGCCCA TGTGGCGGAA 
AAATTCGACG TGAACAAGGA GACCGCCCAG CGCCTGGGGG AGGAGATCCT CCTGGGTGGC 
AATATCAGGC TGCTTCCCGG CGCCATCCCC CGCATCGGCG AGGTTGACCA GGAGGGGGTC 
GACCGGCTCG TAATCCGGGT GAACGAGTTC ACCCAGCCCG ACGGCATCGA GATCTACCAT 
GCCATGAGCT TCCCCATGAA GAACGTCATT GCCTGCATCG GCTCCCAGGG ACCGCTTCCT 
ATCTTCGACA AGATCGGGGT CCAGACCATT GCCTGCGCCG AAGGAGTCTG CACCGTGGCC 
AAAGAGGGGG ACCGGCTCAT CCTGCTCAAC GCCGAGTTCG AGTCGACCCG CAAGGGGGTC 
TACGTCATCG GCGGCGCCAT CTCACCCTCG TTTATGAAGA TCTGCGGCGG CAGCATCCAG 
GAGGAGAAGC ATCCCAACCT GATCTACACC GCAATCAACG ATGCCTTCCA CGTAGTGGAA 
GCCGTCAAGA GGAAGCTTGC CTGA

Protein sequence

MEQQMYDVLI VGGGPAGIAC AYLCHRNDLS YLLIEQGKSV FQGITNTYPE GKNVYPSRPK 
ESPEPFLVEE LRPPDKPVAV EKYIQYVQHF VQHENLNIRT EVQFEDLKDA RDHLIVQTSV 
GNFAARKVVL AFGSSIPREL SVYGDAKMVA KTLDDPKKYV GARTLVIGGG NTAADVIISI 
LRAKREAGDT QSVYWAHVAE KFDVNKETAQ RLGEEILLGG NIRLLPGAIP RIGEVDQEGV 
DRLVIRVNEF TQPDGIEIYH AMSFPMKNVI ACIGSQGPLP IFDKIGVQTI ACAEGVCTVA 
KEGDRLILLN AEFESTRKGV YVIGGAISPS FMKICGGSIQ EEKHPNLIYT AINDAFHVVE 
AVKRKLA