Gene GSU2829 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2829
Symbol
ID	2686850
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	3112696
End bp	3114081
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	59%
IMG OID	637127518
Product	deoxyribodipyrimidine photolyase, putative
Protein accession	NP_953872
Protein GI	39997921
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID	[TIGR00591] photolyase PhrII

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.242896
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTGCG GACGGATTCG TTCCCTGCTT CAGGGGGGGG AGGCCACGGC CGGGCCGGTG 
ATATACTGGA TGAGCAGGGA CCAGCGCGTT GCCGACAACT GGGCTTTAAT CCACGCCCAG 
AAGCTCGCAC TGGCCCGTAG CGCACCGCTT GGGGTGCTCT TCTGTCTTGC CCCACGTTTT 
CTCGGCGCGA CCGCACGCCA GTATCGGTTC ATGCTCAAAG GGCTGGAGCA GGTTCGGGCC 
GCGCTGAATC GGCTTGATAT TCCCTTCTTT CTCGTGACCG GTGATCCCAA GGGGGCGGTC 
GCGGCCTTCA CGAGGCGGCA CAGGGTTTCG TATCTGGTTA CCGATTTTGA TCCGCTTCGT 
GTCAAACGGG AGTGGAAACG GCAGGTGGCA GGGGAGATAT CAATCCCGTT CGACGAGGTG 
GATGCCCATA ATATAGTCCC CTGCTGGATC ACATCACAGC GTCAGGAGTG GGGGGCATAC 
ACCATCCGCC CAAAGATACA CCGGCTGCTT CCCGATTTCA TGGAGCCGTT TCCGCCTCTG 
CAACGTCACC CGTTTCCGTG GCAGGGAGCG CTGCCTTCAG ACGCCGAGTG GCGTGAGACT 
TTTACGGGGA TGACCTTGGA CGAATCGGTG CCCGAGGTCA GCTGGCTCGC GTCGGGAGAA 
GAGGCAGCGC AGGCCGCTTT GGCCAGATTT CTTGAAGACG GTCTGGCGGG CTACGCAACC 
CGGCGCAATA ATCCTGCAGT AATGGGACAG TCGGGATTAT CCCCCTGGCT CCATTTCGGC 
CAGCTTTCCG CCCAGAGGGT CGCGCAGGCA GCGTTTGCTG CCGCCGCGCC GATAGAATCG 
CGTGATGCCT TTCTTGAAGA ATTGATCGTA CGTCGGGAGC TTGCCGACAA TTTTTGCTAT 
TACAACGATG CCTACGACCG CTTCGACGGT TTTCCCGAGT GGGCGCAAAG AACCCTCAAC 
CGGCATCGGC ACGATCCTCG CCCCCAGTGC TATGAGCATG ACGTGCTGGA GCAGGGACAG 
ACCCACGATT CTCTCTGGAA TGCAGCACAA CTGGAAATGG TACGCTGGGG CAGGATGCAC 
GGCTACCTGA GAATGTACTG GGCAAAGAAA CTGCTCGAGT GGACCTCTTC GCCCGAAGAT 
GCCCTCATGA TTGCCATTCA ACTCAACGAC CGCTATCAGC TCGACGGCAG GGACCCCAAC 
GGATACGCTG GCATTGCCTG GAGCATCGGC GGTGTCCATG ATCGTCCCTG GGCAGAGAGA 
CCCGTCTTTG GCACGATTCG CTTCATGAGC CGCGACGGCT GCCGGAGAAA GTTCGATACA 
GATGCCTACG AACGCCGGGT GATTATTAGT CCTGCCACAT GTGCGGGAAT AGCTCTGTGT 
AAATAA

Protein sequence

MNCGRIRSLL QGGEATAGPV IYWMSRDQRV ADNWALIHAQ KLALARSAPL GVLFCLAPRF 
LGATARQYRF MLKGLEQVRA ALNRLDIPFF LVTGDPKGAV AAFTRRHRVS YLVTDFDPLR 
VKREWKRQVA GEISIPFDEV DAHNIVPCWI TSQRQEWGAY TIRPKIHRLL PDFMEPFPPL 
QRHPFPWQGA LPSDAEWRET FTGMTLDESV PEVSWLASGE EAAQAALARF LEDGLAGYAT 
RRNNPAVMGQ SGLSPWLHFG QLSAQRVAQA AFAAAAPIES RDAFLEELIV RRELADNFCY 
YNDAYDRFDG FPEWAQRTLN RHRHDPRPQC YEHDVLEQGQ THDSLWNAAQ LEMVRWGRMH 
GYLRMYWAKK LLEWTSSPED ALMIAIQLND RYQLDGRDPN GYAGIAWSIG GVHDRPWAER 
PVFGTIRFMS RDGCRRKFDT DAYERRVIIS PATCAGIALC K