Gene Gura_0020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_0020
Symbol
ID	5165250
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	28392
End bp	29837
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	58%
IMG OID	640547519
Product	heat shock protein DnaJ domain-containing protein
Protein accession	YP_001228811
Protein GI	148262105
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000120001
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACACCC GTCACCGATT GAAATTTCCG GAAGAGATAG AACTCGAGCA GAAGCATGCC 
GAACTTGCCC GCCTTCGGTC CGAGCATGCG GCAAATCAAC ATATCCTGGA CAAACTGAAG 
CAGGAAATTC GCCTCTTCGA AAAGGTCTAC GACCAGGTGC TGGGGCAACG CATTGCAGAA 
CTGGAGAAGC TGGAAAAGCA GCTCCGCGAT CTGGACGACG GCGGCAAAAA CCCGGCGGAG 
CGGAAAAGCG AGCCGTCAAC AGAGGAGTGG CGCGGCCACC TGCATGCCGA CGATCTGCTG 
GAGGAAGAAG AACCGGCGGC AGCAAATATG GCAAAAAAAA GCATCAAGGC CCTCTACCGC 
GAGGTAGCCA AGGCCATTCA CCCGGACCTG GCCATGGACA ACGAAGACCG GGTTCGGCGC 
CATGAGTTGA TGGCTTTTGC CAACCGCGCC TATGCGGAAG ATGATCGACG GGCGTTGCTG 
GAGATCCTCC GGGAATGGGA GCAGGGGCCC GAGAAGATCC AGGGTGGGGA TACCGGTGCG 
GAGCTGGTCC GGGTTATCAG GCTGATCGCC AGGGAACGGC AGGAAATCCT CGCCGTGCAT 
ACCCGCATCA GGGAACTCAA GGACTCGGAT GTCTGCCGGT TCAAGCTGAA GGTTGACGAT 
GCGCTCGCCA ACGATATCGA TCTCCTCGCG GAGATGGCTG CAACGGTCGA CCTCAACATA 
GTCAAGGCGC GCAATCGTCT GGCCGACCTG GCTGGAGACG GGGCGCCGCC AGTGCAGTCC 
TCTCCGCTGC AGCAAACCCG ACGCATCTGT TTTCCTACCG ACACTTCCTG CGGCGTCCTC 
TATGTACGCA ACCGGAACTC AGCCAACTAC AGCGACTGGC AGAAGTTCTG TGCAGCCAAA 
GGATGCCGGG AAATCCCCGC CGACAAGGCC GTGCGCCTCG ATGTCAAGGA TCACCCCGCC 
GCCAGGCTGA GCTACCTGCA ACAACTGCAA CCGGATGATC TGCAGTCTCT ATTTCTCTAT 
GAAGTGGACA ACTCCTTCCT GGACAACATC GGCCACCTGA CCGGGCTGGA GGAACTCTAT 
CTCTCCGATT CCACCGTGAA CGACGATGAC CTGAAAAAGC TCGCCAGGCT GAAAAACCTC 
CAGCGGATTT ATCTTTACCA CACCGACATC ACCGATGCCG GACTCCTCTA TCTCTGCGAA 
TTGAAGGGAT TGAAAGGGCT CACCTGCAGC GGCAACAACA TTACCAATGA AGGGCTGGCA 
CGGCTGCAGA AGGCAATTCC GGGGATCAGG ACCATCAACT TCGGCTGGCG CCAGAAGAAG 
GAAGCAGCCG GTCAGGATAG CAAACCGGCA CATGGGGATA GTCTAGTCGC TGGCCTGCCA 
GCGAACAAAC GCAAGCCAGC CGACTATGAC AAGGTTGACG ACCAGCAGGA TTACCTTGAC 
CGCTGA

Protein sequence

MDTRHRLKFP EEIELEQKHA ELARLRSEHA ANQHILDKLK QEIRLFEKVY DQVLGQRIAE 
LEKLEKQLRD LDDGGKNPAE RKSEPSTEEW RGHLHADDLL EEEEPAAANM AKKSIKALYR 
EVAKAIHPDL AMDNEDRVRR HELMAFANRA YAEDDRRALL EILREWEQGP EKIQGGDTGA 
ELVRVIRLIA RERQEILAVH TRIRELKDSD VCRFKLKVDD ALANDIDLLA EMAATVDLNI 
VKARNRLADL AGDGAPPVQS SPLQQTRRIC FPTDTSCGVL YVRNRNSANY SDWQKFCAAK 
GCREIPADKA VRLDVKDHPA ARLSYLQQLQ PDDLQSLFLY EVDNSFLDNI GHLTGLEELY 
LSDSTVNDDD LKKLARLKNL QRIYLYHTDI TDAGLLYLCE LKGLKGLTCS GNNITNEGLA 
RLQKAIPGIR TINFGWRQKK EAAGQDSKPA HGDSLVAGLP ANKRKPADYD KVDDQQDYLD 
R