Gene Gura_4301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_4301
Symbol
ID	5166808
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	+
Start bp	4966999
End bp	4969380
Gene Length	2382 bp
Protein Length	793 aa
Translation table	11
GC content	57%
IMG OID	640551780
Product	hypothetical protein
Protein accession	YP_001233017
Protein GI	148266311
COG category	[V] Defense mechanisms
COG ID	[COG0610] Type I site-specific restriction-modification system, R (restriction) subunit and related helicases
TIGRFAM ID	[TIGR00348] type I site-specific deoxyribonuclease, HsdR family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.355479
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTTCGCCT ACGACACCGA AGGTTTCGGC CCTGAGAGCC TCCTGGGGCG AACCTCCGAC 
CGGGAGGTAG TACTCCGGAG AGACGTGGAG GCCGCACTGC GCCGCCTGAA TCCGGGCCTG 
CCGGATGATG CCTACCACGA TGCGCTGGCT CAGGTAACGG CGGACGACCG CACCAAGACT 
CTGCTACAGG TGAACAAGGA AAAGTACCGG CTACTGCGGG ACGGAGTGCC GGTCAAATAT 
CGCGACGAAG CGGGGAGGAT GACTGACCGG CGGCTGAAAC TGGTCGATTT TGACGACCCG 
GCCAACCCGA AGAAGAACCG GTTTCTGGTG GTAAGGGAAC TTTGGGTAAA GGGAGATACG 
TACAGGCGAA GGCCTGACGT TCTCGGCTAT GTCAACGGAT TGCCATTGGT GTTCATCGAG 
CTGAAACGCT ATGACCAGCA CATCGATAAG GCATTTAAGC AGAACTACAG CGATTACAAG 
GACACCATCC CCCACCTGTT CCACTGGAAC GCGCTGATCC TGCTGTCCAA TGGCGTCGAT 
GCCAAGTACG GCTCCATCAC TTCTATCATG GAGCATTTCT CTCGCTGGAA ACGGCAAAAA 
GAAGAAGACC CGGAACCGAC CGCCGATCAG CCACTCCTGC CGTTGTTACT GCGCGGCATG 
CTGAACAAGG AAGCCCTCCT CGATCTGGTT GAGAACTTCA TTCTCTTTGA CCGGACCGAG 
GGGGAACTCC AGAAGATAGT GGCGCGTAAC CACCAGTATC TTGGCGTAAA CCAAGTGATC 
GGCAAGCTGC TGTCGAAAGA GCCGGGCATG CAGGCCGAGG TAGAGGCGGG ACGGCTGGGG 
GTATTCTGGC ATACCCAGGG TTCGGGGAAG TCATACTCGA TGATCTTCCT GACCGAGAAG 
ACCCACCGCA AGATCTCGGC CAAGTATACC TTTGTGGTGA TGACCGACCG GAACGAACTG 
GACGAACAGA TTTTCGGCAC CTATACCGGC TGCGGCGCGG CCACCAACAA GAAGGCGAAA 
GCCATGGACG GCAAGGCACC GGACAGATTC ACGCTGATTC GCCGTGCCCA GGTGGAGTGG 
ATGAAGGAGA CGGAGATTTG CGTCGTCGTT TCGCCGGAGC AGGGAGAAGT GGCCGAGTTC 
CGCAAGTGGG AGCTGGATAT CGTTCCGCAC CGGGAAAAGA TGGTCCATCG GGATCTGAAC 
TTGGAGTTCA AGAAGCCGGA ACACCCGTTC CGGGTGGTCA TCGTCTGTGC CATGTGGCTG 
ACCGGTTACG ACGTGAAGTG CCTTGCCACC CTCTACCTGG ACAAACCGAT GAAGGGCCAC 
ACCCTGATGC AGGCCATCGC CCGCGTGAAC CGGGTCGGCG GCGGCAAGAA GAACGGTCTC 
ATCATCGACT ACAACGGCAT GCTGAAGAGT TTGCGAAAGG CGCTGGCTAC ATTCGCTCAA 
GGTGACCGCA AGGGCTCTGA CCAGGACATC CTTCGTGACG ATACCGAGGC AGTGGCTGAG 
TACGGCCAGT CGATCCGGGC AGCACAGGAT TTCCTGACCG GCTGCGGATT CAATCTGGAC 
GAGCTGATCG CAGCCAACGG GTTCGACAAG CAAGCGATGA TCCTGCGGGG GGTAAACACT 
GTCTGCGAGA CTGACGAACG GCGCAAGACC TTCGAGGTCA TGGCCGATGA CATCGCAGCC 
AGGTTCCGGG GCATCTTTCC CAATCCAGGA CTGTACGCTT ACGACGAGCA GGAGAATGCA 
ATCGCGGCCA TCTATAACCG GTTGCAGGAG AGCAAGGAAA GCCCGGATGT CAGCGAAATG 
CTCCAGGCGC TTTATGCTGT GATAGATACG GCGGTGACCA CCGATACCTT GACCGTAAAT 
GAGCCCCCTG TACGCTACGA GCTGACCAAA ATCGATATCA GCCGCTTGCA GGCTGAATTC 
GAGCGCACGT GCCCCAACAT CAAGATGCTC AACCTGCGGG AAAAGATCGA AAAGCGGCTT 
GAGGCGATGA TCGCACGGAA TCCGACCCGC GTGGATCTGT ACGAGCGCTA CCAGGAGATC 
GTGGCGGAGT ATAACAAGGA GTATAACAAG GACAAGGATG CCGTGGAAGT GCAGAAGGTG 
TTCGACCTGC TGCAGAAGGA CACCCAGACC CGGCCCGAAC GGGAACGGAT CAAGGAGGTG 
GCAAAGGAAC TGCTGGACAA GCTGCTATCC GACAAGCTCC AGATCGACCA TTGGCGGGAA 
AAAGCCACGG CCCAGGCCCA GGTCAAAGCA GAAATCATCA AGCATCTCTT CGTCAACCTG 
CCTGAAACAG GTTATGCAGA GCACGAAATT TCCGCACGGG CAGACCTGGT GTTTGCTCAT 
CTCTATCAGA CATGCGCGGG AACGATGGCA TTTCACCAAT GA

Protein sequence

MFAYDTEGFG PESLLGRTSD REVVLRRDVE AALRRLNPGL PDDAYHDALA QVTADDRTKT 
LLQVNKEKYR LLRDGVPVKY RDEAGRMTDR RLKLVDFDDP ANPKKNRFLV VRELWVKGDT 
YRRRPDVLGY VNGLPLVFIE LKRYDQHIDK AFKQNYSDYK DTIPHLFHWN ALILLSNGVD 
AKYGSITSIM EHFSRWKRQK EEDPEPTADQ PLLPLLLRGM LNKEALLDLV ENFILFDRTE 
GELQKIVARN HQYLGVNQVI GKLLSKEPGM QAEVEAGRLG VFWHTQGSGK SYSMIFLTEK 
THRKISAKYT FVVMTDRNEL DEQIFGTYTG CGAATNKKAK AMDGKAPDRF TLIRRAQVEW 
MKETEICVVV SPEQGEVAEF RKWELDIVPH REKMVHRDLN LEFKKPEHPF RVVIVCAMWL 
TGYDVKCLAT LYLDKPMKGH TLMQAIARVN RVGGGKKNGL IIDYNGMLKS LRKALATFAQ 
GDRKGSDQDI LRDDTEAVAE YGQSIRAAQD FLTGCGFNLD ELIAANGFDK QAMILRGVNT 
VCETDERRKT FEVMADDIAA RFRGIFPNPG LYAYDEQENA IAAIYNRLQE SKESPDVSEM 
LQALYAVIDT AVTTDTLTVN EPPVRYELTK IDISRLQAEF ERTCPNIKML NLREKIEKRL 
EAMIARNPTR VDLYERYQEI VAEYNKEYNK DKDAVEVQKV FDLLQKDTQT RPERERIKEV 
AKELLDKLLS DKLQIDHWRE KATAQAQVKA EIIKHLFVNL PETGYAEHEI SARADLVFAH 
LYQTCAGTMA FHQ