Gene Gura_4042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_4042
Symbol
ID	5165929
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	4700105
End bp	4701391
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	50%
IMG OID	640551521
Product	restriction modification system DNA specificity subunit
Protein accession	YP_001232759
Protein GI	148266053
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAGT GGTCTACTGT TCCGTTTGGT CAAATTGCCA AAAAGATTGT AAACGGTGGA 
ACCCCGTCGA CTGATATAGA CCGTTACTGG AATGGAAACA TACCTTGGAT AACTGGAGCC 
GACTTCACGC CATCTGGCAT CGGGGAATTC AGGCGCTTCG TCTCGGAGGA GGCTGTCAGG 
CAGTCGGCTA CAAATGTGAT TCAACAAGGT CAATTGTTAT TGGTCACCCG CACAGGAGTC 
GGAAAAATTG CCATTGCCCC ATGTGACATC GCCATCAGCC AAGACATCAC TGGAGTTTAC 
GTCGATGATA ATCAGGTTGC TACATCGTTC CTTTTTCATC GAATGCGTCA GGGAGTGGAA 
GACCTCAAAA AACTGAACCA AGGAACGAGC ATTAATGGGA TAATCCGCTC CGACCTCGTT 
GCTTACTTGG TGGAGTTGCC AGCACTTCCT CAGCAGCGCC GCATCGCTGA AATCCTCTCA 
ACACTGGACG AAACAATTGA GCAGACCGAG GTGCTGATTG CGAAGATGCA GCAGGTCAAG 
GCTGGGCTGA TGCACGACCT GTTCACCCGT GGCGTCACCC CCGACGGCCA CCTTCGTCCC 
ACACGCGAAC ATGCGCCCGG CCTCTACAAA GAATCTCCGC TTGGGTGGAT TCCGAAGGAG 
TGGGAGGTCG AAAGACTGGG AAACATCTTA CGTAAATGCG GTGGATACCT TCAGACTGGG 
CCTTTTGGCA GTCAGCTCCA TGCTCATGAA TATCAGGCCG AAGGTGTTCC AGTCGTGATG 
CCCCAAGACA TCAACAATGG ATTGATTGGC ACAGAGAATA TCGCCCGAAT TCACGAGGCA 
CGTGCCAATG ATTTAGCGCG GCATCGAATG AGTCTTGGTG ACATGGTAAT TGCCAGACGA 
GGCGATCTTT CACGTGCAGC AGCAATCAGA GAGTCAGAGC AGGGTTGGGT TTGTGGGACA 
GGGTGCTTCT TACTACGCTT AGGACAGAGC GCCTTGACGG CAGACTTTGC AGCTCAAGTT 
TACCGACAAG ATTTTGTGCA GCGGCAGATC GTAGGCAGAG CCGTTGGAAC CACAATGCCG 
AGTTTAAACA ACTCGGTTAT GGAAGGGTTG TTTTTTCCTT TTTGTGATTT AGATGAACAG 
GTGCGAATTG TTGAGCGGCT GGAATGGATG GAAATGAATA TTTGTGCTCT TAATGAAAGT 
CAGTCCGTGA ATCGACTAAT CAAACGCGGC CTCATGCACG ACCTCATGAC AGGTAACGTG 
CAAGTGTTTG AACGTACCGA AATTTAA

Protein sequence

MSEWSTVPFG QIAKKIVNGG TPSTDIDRYW NGNIPWITGA DFTPSGIGEF RRFVSEEAVR 
QSATNVIQQG QLLLVTRTGV GKIAIAPCDI AISQDITGVY VDDNQVATSF LFHRMRQGVE 
DLKKLNQGTS INGIIRSDLV AYLVELPALP QQRRIAEILS TLDETIEQTE VLIAKMQQVK 
AGLMHDLFTR GVTPDGHLRP TREHAPGLYK ESPLGWIPKE WEVERLGNIL RKCGGYLQTG 
PFGSQLHAHE YQAEGVPVVM PQDINNGLIG TENIARIHEA RANDLARHRM SLGDMVIARR 
GDLSRAAAIR ESEQGWVCGT GCFLLRLGQS ALTADFAAQV YRQDFVQRQI VGRAVGTTMP 
SLNNSVMEGL FFPFCDLDEQ VRIVERLEWM EMNICALNES QSVNRLIKRG LMHDLMTGNV 
QVFERTEI