Gene GSU1365 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1365
Symbol
ID	2687951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	1494206
End bp	1495252
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	51%
IMG OID	637126040
Product	Mrr restriction system protein, putative
Protein accession	NP_952418
Protein GI	39996467
COG category	[V] Defense mechanisms
COG ID	[COG1715] Restriction endonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.451451
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACGAC AACGAACTAG CCCAATGGAA GAAATGATTT TGGTTGCCAC CAAGCTCCCC 
TGGTGGGCGT GCCTGCTGCT GGCACTTGTG TCGTACGCCG TGCTTCACGT GATGGCAATG 
CGGCCTGTAA TGCCTGCTAC GGTTGTCCCC GGCCAGATGG GTGACGCCGT GGCACGGGGG 
CTCATTACGA CTCTGGCCAT GTTTGGACAG TACGTGATGC CATTTGCGTT TGCTCTGGCT 
GCCCTGCTGT CGGCCGTTAA TGAATATCGG AATAAAAAGA GCGGTACTTT CGTCCCTAAT 
CATCTTGATG TAGCGCCACC TTCCAGGAAA AGAGTGTCAA CAGAAGCTAG CGTTCCAATG 
CCCACATCCG GTAATTCCGG AAAGATGAAC CGGGATTTCG ATCATATGCT TCCTGGTGGT 
GAGGAAGAAC TAGCAATTGA GAATCCGCAA CCTGTCCCAT TGCCGCAGCA GTGGGGCATG 
TCTGTCATTC AAATGATGGA GTGGAAGCGT TTTGAAATTG TCACCCGGGA ATTTCTGAAG 
ATGACAGGAT ATGATGCCCA TGAAACGAAG GTGGGCGCTG ATGGCGGAGT GGATATTAGG 
GTCACAAAGC CCAGTAACGA TACTTTCCAG GGTATTGTGC AGTGCAAAGC TTGGAATTCG 
TATCGGGTTG GGGTAAAGCC AGTGCGCGAG CTTTATGGTG TCATGGCCGC CGAAAAGGCG 
ACGGCTGGTA TGGTTATCAC ATCCGGTACC TTTACTGCGG AAGCGGAAGA ATTTGCTAAA 
GGGAAGGTCA AACTAATTTC TGGCGTGAAT TTTCTTGAGC TTATTCGAAA ATTGCCACCG 
GAGAAACAAC AAAGGCTTCT GGATATTGCA TTGGAAGGGG ATTATCAAAC GCCAACGTGC 
CCACAGTGTG ACCTGAAAAT GACACTGCGC GAAAATAAGT CGGGGAAAAA TCCAGGGTCA 
AAATTCTGGG GATGTGTCCG GTATCCCCAC TGTCGGCAAA CGCTCGTATA TACCGGGAAC 
GGAAGCCGGG TCAGGCTTCC AAGTTGA

Protein sequence

MARQRTSPME EMILVATKLP WWACLLLALV SYAVLHVMAM RPVMPATVVP GQMGDAVARG 
LITTLAMFGQ YVMPFAFALA ALLSAVNEYR NKKSGTFVPN HLDVAPPSRK RVSTEASVPM 
PTSGNSGKMN RDFDHMLPGG EEELAIENPQ PVPLPQQWGM SVIQMMEWKR FEIVTREFLK 
MTGYDAHETK VGADGGVDIR VTKPSNDTFQ GIVQCKAWNS YRVGVKPVRE LYGVMAAEKA 
TAGMVITSGT FTAEAEEFAK GKVKLISGVN FLELIRKLPP EKQQRLLDIA LEGDYQTPTC 
PQCDLKMTLR ENKSGKNPGS KFWGCVRYPH CRQTLVYTGN GSRVRLPS