Gene GSU3086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU3086
Symbol
ID	2688476
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	3391779
End bp	3392954
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	64%
IMG OID	637127779
Product	hypothetical protein
Protein accession	NP_954127
Protein GI	39998176
COG category	[L] Replication, recombination and repair
COG ID	[COG0116] Predicted N6-adenine-specific DNA methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGTCGG TTATTGTGCG CAAACGTACC GCAGTCACTC CCCTTTCGGG CGAGCATGCC 
TTCTTCGCCA CCACAGCCAA GGGGGTTGAG GATGTCCTGG CCGCCGAGAT GCGCGGCCTC 
GGTTTTCGCG GGGTGGCCAT AGAGCGCGGA GGAGTGCGTT TCGCGGGCGA TCTTGCCGCC 
TGCTACCGGG CCAACCTCTG GCTGCGGACC GCGAGCCGCA TCCTCGTGCC GCTTGCCCAA 
TTCCCCTGCG ATTCACCCCA GCGGCTATAT GACGGTGTCC GCTCCATCCA GTGGAACGAC 
TGGCTCACCC CCGACATGAC CCTGGCAGTT GAGTGCAATC TTCGCGATTC GGTTCTGACC 
CATTCAGGGT TCGTGGCTCT CAAGACCAAG GACGCTATAG TCGACACCAT CCGTGACCGC 
CACGGCAGGC GACCCAGCGT GAATCCCAAG CAGCCGGATC TCGGGGTCCA TGTTCATCTG 
GTCCGTAACG TCTGCACCGT GAGCCTTGAC AGTTCCGGCG CCAGCCTCGA CCGGCGCGGC 
TACCGTACCG AGGCGGGTGA GGCCCCGTTG CGGGAAACTC TTGCCGCCGC CCTCGTGGAG 
ATGACGGGGT GGGACGGCAC CGTTCCTCTC CTAGACCCCA TGTGCGGCTC GGGTACCATC 
CTCGTGGAGG CGGCGCTCAA GGCGCTCAAT CGGGCGCCCG GTCTCATTCG GGAGCGTTTC 
GGATTCCAGC ACTGGCCCAG CTTCGACTCT TCACTCTGGC TCCGTCTTGT AACCGAAGCA 
CGCCAGGGGG AGCGCACTTC ACTTGAGTCC CCCCTCCTGG GGAGCGATCA GCAGGCTGAC 
CTTCTCTCTG TCGCCGCAGC CAATGCCCGG CGGGCCGGTG TCGAGCAGCA CATTTCCTTT 
ACGTCTGGCG ATGTGCGTGG CCTGACACCA CCTCCCGCTC CTGGCATTAT TCTCTTCAAC 
CCTCCTTATG GCAGGAGGCT CGGCGATGAA GAAGGGCTTC GGGTCCTCTA CCGCCAGATC 
GGTGACGTTC TGAAGCAGCG CTGCGCCGGC TATACCGCCT GGCTGCTCAC CGGTGGGCCC 
GAGTTGGCCA AGGCGGTGGG GCTCAGGGCA TCCCGGCGGA TCGTCCTCTT CAACGGCCCC 
CTTGAGTGCC GTTTCCTGAG GTTTGATCTC TACTGA

Protein sequence

MSSVIVRKRT AVTPLSGEHA FFATTAKGVE DVLAAEMRGL GFRGVAIERG GVRFAGDLAA 
CYRANLWLRT ASRILVPLAQ FPCDSPQRLY DGVRSIQWND WLTPDMTLAV ECNLRDSVLT 
HSGFVALKTK DAIVDTIRDR HGRRPSVNPK QPDLGVHVHL VRNVCTVSLD SSGASLDRRG 
YRTEAGEAPL RETLAAALVE MTGWDGTVPL LDPMCGSGTI LVEAALKALN RAPGLIRERF 
GFQHWPSFDS SLWLRLVTEA RQGERTSLES PLLGSDQQAD LLSVAAANAR RAGVEQHISF 
TSGDVRGLTP PPAPGIILFN PPYGRRLGDE EGLRVLYRQI GDVLKQRCAG YTAWLLTGGP 
ELAKAVGLRA SRRIVLFNGP LECRFLRFDL Y