Gene GSU0043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0043
Symbol
ID	2688550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	52000
End bp	53241
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	63%
IMG OID	637124708
Product	ImpB/MucB/SamB family protein
Protein accession	NP_951105
Protein GI	39995154
COG category	[L] Replication, recombination and repair
COG ID	[COG0389] Nucleotidyltransferase/DNA polymerase involved in DNA repair
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCGGGG GAGAGCCCAG GCAGCGAACC ATCCTCCACA TCGACATGAA CGCCTTTTTC 
GCCAGTGTCG AACAGCAGGC GAACCCGAGC CTCCAGGGAA AACCCATCGC CGTTGTCGGC 
TCCGGCCGCA CCGTGGTCAC CACCGCCTCC TATGAGGCCC GGGCCTTCGG CGTCAAGACC 
GGCATGAACA AGTGGGAAGC GCTCCAGGCC TGCCCCCACC TCATCCTGGT CGTGGGTGAC 
AACCGCAAAT ACACCCACAC CTCCACCCAG ATCAACCGGA TCTTCCGGGA CTTCACCCCG 
GAGGTGGAAA CCTTCTCCAT CGACGAAGCC TTCCTCGACG TCACCGGCTC CCTGGCGCTC 
TTCGGCTCCG CCGAAACCAT CGCCTGCCGG ATCAAGGCCC TGATCCGCCA TCGTTTCGGC 
CTGACCTGCT CCATCGGCAT CGCCCCCAAC AAGCTCCTCG CCAAACTCGC CTCTGACATG 
AAAAAGCCCG ACGGCCTCAC CATCATCCGC CCGGAAGAGG TGACCCGCCT CATGGAGATC 
ATCCCCATCC AGGACCTCTG CGGCATCGGC GTCAAGACCA GAAAACAGCT CAACAGCCTC 
GGCATCCAGA CCTGTGGCGA GCTGGGGCGC TTCCCGGTGG AGATCTTGCG GCGCACATTC 
GGGGTGATCG GCGACCGGCT CCACCTCATG GGCAAGGGGA TCGACGATTC CCCCGTGGTC 
CCCGTCGAGG AGGCCGAAGA GGTAAAGAGC GTCGGCCACT CCATGACCCT GGACAGGGAC 
CTCACCGCTC GACGGGACAT CCTCAAATAC CTCCTCCAGC TCTCCGAGAT GGTGGGCCGC 
CGGGCACGGC GCTACGGCGT TGCCGGCAAG ACGGTCCATC TCACCATCCG CTATGCCGAC 
TTCACCACCG TGGGCAAGCA GCAGACCCGG AACCAGGCCA CTAACAGCAC AGAGGAAATT 
TACGCCGAAG CGGTGAAGAT CCTCGACACC TTTGAGCTGC TGCAGCCGGT GCGTCTTCTG 
GGGGTGCGGA TCACGAACCT GTGCTACCAG CGGGAACAGT TGCCGCTCTT CGAGAAGGAA 
CGGAGGAAGG CCCTTGCCAC CGGGGCCATG GACGCGGTGA ACAACAGGTA TGGCGACTTC 
TCTGTCACCT TCGGGAGCCT CCTTGATGAA GAGGAGAAGG GGAGCTTCGT CATCTCCCCG 
GCCTGGCGGC CGGAGGGGAT CAGGAATGTG GAGGTGAAGT GA

Protein sequence

MSGGEPRQRT ILHIDMNAFF ASVEQQANPS LQGKPIAVVG SGRTVVTTAS YEARAFGVKT 
GMNKWEALQA CPHLILVVGD NRKYTHTSTQ INRIFRDFTP EVETFSIDEA FLDVTGSLAL 
FGSAETIACR IKALIRHRFG LTCSIGIAPN KLLAKLASDM KKPDGLTIIR PEEVTRLMEI 
IPIQDLCGIG VKTRKQLNSL GIQTCGELGR FPVEILRRTF GVIGDRLHLM GKGIDDSPVV 
PVEEAEEVKS VGHSMTLDRD LTARRDILKY LLQLSEMVGR RARRYGVAGK TVHLTIRYAD 
FTTVGKQQTR NQATNSTEEI YAEAVKILDT FELLQPVRLL GVRITNLCYQ REQLPLFEKE 
RRKALATGAM DAVNNRYGDF SVTFGSLLDE EEKGSFVISP AWRPEGIRNV EVK