Gene Gura_1985 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_1985
Symbol
ID	5166532
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	+
Start bp	2298117
End bp	2299790
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	51%
IMG OID	640549479
Product	Sel1 domain-containing protein
Protein accession	YP_001230748
Protein GI	148264042
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000285463
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGACAAG TGATATATGT ATGTCTGCAT GTGGGCCAAA CACTAAGCGT GCAGAGAGTG 
CGGCACGGAA GGAGGGAAAA GCTGGATTTG ATGGTTAAAC TGACTGCAAT CGTGTTGATC 
TGCCTGGCAA CCACTTGTTT ATTTGCCGAT ACAAAGGCAG ACCCTCGTGC TGTCAGGAGC 
GCAAATATTG CGGAGATCAG GAAACTGGCA ATTGAGGGTC ATGTTGATGC CCAGTTCTAT 
ACGGGGTTTA TGTATGAAAA AGGGCAGGGC GTACTCCAGG ACTATGCCGA GGCGGTGAAA 
TGGTATCTGA AAGCGGCCGA GCAGGGGCAT GCCGGTGCGC AAATCAATGT CGGCATCATG 
TATTTCAAGG GGCAGGGGGT ATTACCGGAT TATGCCGAGG CGGCGAAATG GTATCGAAAA 
GCAGCTCTTC AGGGGAATGC AAACGCTCAA TTCAATCTCG GTCTGATGTG CAACAAAGGT 
CAAGGGGTAT CCCGGGACTA TGTCGAGGCG GCGAAATGGT ATCTGAAAGC AGCTGAACAG 
GGGAATAGTG GTGCTCAATT CAATCTCGGT CTGATGTACT ACAAAGGGGA CGGGGTTGCA 
CGGAACTTTG CCGAAGCCTT CACATGGTAC CGGAAGGCGG CCGAACAGGG GAATGCGGGG 
GCCCAGTTCA GTCTGGGTTT AATGTATTAT AAAGGTCAAG GAGTGCCGAA GAATTTTGCC 
GAGGCCGCCG CATGGTATCG TAAGTCTGCT GAGCAGGGGC ATGTAGGCGC CCAGTTTAAT 
CTGGGGTACA TGTACGAAAT GGAGCAAGGT GCAGTCGGAG GGAATGCCGA AGCGGCAAAA 
TGGTACCGGA AGGCTGCTGA GCAAGGACAC GCAGGCGCCC AGTCTAATCT GGGGTACATT 
TATGATATCG GAGAAGGGGT GCCCCAGGAT CATGCCGAAG CGGCCAAATG GTACAGGAAG 
GCAGCCGAAC AGGGAAATGC CGCTGCGCAA TTAAACCTTG GGATCATGTA TGATAATGGT 
CATGGTATCT CCCAGGACAA TGCAGAAGCG GTCAAATGGT ATCGCAAGGC TGCGGAACAG 
GGGGATATGA CCGCCCAATA CAATATGGGA GTCAAGTATG CCAATGGAAT CGGCGTGCCG 
CGCAACAATG CCGAAGCTGT CGAATGGTAC CGGAAAGCCG CTGACCAGGG GCATGAAATT 
TCACAGGTCA ATCTTGGCCA TTTATATGAA AATTCAGACG GCGTACCCCA GGACTATGCG 
CAAGCACTCA AATGGTATGG TAAGGCTGCC GAACAGGAAA ATAGCGATGC CCAGTTCAGC 
TTGGGGTTAA TGTATGCCAA AGGCCAGGGG ACGCCACAGA ACTACGCCGA AGCGGCCAAA 
TGGTATAGAC GGGCGGCTGA CCTGGGGAAT GAGATTGCGT ATTATAATCT GGCAATTCTC 
TACTATAAAG GTCTGGGTGT GGATCGGGAC TATGCCGAAA CAGTAAGATT GCTTAAGGAG 
GTCGCCGATC AGGAAGATGC AAATGTTCAT TTCAGCCTGG GATATATGTA TTATAAGGGG 
CAAGGGGTAA TCGAGGACCA TGCCGAAGCT TTGAAATGGT TCAGAAAAGC CGGTGATGAG 
GGCCTTAAAG AGGCCATGAA CTATGTAAAT TCAATCGAAA AGAAGGTGAA ATGA

Protein sequence

MGQVIYVCLH VGQTLSVQRV RHGRREKLDL MVKLTAIVLI CLATTCLFAD TKADPRAVRS 
ANIAEIRKLA IEGHVDAQFY TGFMYEKGQG VLQDYAEAVK WYLKAAEQGH AGAQINVGIM 
YFKGQGVLPD YAEAAKWYRK AALQGNANAQ FNLGLMCNKG QGVSRDYVEA AKWYLKAAEQ 
GNSGAQFNLG LMYYKGDGVA RNFAEAFTWY RKAAEQGNAG AQFSLGLMYY KGQGVPKNFA 
EAAAWYRKSA EQGHVGAQFN LGYMYEMEQG AVGGNAEAAK WYRKAAEQGH AGAQSNLGYI 
YDIGEGVPQD HAEAAKWYRK AAEQGNAAAQ LNLGIMYDNG HGISQDNAEA VKWYRKAAEQ 
GDMTAQYNMG VKYANGIGVP RNNAEAVEWY RKAADQGHEI SQVNLGHLYE NSDGVPQDYA 
QALKWYGKAA EQENSDAQFS LGLMYAKGQG TPQNYAEAAK WYRRAADLGN EIAYYNLAIL 
YYKGLGVDRD YAETVRLLKE VADQEDANVH FSLGYMYYKG QGVIEDHAEA LKWFRKAGDE 
GLKEAMNYVN SIEKKVK