Gene Gura_2055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_2055
Symbol
ID	5165698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	2405194
End bp	2406969
Gene Length	1776 bp
Protein Length	591 aa
Translation table	11
GC content	57%
IMG OID	640549550
Product	pepF/M3 family oligoendopeptidase
Protein accession	YP_001230818
Protein GI	148264112
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1164] Oligoendopeptidase F
TIGRFAM ID	[TIGR02290] oligoendopeptidase, pepF/M3 family

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00862679
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGATACG ATATAAAAGA TCTGTTGTGG AACACCGCCC CCCTCTATAC CGGACCTGAG 
TCACCGGACC TGGAAGGTGA TTTTGAAGCA GCAGCAACAG GAGCGAATGG GTTCAGGGAA 
CGCTACCGGG GGCGTGTCGC GGGCTTGGAT GTCGTTGAAC TGCAAAAGGC GCTGGTCGAA 
TACGAAGAGC TCGAAGAACT AATCGTCAAA CCGCAGCTCT ATGCCCATCT CCTCTTTGCC 
GCTGACTCGG AAAACGACGT CAACAAGCGC CTCTCTCAAA AGGCAGCGGA ATTCGGCAAC 
CTGATGAGCA GGGAACTCCT GTTCTTCGAC CTGGAGATCA TCCAGATGGA GGACAAAGCC 
TTTGCGCAAT TGATCGGCGA CGAACGGCTC GCTAACTACC GTCACTACAT GGAAAGCCTG 
CGTAAATTCC ACCCCCACAC CCTGACTGAG CGGGAAGAAA GCCTGTTAAA ACAGAAGAGT 
CTGACCGGTA CAGAGGCGTT CTCCCGCCTG TTCGACGAGG TATCAGCATC ATTCCGCTAC 
ACCATGACTC TCGATGGGGA AGAACGGGAG TTTACCGGCG AGGAGCTGTT GGGACTGCTC 
CATCATACCG ACGCCATGGT CAGGGAACAG GCATTCGCTA CTTTCCTCAA GCGCCACGAG 
GAACAGGGGA TCATCTTTTC TTCCGTTTTC AATACCGTTG CCCTCGACCA TGGGCAGGAC 
CTGGAACTGC GCAACTACAA AAGCCCCATG GAGCCGACCA ACCTGGGTAA CGAGATCCCT 
GCCGAGGTAG TAGAGCGGAT GATGTCCGTT TCCGAGGCCA ATTACCCGCT GGCCCAGGAG 
TACTTCCGCC TCAAGGCGAA ACTGCTGAAT CTGGATAAGC TGAAAAACAC CGACGTCTAC 
GCGCCGGTTG GGGAAATAGA GCAACACTAT ACCTTTGCCG AGGCCCGCGA CCTGGTGATT 
GCCGCCTATG ACCGGTTCTC ACCGGAATTT CGGGATATAG CCGCCGCCTT TTTCAAGGAC 
GGCAGGATTG ACGCCCTTCC CCGCATCGGC AAGAGCGGCG GCGCCTTCTG CATGGGAATG 
ACCCCGCGAC TCGCGCCATA CGTGCTTCTC AACTTTACCG GCAACCTGCG CGACGTGGCC 
ACCGTAGCGC ACGAACTGGG GCACGGCATC CACTTCACCC TCGCCCAACG CCAGACCATG 
GTCAACTACC ATGCACCGCT CCCCCTGGCG GAAACGGCAT CGGTCTTCGG CGAAATGCTC 
CTCACCCGAC ACATGCTGGA GGGTGAAACG GACAAGCAGG TGAAGATCGC CCTTCTTTGC 
GCCAAGATCG AGGACATCAT CGCCACCACC TTTCGTCAGA ACGTCCTGAC CCGTTTTGAA 
GAGCGGATGC ACCTGGAGCG GAAGAAGGGG CTACTGACCG CGACGCAGCT CTGCGACCTG 
TGGTGGGAAG AAAACGCCAG GCTTTACGGC GATTCAGTGG AGATGATCGA AGCATACCGC 
TGGGGATGGA GTTACATCTC TCATTTCATT CACACCCGGT TCTACTGCTA TTCTTACACC 
TTTGCCGAAC TCCTCGTCCT CTCCCTCTAC CAGAGATACC TCAAGGAAGG AGACGCATTC 
ATCCCCACCT ACCGGGAGAT CCTTGCCGGA GGCGGCTCCA AGTCACCGGC CGACACGGTC 
AGACCGGCCG GCATCGACCT TGCCGACCCG GACTTCTGGC AGAATGGCTA TGACGTCCTG 
ACCGGCCTGC TTGAAGAACT GAAACAGCTG GTCTGA

Protein sequence

MGYDIKDLLW NTAPLYTGPE SPDLEGDFEA AATGANGFRE RYRGRVAGLD VVELQKALVE 
YEELEELIVK PQLYAHLLFA ADSENDVNKR LSQKAAEFGN LMSRELLFFD LEIIQMEDKA 
FAQLIGDERL ANYRHYMESL RKFHPHTLTE REESLLKQKS LTGTEAFSRL FDEVSASFRY 
TMTLDGEERE FTGEELLGLL HHTDAMVREQ AFATFLKRHE EQGIIFSSVF NTVALDHGQD 
LELRNYKSPM EPTNLGNEIP AEVVERMMSV SEANYPLAQE YFRLKAKLLN LDKLKNTDVY 
APVGEIEQHY TFAEARDLVI AAYDRFSPEF RDIAAAFFKD GRIDALPRIG KSGGAFCMGM 
TPRLAPYVLL NFTGNLRDVA TVAHELGHGI HFTLAQRQTM VNYHAPLPLA ETASVFGEML 
LTRHMLEGET DKQVKIALLC AKIEDIIATT FRQNVLTRFE ERMHLERKKG LLTATQLCDL 
WWEENARLYG DSVEMIEAYR WGWSYISHFI HTRFYCYSYT FAELLVLSLY QRYLKEGDAF 
IPTYREILAG GGSKSPADTV RPAGIDLADP DFWQNGYDVL TGLLEELKQL V