Gene Gura_2599 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_2599
Symbol
ID	5163979
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	+
Start bp	3009091
End bp	3011271
Gene Length	2181 bp
Protein Length	726 aa
Translation table	11
GC content	64%
IMG OID	640550095
Product	hypothetical protein
Protein accession	YP_001231349
Protein GI	148264643
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID	[TIGR01451] conserved repeat domain

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACGCT ATCGACGGGT TATTTTCGGC ATATTCCTGA CGCTGACCGT CGCATGTCCC 
GCCATGACGG TCTGCGCCGT CGCAGCCGAC CTGAAAAAAG CGCCGCCCGG CATAGCAGAG 
CGCCTGGATC AAGGCGCCAC CCAGAAACTG ATCGTCCTGT TCGATGACAG CGCCATTGAG 
CGGGAAGTTG CTGCAAACCG AAGCCGGACA GGCATTGAAC ATGATGATGA CGCCATTCTG 
GCATTCAGAG CTTCGCGTTA CAGGGAGCTG AAAAGCCGGG CAGAGCCTGC GGAGCTGAGC 
GGCGAGGTCG AAACGGTCAA AGACTACAGT CATCTGCCGA TGTCATTCAA GCGTTTCAAA 
AACCGCCGTT CGCTGGAGAA ATTCCTGGCT CTCCCTGAGG TGACGGCGGT CTACGAGAAC 
CGGCCGATTT ACCCGACCCT CGCCCAGAGC CTGCCGTTAA TCAAACAGCC GGCAACAGCC 
GGTCTGGGGC TGACCGGGAG CGGCGCCACA GTGGCGGTAA TCGATACGGG CATCAACTAT 
ACCCTGGCCG CTTTCGGTTC CTGCACGGCG CCGGGGACCC CCGCCGGCTG CCGGATAGCC 
GCCTCGGTGG ACATTACCGG CAACAACGTT ACCCTGAACA CCGACCCAAA CGGCCATGGC 
ACCAACGTGG CGGGGATTGT CTCAGGAGTG GCGCCGGGCG CCCGGATTGC CGCGATCAAC 
GCCTTTACCG GCGGCGCGTC TTCCATCGCC TTGATCATTG ACGGCATCAA CTGGGCCATA 
GCCAACCGGA GCGCCTATAA CATCGTCGCC ATCAACATGA GTCTGGGGGA CGGCGCCAAA 
TATACGGCTC CCTGCGGCAA CAGCCACACA AACCCCTTCG TCACCCCGGT GAATAACGCC 
CGGGCCGTCG GCATCCTTCC GGTGGCCGCG TCGGGCAACG AGGGGTACTC GAACGGCATT 
GCCAGTCCGG CCTGCACTCC GGGGGTCGCC TCTGTGGGGG CTGTCTACGA CGCCAATGTC 
GGCGGGCGGC AGTGGTCAAC ATGTACCGAC AGTACCACCG CAGCCGATCA GGTCGCCTGT 
TTCTCCAACA GCTCCAGCTT CGTGACCATG CTATCCCCCG GCGCGATCAT CACCGCCGCC 
GGCATCGGCA TGGGTGGTAC ATCACAGGCA TCACCCCATG TGGCAGGGGC AGCCGCAGTA 
TTCCGCTCGG CTTTTGCCGG CGAGACCCCG GATCAGACGC TCGCGCGCCT GACCGGCAGC 
GGTGTGCCCG TCACCGACCC GCGTAACGGC GTCGTCAAGC CGCGCCTCAA CCTGCTGGCC 
GCCTTGGGAG CGCCCATCAA CGACAACTTT TCCGCACGCC AGGCGCTCAG CGGCGACACC 
GGCCAGCTCA CCGGCAACAA CGCCAACGCC ACCGTCGAGC CGGCCGAACC GGCCCACGCT 
GGCAACAGCG GCGGCAGATC GGTCTGGTGG AGTTGGACGC CTTCCGTTTC CGGTCCGGTT 
GCAATTGATA CACAAGGAAG CAGCTTCGAT ACCCTGTTGG CGGTCTACAC CGGTACGGGC 
GTTACCGCCC TCACCCCCAT TGCAGCAAAC GACAACGACG GCGCCCCGGG AAACACCAGC 
GGCCTCTCCT TTGTTGCCCA GGCGGGAATA GAGTACCTCA TTGCCGTGGA CGGCTTCAAC 
GGAGCCTTCG GCAGCACGGT CCTCAACTGG GGGCAGGCCC CCAGCGCCGA TCTGTTCGTT 
ACCATGACCG GCTCACCCGA CCCGCTGGCG CCGGGTGAGA CCCTGACCTA CTCCATCTCG 
GTGGCAAACA GGGGACCGGC AACCGCCGTC AACACGACCC TGACCGATAC CCTGCCGACT 
GGGGTGAGCG TCGTCTCTAC CTCTGCCGGC TGCACGACGG CAGGTGGGAT CGTCACCTGC 
AACCTCGGCA GCATGGCAAG CGCCACCGCC GTCGGCCTCC AGATTGCCGT TTCGCCCGCC 
TCAGCCGGGA CATTGACCAA CACCGTGAAC GTTGCTTCAG ATACCTACGA GCTCGCCCCT 
GCCGACAATT CAGCCGGCAT CGCCACAACG GTTTCGCTTC CGCCGCCGGC AGTTCCGGCG 
CTCTCCCCTT GGGGGATTGC GCTGGCCGCC TGCCTGCTCT CAGGCTGGCA GCAGCATCGA 
AAACGGCGCA AACCCAATTA G

Protein sequence

MRRYRRVIFG IFLTLTVACP AMTVCAVAAD LKKAPPGIAE RLDQGATQKL IVLFDDSAIE 
REVAANRSRT GIEHDDDAIL AFRASRYREL KSRAEPAELS GEVETVKDYS HLPMSFKRFK 
NRRSLEKFLA LPEVTAVYEN RPIYPTLAQS LPLIKQPATA GLGLTGSGAT VAVIDTGINY 
TLAAFGSCTA PGTPAGCRIA ASVDITGNNV TLNTDPNGHG TNVAGIVSGV APGARIAAIN 
AFTGGASSIA LIIDGINWAI ANRSAYNIVA INMSLGDGAK YTAPCGNSHT NPFVTPVNNA 
RAVGILPVAA SGNEGYSNGI ASPACTPGVA SVGAVYDANV GGRQWSTCTD STTAADQVAC 
FSNSSSFVTM LSPGAIITAA GIGMGGTSQA SPHVAGAAAV FRSAFAGETP DQTLARLTGS 
GVPVTDPRNG VVKPRLNLLA ALGAPINDNF SARQALSGDT GQLTGNNANA TVEPAEPAHA 
GNSGGRSVWW SWTPSVSGPV AIDTQGSSFD TLLAVYTGTG VTALTPIAAN DNDGAPGNTS 
GLSFVAQAGI EYLIAVDGFN GAFGSTVLNW GQAPSADLFV TMTGSPDPLA PGETLTYSIS 
VANRGPATAV NTTLTDTLPT GVSVVSTSAG CTTAGGIVTC NLGSMASATA VGLQIAVSPA 
SAGTLTNTVN VASDTYELAP ADNSAGIATT VSLPPPAVPA LSPWGIALAA CLLSGWQQHR 
KRRKPN