Gene Gura_2114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_2114
Symbol
ID	5166289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	+
Start bp	2469483
End bp	2471027
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	58%
IMG OID	640549610
Product	peptidase S10, serine carboxypeptidase
Protein accession	YP_001230875
Protein GI	148264169
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2939] Carboxypeptidase C (cathepsin A)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000253475
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATTCCGT CAATCCTTCT TGCCGCCGCG CTGATTACCG GAACCCCTTA TCATGCGTCA 
CATCCGGTGC CGGAGGCTGC TGTTGCTTCT GATGCGGCAA AGGGTGAAGA AAAACAGCCG 
GAGAAGGACA AGAATGCGGC CGTCCCGGAA AAACCGGTGG TCACCAGGCA TAAGGTTGTC 
GTGGAGAATA GGGAAATCGG GTACATGGTG ACCACAGGCC ATCTGCCGGT GATGAACGAT 
GCCGGCGAAA GCGAAGCGCA GATCTTCTTT ATTGCCTATA CGGCTGACAA CCCATCCCCC 
GGAATACGGC GGCCGCTCCT GTTCATCTTC AATGGCGGCC CGGGCGCGGC TTCGGTCTGG 
CTTCACCTGG GCGCTGTCGG TCCCAGGCGC GTCCAGATGC TTCCTGACGG TAGGATGCCG 
CCACCCCCTT ACCAGTTGGT GGATAACGAA TTCACCTGGC TGGATCAGGC CGATCTGGTC 
TTCATCGATC CGGTCGGCAC CGGCTACAGT CGGGCGGTCA AGCCGGAGTT GACCAAGAAA 
TTTGCCACGG TGCAGGGGGA CATCGATTCG GTTGGCAGAT TCATCAGGCT CTATCTGGCC 
CGTTACGGGC GCTGGAATTC GCCGTTGTTC CTGGTGGGGG AGAGCTACGG TGCGTTCCGC 
GCCGCCGGCC TTTCGGACTA CCTTTTTGAG CACGGCGCCG CCCTGAACGG GATCATCCTC 
ATCTCTTCCG TCATGAACAT GCAGGCCATT TCGTTCGACC AGGGTAACGA TCTCCCCTAT 
GAACTGTTCC TGCCCAGCTA CACGGCCACT GCCTGGTACC ATAAGAAACT CTCTCCGGAC 
CTTCAGGGTG ATCTGGACAA GACGCTTGCG ACCGTTGAGA ACTGGGCTGC AACCGGGTAT 
CTGACCGCCC TCGGCAAGGG AGATACTCTC TCTCCGGAAG AGAGGCGAAC GGTGGTCGAG 
AAGCTATCCG CATTCACGGG GTTGGATAAA TCCTATATCG ACAACCGCAA CTTGCGCATC 
GACAACAGGA GCTTTGTCAG AGACCTTTTG CGCGATCAGA GGCAAGTGGT CGGGTTTATG 
GACAGCCGGT TCACGGCGGC GAACCTGGAC CCGGCGGCTC CTTTCGGGTT TGACCCGACC 
GTAGCTACGA TCCGCGCCCC GTATACGGCC ACTTTCAACG ACTATGTCCG TCGTGAGCTC 
GGATTCAAGT CTGACCTGGA ATACTTCACC TTGGGCGGAG GGATCGGACG TTGGGACTGG 
GAGGCGAAAA ACGGTTACGC CGACAGCAGT GAGAATTTGC GCAATGCCTT TGCCAAAAAC 
CCGTACATGA AGCTTTTCGT GGCATCGGGC TGCTTCGACC TGGCAACCCC GCATTTTTCC 
ACGGAATATA CCATAAACCA CCTGGGTCTG ACCCCGGCCC TGAGGGGAAA CATAACAACC 
CGTCGATACA GGGCAGGGCA CATGATGTAT CTGGACAGGA CGTCGCTTTC CCAGTTGAAA 
AAGGATGTTG CGGCGTTTAT CGCAGGTGCT CTGGTAGAGC GATGA

Protein sequence

MIPSILLAAA LITGTPYHAS HPVPEAAVAS DAAKGEEKQP EKDKNAAVPE KPVVTRHKVV 
VENREIGYMV TTGHLPVMND AGESEAQIFF IAYTADNPSP GIRRPLLFIF NGGPGAASVW 
LHLGAVGPRR VQMLPDGRMP PPPYQLVDNE FTWLDQADLV FIDPVGTGYS RAVKPELTKK 
FATVQGDIDS VGRFIRLYLA RYGRWNSPLF LVGESYGAFR AAGLSDYLFE HGAALNGIIL 
ISSVMNMQAI SFDQGNDLPY ELFLPSYTAT AWYHKKLSPD LQGDLDKTLA TVENWAATGY 
LTALGKGDTL SPEERRTVVE KLSAFTGLDK SYIDNRNLRI DNRSFVRDLL RDQRQVVGFM 
DSRFTAANLD PAAPFGFDPT VATIRAPYTA TFNDYVRREL GFKSDLEYFT LGGGIGRWDW 
EAKNGYADSS ENLRNAFAKN PYMKLFVASG CFDLATPHFS TEYTINHLGL TPALRGNITT 
RRYRAGHMMY LDRTSLSQLK KDVAAFIAGA LVER