Gene Gbem_3389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gbem_3389
Symbol
ID	6780247
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter bemidjiensis Bem
Kingdom	Bacteria
Replicon accession	NC_011146
Strand	-
Start bp	3896155
End bp	3897609
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	60%
IMG OID	642769380
Product	aminoacyl-histidine dipeptidase
Protein accession	YP_002140180
Protein GI	197119753
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01893] aminoacyl-histidine dipeptidase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00176848
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGATG CAATAAGTGG GTTGGAACCT GAATCGTTTT GGCGCTGTTT TGCAGAAATT 
GCCGGCATTC CGAGACCGTC GGGTCATGAG GCAAGAATAG GCGCTTTCAT CCTGGACCGG 
GCGAAGCAAC TGGGCCTGCA AGGGGCGCAG GACGCCTGCG GGAACATCGT GGTCAGGAAA 
CCAGCGTCAC CGGGTAAAGA GCGCGTAGCC GGCATCTGCC TGCAGTCCCA CCTCGATATG 
GTGTGCGAGA AGAATGCGGA CAAGGTGCAC GATTTCCTCA ACGACCCCAT CGAATTGGTG 
CGCAGGGATC AGGTGGTGAC CGCAAACGGC ACCACCTTGG GGGCGGATAA CGGAGTCGGT 
GTCGCCGCTT CCCTCGCGTT GATGGAATAC CGGTCCCTTT CACACGGGCC GCTGGAATTC 
CTGTTCACGG TAGAGGAGGA GACTGGGCTG ACCGGCGCCA AGAACCTGAG CCCAAGCCTG 
GTGCAAAGCA GAACCCTCCT CAACCTGGAC TCGGAGGAAG AAGGGGCGCT CTACATCGGG 
TGTGCGGGCG GCAAGGATAC GGTGGGATGC TGGAACTACG CAACTGAAGC GGCACCGGCG 
GACGCCGTTG CGCTCGTTGT AGCGGTCAAG GGGCTCAAGG GCGGGCATTC TGGCCTGGAG 
ATAGACAAGG GTTTGGGAAA CGCCATCAAG CTGTTGAACC GCGCGCTCTG CAGGCTGTCC 
GGAATCGGGG CTAGGGTTGC AGGTATCGAC GGGGGAAACA TGCGGAACGC TATCCCCCGT 
GAGGCGACTG CGCAGTTCTA TCTGCCGGCA GCGAAGCTGA CTGAGGCCGA GGCGCTGGTG 
CCGGAACTGG ACCTGGTATT CAGGGCGGAA TTGGGGAATG TCGACTCCGG CGTCGTGCTG 
GCTATGAGCC GGGATGATGC GGGGAGTGGC AAGGTGATGG ATGCGACGGT TCAGGAGAAG 
CTTCTTAAGG CCATCTCCGC GCTTCCCAGC GGCGTCCAGC GCATGAGCCA CGACATTACC 
GGACTGGTCG AGACCTCCAC CAACGTTTCT GTCATCAGCA CCAGCGAGAG TGGCGTCACC 
CTGGTCACCA GCCAGCGCAG TTCCTCCGCT TCGCGCCTCG GGGAAGTGGT CGAGGGCGTC 
GAGTCGATAT TCCAACTGGG TGGTGCGGTG GTGGAAGTGA GCGAGGGGTA TCCAGGGTGG 
CAGCCCAACG TCGATTCGGC CATCCTGAAG CTGGCGCTGC AGTGCTACCG TGCGCTTTAT 
GACCGCGATG CGGAAGTGAA GGCAATTCAC GCCGGACTCG AATGCGGCAT CATCGGGGAG 
CGCATTCCCG GTATGGACAT GATTTCGCTG GGGCCCAACA TGGAAAAGGT GCACTCCCCG 
GAAGAGAAGG TGTACATAGA CAGCGTCGCA AATTTCTGGA ACTTCCTGCT GGAGATTTTA 
AAGACTGCAC AGTGA

Protein sequence

MSDAISGLEP ESFWRCFAEI AGIPRPSGHE ARIGAFILDR AKQLGLQGAQ DACGNIVVRK 
PASPGKERVA GICLQSHLDM VCEKNADKVH DFLNDPIELV RRDQVVTANG TTLGADNGVG 
VAASLALMEY RSLSHGPLEF LFTVEEETGL TGAKNLSPSL VQSRTLLNLD SEEEGALYIG 
CAGGKDTVGC WNYATEAAPA DAVALVVAVK GLKGGHSGLE IDKGLGNAIK LLNRALCRLS 
GIGARVAGID GGNMRNAIPR EATAQFYLPA AKLTEAEALV PELDLVFRAE LGNVDSGVVL 
AMSRDDAGSG KVMDATVQEK LLKAISALPS GVQRMSHDIT GLVETSTNVS VISTSESGVT 
LVTSQRSSSA SRLGEVVEGV ESIFQLGGAV VEVSEGYPGW QPNVDSAILK LALQCYRALY 
DRDAEVKAIH AGLECGIIGE RIPGMDMISL GPNMEKVHSP EEKVYIDSVA NFWNFLLEIL 
KTAQ