Gene Gbem_2106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gbem_2106
Symbol
ID	6782100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter bemidjiensis Bem
Kingdom	Bacteria
Replicon accession	NC_011146
Strand	-
Start bp	2443629
End bp	2445293
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	67%
IMG OID	642768101
Product	PfaD family protein
Protein accession	YP_002138915
Protein GI	197118488
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID	[TIGR02814] PfaD family protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGATCCAT TTTCACTACA GGGTGACCAT ACCGCTCGCT CTGCAAACCT GGAAAACCTG 
GGTTCGTGGC ACCCCGCCTC GAACGCCCCC CCTCAAAAGG CCGCCAACCT GAGAGACGCC 
CTCCGCTACG TACGCCAGCC GCTGTATCTC GTGGAAAAGG AAAGGACCAT GGTCCCGAGG 
CTGGGAGGGA TCGGCCGGCT CGGCGCCGTC AACCCGGGCG CGCTGCCTAT CGCCGCTTAC 
GCCCCTCCCT GCTTTCCGGA AAACCTGGGG GATCCTTCTT TTTGCCGCGA ACTTGGCATC 
CGCTACCCCT ACGTCGGCGG TTCCATGGCC AAGGGGATCA GTTCCGCGGC CATGGCCGAG 
GAGTTGGGCC GCGCCGGGAT GCTCGGCTTC TTCGGCGCCG CCGGCCTTCC GCTTGCCACC 
GTCTCCGAGA CCGCCGACCG CCTCAAGGCC TCCCTCGGCG ATATCCCCTA CGGTTTCAAC 
CTGATCCACT CCCCGCACGA GCCCGAGTTG GAGCGCGAGC TCGCCGAGCT GTACATAAAG 
AAGGGGATCC GCACAATCGA GGCCTCGGCC TTCCTGGCCC TGACGCTACC CTTGGTCAGG 
TACCGGCTGC ACGGCATCAA GCGCGCCGCC GACGGGTCCA TCGTCACCCC CAACCGCATC 
ATCGCCAAGG TCTCCCGCGA GGAACTGGCG GCGAAGTTCT TCGCACCGGC TCCCGAGAAG 
CTCCTGCGCG CGCTGGTCGC CAACGGCTCC ATCACCGCCG AGCAGGCCGA ACTGGCCGCG 
CTGGTACCGC TGGCGCAGGA CGTGACGGCC GAGGCTGATT CCGGCGGCCA TACCGACAAC 
CGCCCCGCCC TCGCCCTCTT CCCGACCATC AACGCGCTGG CGGCGAAGCT GCAGCGGCAG 
TACGGCTACA GCTGCCGCCT GCGGGTGGGG CTTGGCGGCG GAGTCTCGAC GCCGGCCTCA 
GCGGCAGCCG CCTTCTCCAT GGGCGCCGCC TACCTCGTGA CCGGGTCGGT GAATCAGGCC 
TGCGTCGAGT CCGGCACCTC CGACACCGTG CGCGGCATGC TCGCCGGCAC CCGCCAGGCT 
GACGTGACCA TGGCCCCCGC CGCCGACATG TTCGAGATGG GGGTCACCGT GCAGGTCCTA 
AAGCGCGGCA CCATGTTCCC CATGCGCGCA CAGAAGCTCT ACGAGATCTA CCGCGCCTGC 
AGCAGCCTCG ACGACATCCC CGCCGCCGAG CGCGAGAAGC TGGAGAAGAC CATGTTCCAG 
GCGTCGCTCG CCGACATCTG GCACGACACC CGCGCCTTCT TCGCCAAGCG CGACCCCTCC 
CAGGTCGAGC GTGCCGAGCG CGACCCGAAG CACCTGATGG CGTTGGTCTT CCGCTGGTAT 
CTCGGCATGG CCGCGCACTG GGCCAAAGAC GGAGCGGAAG AGCGGCGCAT GGACTACCAG 
GTCTGGTGCG GCCCCGCCAT GGGAGCCTTC AACGAATGGG CCTCAGGTTC CTTCCTCGAC 
GCCCCGGGCA ATCGCACGGT CGAAGCCGTG GCCCTAAACA TCCTGCACGG AGCGGCCGCA 
CTTAACCGCG CCAACTTCCT GAGCAGCCAG GGCATCGAAC TCAGGATGGA TGAAATCGCA 
CCGCAACCTC TCGAAATCGC ACAAATCAAG GAGTACCTTT GTTGA

Protein sequence

MDPFSLQGDH TARSANLENL GSWHPASNAP PQKAANLRDA LRYVRQPLYL VEKERTMVPR 
LGGIGRLGAV NPGALPIAAY APPCFPENLG DPSFCRELGI RYPYVGGSMA KGISSAAMAE 
ELGRAGMLGF FGAAGLPLAT VSETADRLKA SLGDIPYGFN LIHSPHEPEL ERELAELYIK 
KGIRTIEASA FLALTLPLVR YRLHGIKRAA DGSIVTPNRI IAKVSREELA AKFFAPAPEK 
LLRALVANGS ITAEQAELAA LVPLAQDVTA EADSGGHTDN RPALALFPTI NALAAKLQRQ 
YGYSCRLRVG LGGGVSTPAS AAAAFSMGAA YLVTGSVNQA CVESGTSDTV RGMLAGTRQA 
DVTMAPAADM FEMGVTVQVL KRGTMFPMRA QKLYEIYRAC SSLDDIPAAE REKLEKTMFQ 
ASLADIWHDT RAFFAKRDPS QVERAERDPK HLMALVFRWY LGMAAHWAKD GAEERRMDYQ 
VWCGPAMGAF NEWASGSFLD APGNRTVEAV ALNILHGAAA LNRANFLSSQ GIELRMDEIA 
PQPLEIAQIK EYLC