Gene GM21_2940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2940
Symbol
ID	8138283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3419292
End bp	3420383
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	63%
IMG OID	644870538
Product	2-nitropropane dioxygenase NPD
Protein accession	YP_003022727
Protein GI	253701538
COG category	[R] General function prediction only
COG ID	[COG2070] Dioxygenases related to 2-nitropropane dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	120
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAAAC CGTTACGCAT AGGAAAACAC GAGGCACGCT ACCCGCTCAT CCAGGGCGGC 
ATGGGGGTGC GCATTTCTGC AGGATCTCTC GCAGGGCACG TAGCGAAGTG CGGAGGGGTC 
GGCCTTGTCG CTTCACCCGG CATCGTCTTG AACAGCGAGT TTTTCAACGG TTCGAACTAT 
CTCAAGAACA GCTCCCTCGC TCTCAAGGAG GAGCTGCGCA AGGCCTACGA GATCGCGCCC 
GACGGCATCG TCGGCGTGAA CGTGATGGTC GCCCTCACCG ATTTCGAGGA ACTGGTCGTC 
GCCGCCGTCG AGGGTGGCGC CAAGGTGCTC GTCTGCGGGG CGGGACTCCC CTTGACCTTG 
CCGGGACTGA CCGCGCACGC TCCCGACGTG GCGCTGGTGC CGATCGTTTC CTCCGTGCGC 
GCGGCGCAAC TGATCGCCAA AAAATGGGAC AAGTCCTACA ACCGTCTCCC CGACGCCGTG 
GTGGTAGAGG ATCCCGACAC CGCCGGGGGG CATCTGGGCG AAAAGATAGA AAATATCGGC 
AACGGCGACT ATGACCAGTA CGAGACCGTG CGCGGCGTCA AGGAATTCTT CCGTACCGAG 
TACAACCTCG ACATCCCCAT CATCGCCGCC GGCGGGATCT GGGACCGCGC CGACGTGCTG 
CACGCCCTTG CCGAAGGGGC GGACGGTGTG CAGATGGCGA GCCGTTTCGT AACCACCGTG 
GAGTGCGACG CGGACGACGC CTTCAAGCAG GCCTACCTGG ACTGCAAGAA GGAGGACATC 
GGTCTCATCA TGAGCCCGGC GGGTCTTCCG GGGCGCGCCA TTCTCACCAA CCAGCAGGGG 
ATCGTCGACT ACGACCGGGA TCGTGCCTCC TCCTGCAGCC ACGGCTGCCT GAAAAAGTGC 
TCCTACAAGG AAAGCGGAGA GCGTTTCTGC ATCGTCAGGT CCCTGGACCG GGCGCAGCGC 
GGCGAGGTTG ACAGCGGCCT GATCTTCTGC GGCACCAACG CCTATAAGGC CAACCGTATC 
GAGACCGTCC AGGAGATCTT CGACGAGCTC TTCGCCGAAA CGGGCGCCGT CTCCCACGAG 
AAAGCCGCGT AA

Protein sequence

MFKPLRIGKH EARYPLIQGG MGVRISAGSL AGHVAKCGGV GLVASPGIVL NSEFFNGSNY 
LKNSSLALKE ELRKAYEIAP DGIVGVNVMV ALTDFEELVV AAVEGGAKVL VCGAGLPLTL 
PGLTAHAPDV ALVPIVSSVR AAQLIAKKWD KSYNRLPDAV VVEDPDTAGG HLGEKIENIG 
NGDYDQYETV RGVKEFFRTE YNLDIPIIAA GGIWDRADVL HALAEGADGV QMASRFVTTV 
ECDADDAFKQ AYLDCKKEDI GLIMSPAGLP GRAILTNQQG IVDYDRDRAS SCSHGCLKKC 
SYKESGERFC IVRSLDRAQR GEVDSGLIFC GTNAYKANRI ETVQEIFDEL FAETGAVSHE 
KAA