Gene GM21_3038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3038
Symbol
ID	8138384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3527480
End bp	3529129
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	63%
IMG OID	644870639
Product	hydroxylamine reductase
Protein accession	YP_003022825
Protein GI	253701636
COG category	[C] Energy production and conversion
COG ID	[COG1151] 6Fe-6S prismane cluster-containing protein
TIGRFAM ID	[TIGR01703] hydroxylamine reductase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	161
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCATGT TTTGCCGTCA ATGTGAGCAG GCCGCCAAGG GGACCGGATG CGACGTCATG 
GGTGTCTGCG GGAAAAGTCC CGAGGTAGCC GCCCTGCTGG ACCTGTTGCT CCACGGTCTC 
AAGGGGCTCG CCATCTACGC GGACAAGGCC CGTGCCCTGG ATGCACGCAA CACCGTCGCC 
GACATGTATC TCATCGAAGG GCTTTTCACC ACGGTCACCA ACGTCGATTT CGACGCGGTG 
CAGCTCGCCG GCAAGCTGAG AAGGTGCTAC GACCTGAAGG AACAGGTCAA AGCGCTGTAC 
GAGGGGGCCT GGCGCGAGAA GCACGGGGCG CCCGCCGCAG CCATCACCGA CGGTCCCGCC 
GCCTGGGTGA TAGCGGATAC CCTGGAAGGG CTCGTGGCGC AGGGGAAAAA CTGCGGCGTC 
AGGAGCCAGC ACAGCGACCC CGACATCCTC TCCTCCATCG AAATCATCAT CTACGGCCTG 
AAGGGTATGG CCGCCTACGC GAATCACGCC TGCATCCTCG GCAAGACCGA CGAGGAGGTC 
TTCGCCTTCT TCCACAGCGC GCTCGCAGCC ACCACCGACC CGAACAGGGG GCTCATGGAC 
TTCGTCGGCA TCGCCATGGA GTGCGGCAAG CTCAACATCA AGGTGATGGG GATGCTCAAC 
GAAGGGCACG TCGAGCGTTA CGGCCACCCG GTCCCGACCA AGGTGCAGCT CGGCACCCGC 
AAGAACAAGG GGATCCTGGT CTCCGGCCAC GACCTGCGCA TGCTGGAGGA GATCCTCAAG 
CAGACCGAAG GGAAGGGGAT CGACATCTAC ACCCACGGCG AGATGATCCC CGCCCACGGC 
TACCCGGCGC TGAAGAAATA CCCGCACCTC TACGCCAACT TCGGCGGCGC CTGGCAGGAC 
CAGCACAAGG AGTTCCAGGC TTTCCCGGGC GCCATCATCT TCAACACCAA CTGCATCCAG 
CGTCCCGCCG ACAGCTACAA AGACCGCCTC TTCACCTGGG GCGAGGTGGG GTGGCCGGGC 
GTCAAGCACA TCGCCGGCTG GCACTTCGAC GAGGTGATCA ACAAGGCGCT TGGGTGCCCG 
GATCTCCCCG ACGCTCCCGG CAAGGAGATC CTCACCGGCT TCGGGCACAA CGCCGTCCTT 
GGCGTGGCGG ACAAGGTCAT CGAGGCGGTG AAGGGGGGAG CGGTCAAGCA CTTCTTCCTG 
ATCGGCGGCT GCGACGGTGC GAAGAGCGGC CGCAACTACT ACACCGAGTT CGCCGAAAAG 
GTCCCCAAGG ACTGCGTCAT CCTGACCCTT GCCTGCGGCA AGTACCGTTT CAACAAGCTC 
GAATTCGGCG ACATCGGCGG CATCCCGCGC CTTCTGGATG TGGGGCAGTG CAACGACGCC 
TACTCCGCGG TACAGATCGC GCTGGCCCTC GCCGGAGCCT TCAACTGCGG CGTGAACGAT 
CTGCCGCTTT CCTTCATCCT TTCCTGGTAC GAACAGAAGG CGCACGTCAT CCTGCTCTCG 
CTTTTGTACC TGGGGATAAG GGACATCAAG CTCGGTCCCA TGCTTCCCGC CTATCTCTCG 
CCGAACGTGC TGCAGTTTTT GGTCAGCAAC TTCAACATCA GCCAGATCGG CACTGTCGAC 
GAGGACCTCA AGGCGAGCCT CGGGCAATAG

Protein sequence

MSMFCRQCEQ AAKGTGCDVM GVCGKSPEVA ALLDLLLHGL KGLAIYADKA RALDARNTVA 
DMYLIEGLFT TVTNVDFDAV QLAGKLRRCY DLKEQVKALY EGAWREKHGA PAAAITDGPA 
AWVIADTLEG LVAQGKNCGV RSQHSDPDIL SSIEIIIYGL KGMAAYANHA CILGKTDEEV 
FAFFHSALAA TTDPNRGLMD FVGIAMECGK LNIKVMGMLN EGHVERYGHP VPTKVQLGTR 
KNKGILVSGH DLRMLEEILK QTEGKGIDIY THGEMIPAHG YPALKKYPHL YANFGGAWQD 
QHKEFQAFPG AIIFNTNCIQ RPADSYKDRL FTWGEVGWPG VKHIAGWHFD EVINKALGCP 
DLPDAPGKEI LTGFGHNAVL GVADKVIEAV KGGAVKHFFL IGGCDGAKSG RNYYTEFAEK 
VPKDCVILTL ACGKYRFNKL EFGDIGGIPR LLDVGQCNDA YSAVQIALAL AGAFNCGVND 
LPLSFILSWY EQKAHVILLS LLYLGIRDIK LGPMLPAYLS PNVLQFLVSN FNISQIGTVD 
EDLKASLGQ