Gene Dtox_1026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_1026
Symbol
ID	8427965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	1046750
End bp	1048387
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	43%
IMG OID	645033361
Product	nitrogenase molybdenum-iron protein alpha chain
Protein accession	YP_003190535
Protein GI	258514313
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01282] nitrogenase molybdenum-iron protein alpha chain [TIGR01862] nitrogenase component I, alpha chain

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAGTAA ACGAAAAAGA TTTGTTGATG GATAAGCAGA TAGAAGAGAT GTTGAACCAG 
TATCCGGCTA AAGTCAAGAG AAACCGGAAA AACCACATAG TGCTCAATGA TACTTCCTTG 
GAGCACCAGC AGATTGAAGC CAACACACGT ACGATTCCCG GCATCATAAC CAATCGGGGC 
TGTGCTTATG CCGGTTGTAA AGGCGTTGTA TTGGGGCCTC TGAAAGACAT GGTGCATATA 
GTTCACGGCC CTATCGGCTG TTCATATTAT GCCTGGATGA CCAGGAGAAA TAAGGCCAAG 
TCAGAGGATC CCAAGAAAAA TTTTCTCAAT TATTGTGTTT CAACTGATAT GCAGGAAAGT 
GATATTGTTT TTGGCGGGGA GAAAAAACTG GCCAGAATGA TTGACGAAGT AGTGGAGATA 
TTCAAACCAA ACGCTATTAC AGTATCCGCT ACTTGTCCGG TAGGCCTGAT CGGAGACGAT 
ATACAGTCGA TTGCCAAGGC AGCTGAGGAT AAGTACGGCA TACCTATTAT GGCTTTTAAC 
TGCGAGGGCT ACAAGGGTGT GAGTCAGTCG GCCGGACACC ATATCGCCAA TAACGGTTTA 
ATGGAGCATG TCATAGGCAG AGGTGATTTG GAAGAGGCCC CGGCCAAATA TACCATAAAT 
ATGCTAGGTG AATATAACAT AGGCGGAGAC AGTTGGGAAA TAGAAAGAGT TCTTACGGAG 
TTAGGCTATC ATGTACAAAC GGTAATGACG GGAAACGGTG CCTATGAGGA TTTAAAAAAC 
GCCCATATAG CTCAATTAAA TTTGGTGCAG TGTCATCGTT CCATTAACTA TATAGCAGAT 
ATGCTGGAAA AAAAATATGG TACTCCCTGG TTAAAGGTGA ACTTTATAGG CATTCGCAGC 
ACTATTGAAT CACTGCGCAA CATGGCTATG TATTTCGGTG ACAAAGAGTT AATTGATAAA 
ACCGAAGAAG TGATTGCCCG TGAATTGGCT GAAATTGAAC CGGCCCTGGA TAAGTACAGA 
AAATACACCA ATGGAAAAAC AGCCTTTTGT TTTGTCGGGG GTTCACGCGG CCACCACTAC 
CAGATTCTCT ATGAGGAACT GGGTATAAAG ACACTCCTGG CAGGTTACGA GTTTGCGCAT 
CGGGATGATT ATGAAGGAAG AGTGGTTCTT CCTGATATCA AACCGGATGC TGACAGTAAA 
AACATTCCTG ACCTGCATGT AGAGCCGGAT GAAAGACGTT ACCGGGTTAA GATTCCACAG 
GAAAGAATGG CTGAATTGCA GGAAAAAATG CCTTTGTGTA ATTATAAAGG CATGAGGATG 
GATATGATTG ACAACACTGT AATGGTGGAT GACTTAAATC ACTACGAAAC AGAAGAATTT 
ATCCGGATAT TAAAACCAGA TATCTTCTCC TCGGGTATTA AAGACAAGTA CATTGTGCAG 
AAAATGGGTA TTCCATCTAA GCAGCTGCAT AATTATGACT ACAGCGGCCC ATATGCCGGA 
TTTAAAGGAG CAGTAAACTT TGCCCGCGAT ATAACCATGG GAATTGTTTC GCCAACCTGG 
AAATATATTA CCCCACCCTG GAAGAGCAGT CCTTTAATTG AAGGAACTAT TGAGGAAGGG 
AGGTCATGCG GATGCTAG

Protein sequence

MAVNEKDLLM DKQIEEMLNQ YPAKVKRNRK NHIVLNDTSL EHQQIEANTR TIPGIITNRG 
CAYAGCKGVV LGPLKDMVHI VHGPIGCSYY AWMTRRNKAK SEDPKKNFLN YCVSTDMQES 
DIVFGGEKKL ARMIDEVVEI FKPNAITVSA TCPVGLIGDD IQSIAKAAED KYGIPIMAFN 
CEGYKGVSQS AGHHIANNGL MEHVIGRGDL EEAPAKYTIN MLGEYNIGGD SWEIERVLTE 
LGYHVQTVMT GNGAYEDLKN AHIAQLNLVQ CHRSINYIAD MLEKKYGTPW LKVNFIGIRS 
TIESLRNMAM YFGDKELIDK TEEVIARELA EIEPALDKYR KYTNGKTAFC FVGGSRGHHY 
QILYEELGIK TLLAGYEFAH RDDYEGRVVL PDIKPDADSK NIPDLHVEPD ERRYRVKIPQ 
ERMAELQEKM PLCNYKGMRM DMIDNTVMVD DLNHYETEEF IRILKPDIFS SGIKDKYIVQ 
KMGIPSKQLH NYDYSGPYAG FKGAVNFARD ITMGIVSPTW KYITPPWKSS PLIEGTIEEG 
RSCGC