Gene Mbar_A1553 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A1553
Symbol
ID	3625970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	-
Start bp	1913615
End bp	1915207
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	43%
IMG OID	637700434
Product	nitrogenase, subunit D
Protein accession	YP_305080
Protein GI	73669065
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01284] nitrogenase alpha chain [TIGR01861] nitrogenase iron-iron protein, alpha chain [TIGR01862] nitrogenase component I, alpha chain

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATATC ACACGTTTAA GTGCAGCGAA TGTATTCCTG AAAGGGCTAT GCATGCTGTT 
ATAAAAGGTC CAGGTGAAGA TTTGACGTCC TGCCTTCCCC TTGGATATCT CAACACGATC 
CCTGGGACGA TTTCAGAACG TGGATGCGCT TTCTGCGGTG CAAAACATGT TATAGGTGCA 
CCTATGAAAG ATGTCATCCA TCTGTGCCAT GGCCCAGTTG GATGTACCTA TGATACCTGG 
CATACTAAGC GTTATATTAG CGATAACGAC AACTTCCAGC TTAAATATGC CTGGACGACA 
GATATGAAGG AAAAGAACGT CGTATTCGGC GCTGAAAAAC TGCTCAAACA AAATATTATT 
GATTGTTTCA AGGCATTTCC GCATATCAAA AGAATGAGTA TCTACCAAAC TTGCGCTTCA 
GCACTTATTG GAGACGATAT AAATGCAGTT GCGAAAAAAG TGATGGAAGA AATGCCAGAT 
GTTGATATCT TTGTCTGCAA TGCTCCTGGT TTTGGGGGAC CTAGCCAGTC GGGAGGACAT 
CACAAAATCA ATATTGCTTG GGTCGATCAA AAAGTAGGAA CATTTGAACC TGAAATCAAA 
AGCAAATACG TCATCAATTA TGTTGGTGAT TATAATATCC AGGGAGATGC GGAAATTATA 
GTGGATTATT TCCAGAGAAT GGGGATTCAG GTTCTTTCCA CCTTTACTGG GAACGGATCC 
TATGACGACC TTAGGGGTAT GCATCTGGCC CATCTCAATG TACTAGAATG TGCGCGTTCT 
GCAGAATACA TCTGTAACGA ACTAAGAAAA AGATACGGAA CTCCACGTCT TGATATCGAT 
GGATATGGTT TTGAACCGCT CTCAGCATCA CTAATGAAAG TGGCTATGTT TTTCGGAATT 
GAAAAAGAAG CCCAGGATAT TATAGACGAA GAAATTGCTA GATGGAAACC GGAACTTGAC 
TGGTATGCTA AACGTCTGAA AGGAAAAAGA ATTTGTCTCT GGCCTGGCGG CTCCAAACTC 
TGGCATTGGG CACATGTAAT TGAAGAAGAA ATGGGAGTTA AAGTTGTCTC AGTGTATTCA 
AAATTCGGTC ATCAGGGAGA CTTCGAAAAA GGCGTTGCTC GGTGCAGTGA AGGAGCACTT 
GCTATTGATG ATCCTAATGA ACTTGAAGGG ATTGAAGCTA TGGAGATATT AAAACCCGAT 
TGTGTCCTTA CAGGTGTCCG TCCGGGAGAG GTTTCCAAAA AGATGAGGAT CCAATATCTC 
AATATTCATG GATATCACAA CGGTCCATAT AAAGGGTTTG AAGGATGGGT CAGGCTTGCA 
AGGGATCTCT ACAATGCCAT CTATTCACCG ATTCATCAGC TTTCTGGTTT GAATATCAGT 
AAGGATGAGA TCCCCACTGA TAAAGGATTC GTGACTAGGA AGATGATTTC TGATGTGAAT 
ATCATTGAGG ATGGGAAAAC TCCAATCGAG GAAAGGCCAT ACACCGGTGA ATGTGATATT 
GTTACAAGAC TACGCGGAAA AAAATATCCC AAGCTTGAAC CACAGCAGCC GCTTGGCATG 
GTAATGGAAG GAGGTGAGGC CATTAATGGA TGA

Protein sequence

MPYHTFKCSE CIPERAMHAV IKGPGEDLTS CLPLGYLNTI PGTISERGCA FCGAKHVIGA 
PMKDVIHLCH GPVGCTYDTW HTKRYISDND NFQLKYAWTT DMKEKNVVFG AEKLLKQNII 
DCFKAFPHIK RMSIYQTCAS ALIGDDINAV AKKVMEEMPD VDIFVCNAPG FGGPSQSGGH 
HKINIAWVDQ KVGTFEPEIK SKYVINYVGD YNIQGDAEII VDYFQRMGIQ VLSTFTGNGS 
YDDLRGMHLA HLNVLECARS AEYICNELRK RYGTPRLDID GYGFEPLSAS LMKVAMFFGI 
EKEAQDIIDE EIARWKPELD WYAKRLKGKR ICLWPGGSKL WHWAHVIEEE MGVKVVSVYS 
KFGHQGDFEK GVARCSEGAL AIDDPNELEG IEAMEILKPD CVLTGVRPGE VSKKMRIQYL 
NIHGYHNGPY KGFEGWVRLA RDLYNAIYSP IHQLSGLNIS KDEIPTDKGF VTRKMISDVN 
IIEDGKTPIE ERPYTGECDI VTRLRGKKYP KLEPQQPLGM VMEGGEAING