Gene Mbar_A2278 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mbar_A2278
Symbol
ID	3625130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosarcina barkeri str. Fusaro
Kingdom	Archaea
Replicon accession	NC_007355
Strand	-
Start bp	2887882
End bp	2889279
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	41%
IMG OID	637701151
Product	nitrogenase, subunit alpha
Protein accession	YP_305783
Protein GI	73669768
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01284] nitrogenase alpha chain [TIGR01860] nitrogenase vanadium-iron protein, alpha chain [TIGR01862] nitrogenase component I, alpha chain

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000740744
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.119504
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATTAA AACTATTCTG TTGCGATGAA TGCATACCTG AGCGCCAAAA CCATGTTTAC 
ATAAAAGAAG AAGGAGAAGA CACAACTCAA TATCTCCCAC TCTCAAATAT AGAAACAATT 
CCAGGATCAT TATCTGAGAG AGGGTGCAGC TATTGTGGAG CAAAACTCGT TATTGGCGGA 
GTCATCAAAG ACTGTATTCA GATGATACAT GGACCGGTAG GATGTGCTTA TGATACCTGG 
CACACGAAAA GGTATCCCAG CGATAATGAC AATTTTCAAT TAAAATATGT TTGGTCGTCG 
GACACAAAAG AAAAACATAT TGTTTTCGGA GCTGAGAAGC AGCTCAAAAA AGCGATCAAG 
GAAGCTTTCA AAGAATTTCC AGAAATCAAG CGAATGTTTG TCTACACGAC CTGTACAACC 
GCATTGATAG GAGACGATCC TAAAGCAGTA TGTCGTGAGG TTGAGGAAGA GCTTGGAGAT 
GTAGATATAT TCGTTGTCGA ATGTCCAGGA TTCGCTGGAG TCAGTCAATC AAAAGGACAT 
CATGAGCTGA ACATCGGCTG GATGAGAGAT AAGATTGGAA CGCTTGAACC TGAAATTAAA 
AGCGAATACA CAATTAATGT CATTGGTGAC TACAATATTC AGGGAGATAC TTACGTATTA 
CAAAAATATT TTGATAAAAT GGGCATACAG GTCATTGCAC ACTTTACAGG AAATGTAACC 
TATGATCAAC TACGCTGTAT GCATAGGGCA AAGCTGAATG TGGTCAACTG CGCGCGTTCT 
GCAGGATATA TAGCCAACGA ACTTAAGAGA GTATATGATA TTCCAAGAAT GGATGTTGAT 
ACCTGGGGTT TTGAATATGT CAAGGTAGCA CTGAGAAAAA TTGGAGCTTT CTTTGGATTG 
GAAGACAAAG CTGAAGAAGT AATTGCAGAA GAGGTTGCAA AATACGAAGG AAAACTTAAC 
TGGTATAAGG AACGGCTCAA AGGAAAAAAG GTCTGTATCT GGACTGGTGG GCCAAGACTA 
TGGCACTGGA CAAAGGCTCT TGAAGACGAT TTAGGTATGG AAGTTGTTGC AATGTCTTCT 
AAATTTGGTC ATCAGGAAGA CTTTGAGAAG GTTATTGCCA GGGGAAGAGT CGGGACGATT 
TATATTGATG ACGGAAATGA ACTGGAGTTT TTCGAAGTAC TCGATAATAT TCACGCCGAT 
ATTATTTTTA CCGGGCCCAG AGTTGGAGAC TTAGTCAAAA AACTGCACAT TCCATACATT 
AACGGACATG CATATCACAA CGGTCCATAC ATGGGCTTTG AAGGCGCAGT AAACATGGCG 
AGAGATATGT ATAACGGAAT TTATTCTCCG ATGTGGAGTT TAGCTGGAAA AGATCCGAGA 
GTGGTGCAGG AATTATGA

Protein sequence

MPLKLFCCDE CIPERQNHVY IKEEGEDTTQ YLPLSNIETI PGSLSERGCS YCGAKLVIGG 
VIKDCIQMIH GPVGCAYDTW HTKRYPSDND NFQLKYVWSS DTKEKHIVFG AEKQLKKAIK 
EAFKEFPEIK RMFVYTTCTT ALIGDDPKAV CREVEEELGD VDIFVVECPG FAGVSQSKGH 
HELNIGWMRD KIGTLEPEIK SEYTINVIGD YNIQGDTYVL QKYFDKMGIQ VIAHFTGNVT 
YDQLRCMHRA KLNVVNCARS AGYIANELKR VYDIPRMDVD TWGFEYVKVA LRKIGAFFGL 
EDKAEEVIAE EVAKYEGKLN WYKERLKGKK VCIWTGGPRL WHWTKALEDD LGMEVVAMSS 
KFGHQEDFEK VIARGRVGTI YIDDGNELEF FEVLDNIHAD IIFTGPRVGD LVKKLHIPYI 
NGHAYHNGPY MGFEGAVNMA RDMYNGIYSP MWSLAGKDPR VVQEL