Gene MCA0764 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA0764
Symbol	nifA
ID	3102395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	803938
End bp	805473
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	62%
IMG OID	637169973
Product	transcriptional regulator NifA
Protein accession	YP_113267
Protein GI	53804913
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3604] Transcriptional regulator containing GAF, AAA-type ATPase, and DNA binding domains
TIGRFAM ID	[TIGR01817] Nif-specific regulatory protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTGATC GCTACACATT GATCGAGCGG GAGCTCGACG CCCTCTATCA GGTCGGCCAG 
GTGTTGAACA GCACGGCCGA TCTCAAGGGC AGGCTGGAGG GTGTGCTCAA CGTCCTGCAC 
GAGCAGGCCG ATCTGCGTTC CGGGATGATC GCGCTGCGGG AGCCGGAAAC CGATGCGCTG 
GTATTGGCGG TACTGCGGCG GGGCGAAGCC GGGCGGACTT CCAACGAGCC GGTGCGTTAC 
GAGCCGGGCG AAGGACTGAT CGGCACCATT CTGGAAGCAA ACTGCACCAT TGTGGTGGAG 
CGCATCGCTG ACGAGCCGCG TTTCCTCGGC CGCCTCGGTC TCTACGATCC GGAGTTGCCC 
TTCATCGGCT CGCCCATCCA TGTGGGCAAG GATGAACTGC TCGGGGTGCT GGCGGCTCAG 
CCCAGCGAGC GTGAGCTGCT GGGCGAGCGC GCCAGGTTCC TGGAGATGGT GAGCAATCTG 
GTCGCGCAGA GCGTCGGCCT GCTGCGCGGG ATGGAACAGA AGCAGCGCGA TCTCACGACC 
CAATGCGAGC AGCTGCAACA GACGCTGCGC TCGAATTACG GATTCGAGAA CATCATCGGC 
CGGACGCCGC CGATGCTGCG TGTCTTCGAG ACCGTGCGCC AGGTCGCGAA ATGGAACACG 
ACGGTGCTCA TCCGGGGTGA GTCGGGCACC GGCAAGGAGA TGATCGCCAG CGCGATCCAC 
TTCAATTCGC CCCGGGCGAG TGGCCCCTTC GTGAAGCTCA ACTGTGCCGC CTTGCCTGAA 
AACCTGCTGG AGTCGGAACT GTTCGGCCAC GAGAAAGGCG CCTTCAGCGG CGCCGTCAAC 
CAGCGCAAGG GGCGGTTCGA GCTGGCCAAC CACGGTACCC TTTTTCTGGA TGAAATCGGC 
GAGATTTCAC CGGCTTTCCA GGCCAAGCTA CTGCGGGTGC TGCAGGAGGG TGAATTCGAA 
CGGGTCGGCG GCATCCACAC GCTCAAAGTC GATGTGAGGA TCATTGCGGC GACCAACCGG 
GATCTCGAGT CTGCGGTGGA AGAAGGGGCA TTTCGTGAGG ACCTTTATTA TCGTCTCAAC 
GTGATGCCCA TCCAGATGCC TCCTCTGCGG CAGCGCAAGG AGGACATTCC GGAGCTCGCC 
CGCTTCCTGC TGGGCAGAAT CTCCCGCAAC CAGGGCGGCC GGCTTCTGGA AATCAAGGAG 
AGCGCCATCC GTTCGCTGAT GCGGCACGAC TGGCCCGGCA ACGTGCGCGA ACTGGAAAAC 
CTGCTCGAAC GCGCGGCGAT CATGAGCCGT GAAGGGGTCA TCGACAGTGA GGTGATCGGC 
ATGACCGGGC TCAAGGAGAA GCTGACGACG GTGGCCGATG TGGCTTCCTA CAAAGTCGAC 
CTGGGTGATG AGAACCTGGA TGAACGGGAG CGCATCATCG CCGCACTCGA ACAGAGCGGC 
TGGGTGCAGG CGAAAGCCGC ACGCCTGCTC GACATGACGC CGAGACAGAT CGCCTACCGT 
GTCAAAATCC TGAATATCCA CATGAAACAC CTGTAG

Protein sequence

MVDRYTLIER ELDALYQVGQ VLNSTADLKG RLEGVLNVLH EQADLRSGMI ALREPETDAL 
VLAVLRRGEA GRTSNEPVRY EPGEGLIGTI LEANCTIVVE RIADEPRFLG RLGLYDPELP 
FIGSPIHVGK DELLGVLAAQ PSERELLGER ARFLEMVSNL VAQSVGLLRG MEQKQRDLTT 
QCEQLQQTLR SNYGFENIIG RTPPMLRVFE TVRQVAKWNT TVLIRGESGT GKEMIASAIH 
FNSPRASGPF VKLNCAALPE NLLESELFGH EKGAFSGAVN QRKGRFELAN HGTLFLDEIG 
EISPAFQAKL LRVLQEGEFE RVGGIHTLKV DVRIIAATNR DLESAVEEGA FREDLYYRLN 
VMPIQMPPLR QRKEDIPELA RFLLGRISRN QGGRLLEIKE SAIRSLMRHD WPGNVRELEN 
LLERAAIMSR EGVIDSEVIG MTGLKEKLTT VADVASYKVD LGDENLDERE RIIAALEQSG 
WVQAKAARLL DMTPRQIAYR VKILNIHMKH L