Gene GSU2819 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2819
Symbol	nifK
ID	2686860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	3100763
End bp	3102232
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	62%
IMG OID	637127509
Product	nitrogenase molybdenum-iron protein, beta subunit
Protein accession	NP_953863
Protein GI	39997912
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01286] nitrogenase molybdenum-iron protein beta chain

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAACC AACTCGGACT CGCCGTCAAG CCGGTCACCG AATACGATGA CGCAGAAGTA 
AAGAGAGTCG CCGAATGGAT CAACACTGAA GAGTACAAGG AGAAGAACTT CGCCCGCCAG 
GCCCTGGTGA TCAACCCGGC CCACGCCTGT CAGCCCCTGG GGGCCGAACT GGTGGCCCAC 
GCCTTCGAGG GGACCCTGCC ATTCGTTCAC GGTTCCCAGG GGTGCGCCTC CTACTACCGC 
TCCACCCTCA ACCGGCACTT CCGGGAGCCG GCGCCGGCCG TTTCCGATGC CATGACCGAG 
GACGGCGCCG TGTTCGGCGG CCAGAACAAC CTCCACGAGG GGCTGGAAAA CGCCATCGCT 
CTCTACAAGC CCAAGATGGT CGCCGTCTTC ACCTCGTGCA TGCCGGAGAT CATCGGCGAC 
GACCTGACCG CGTTCCTGAA GAACGCCCGC AACAAGGGGA TCATCCCGGC GGACATGCCG 
ACCCCGTACG CCAACACCCC GAGCTTCAAC GGCTCACACA TCCACGGCTA CGACGCCATG 
CTCCTTTCCA TCCTGCAGAC TCTGACCGCG GGCAAACAGG TGGAGGGTCG CTGCACGGGC 
AAGCTTAACC TGATCCCCGG CTTCGACGCC AATACCGGCA ACTTCAGGGA GTACAAGCGG 
ATTCTCGAGG CCTTCGGCAT TCCCTACACC ATCCTCGGCG ACATCTCCGA CGTGTTCGAT 
TCGCCCCTGG ACGGCACGTA CCGCCCCTAT CCGGGCGGCA CCACGCTGGA TGACGCCGCC 
GACTCCATCA ACGGCAAGGC CACCCTCAAC CTGGGGCCCT ATTCGGCGGC AAAGACCTTC 
TCTTGGGTTA AAGACTCCTA TTCCGGTAAG CATGCGTCCC TTCCCATGCC CATGGGAGTC 
ACCAAGACCG ACGACTTCCT CAAGAAGCTG TCGGAGCTCT TCGGCAAGCC GGTCCCCGAG 
AGTCTGAAGG AGGAGCGGGG CCGGGCCGTG GACGCCATGA CCGATGCCCA CCAGTACATC 
CACAACAAAA AGTTCGCCGT CTACGGCGAT CCCGACCAGC TCCTCGGCTA CGTCTCCTTT 
CTGCTGGAGA TGGGCGCCAA GCCCTATCAC ATCCTCTGCA GCAAGGGGAC AAAGAAGCTG 
GAGAAGGAAA TCCAGGCGTT GCTCGATACC TCTCCCTACG GCGCCGGCTG CAAGATCTAC 
ATCAACAAGG ATCTCTGGCA CATGCGGAGC CTGCTCATGA CCGACCCGGT GGACGCCATG 
ATCGGTGACA CCCACGGCAA GTTCGCGGCC CGCGACGCCG GTATCCCGCT TTTCCGCTTC 
GGCTTCCCGA TCTTCGACCG GGTCAACAAG CACCGCTACC CGATCATCGG CTACCAGGGC 
GTGGTCAATA TGCTGACCGA GATCTGCAAC AAGTTCCTCG ACATCACCGA CGAGACTTGT 
GAGGACCGGT TCTTCGAGAT GATGCGGTAA

Protein sequence

MSNQLGLAVK PVTEYDDAEV KRVAEWINTE EYKEKNFARQ ALVINPAHAC QPLGAELVAH 
AFEGTLPFVH GSQGCASYYR STLNRHFREP APAVSDAMTE DGAVFGGQNN LHEGLENAIA 
LYKPKMVAVF TSCMPEIIGD DLTAFLKNAR NKGIIPADMP TPYANTPSFN GSHIHGYDAM 
LLSILQTLTA GKQVEGRCTG KLNLIPGFDA NTGNFREYKR ILEAFGIPYT ILGDISDVFD 
SPLDGTYRPY PGGTTLDDAA DSINGKATLN LGPYSAAKTF SWVKDSYSGK HASLPMPMGV 
TKTDDFLKKL SELFGKPVPE SLKEERGRAV DAMTDAHQYI HNKKFAVYGD PDQLLGYVSF 
LLEMGAKPYH ILCSKGTKKL EKEIQALLDT SPYGAGCKIY INKDLWHMRS LLMTDPVDAM 
IGDTHGKFAA RDAGIPLFRF GFPIFDRVNK HRYPIIGYQG VVNMLTEICN KFLDITDETC 
EDRFFEMMR