Gene RSP_0540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_0540
Symbol	nifD
ID	3718049
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	-
Start bp	2276885
End bp	2278366
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	63%
IMG OID	640071749
Product	nitrogenase iron-molybdenum protein, alpha chain
Protein accession	YP_353613
Protein GI	77464109
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01282] nitrogenase molybdenum-iron protein alpha chain [TIGR01862] nitrogenase component I, alpha chain

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGAAAG ATATCGCTGA CTCTGCCGAG ACCAACATGA AGCTGATCGA GGAGGTGCTG 
GCCGCCTACC CCGACAAGGC CAGGAAGAAG CGCGCCAAGC ACCTGAATGT CGCAGCGCCC 
GTCGCCGAGG CCGAACCCGG CCTCCAGTCG AAATGCGACA ATGTGAAATC GAACATCAAG 
TCGGTCCCCG GCGTGATGAC CATCCGCGGC TGCGCCTATG CCGGCTCGAA GGGCGTGGTC 
TGGGGCCCGG TCAAGGACAT GCTGCACATC AGCCACGGCC CGGTCGGCTG CGGCCACTAC 
AGCTGGTCCC AGCGCCGCAA CTACTACACC GGCACGACGG GCGTGGATTC GTTCGTGACC 
ATGCAGGTCA CCACCGACTT CCAGGAAAAC GACATCGTCT TCGGCGGTGA CAAGAAGCTG 
GAAAAGACCA TCGACGAGCT GAACATGCTC TTCCCGCTGA ACAAGGGGAT CTCGATCCAG 
TCGGAATGCC CGATCGGCCT GATCGGCGAC GACATCGAGG CGGTGTCGAA GAAGAAGGCC 
AAGGACATCG GCAAGCGCGT CGTTCCGGTG CGCTGCGAGG GCTTCCGCGG CGTGTCGCAG 
TCGCTCGGCC ACCATATCGC GAACGACATG ATCCGCGACT GGGTGCTGGA AGCGGGCGAG 
GGCGCGCGCG CGGGCTACGA GCCCGGCCCC TATGACGTGA ACATCATCGG CGACTACAAC 
ATCGGCGGCG ACGCCTGGTC GAGCCGGATC CTGCTGGAAG AGATCGGCCT CAACGTCATC 
GCGCAATGGT CGGGCGACGC CACCATCGCC GAGATGGAGC GCGCTCCGGC GGCGAAGCTG 
AACCTCATCC ACTGCTACCG TTCGATGAGC TACATCTGCC GGCACATGGA AGAGAACCAC 
GGCGTGCCGT GGATGGAGTA CAACTTCTTC GGCCCCTCGC AGATCGCGGC CTCGCTGCGC 
GCCATCGCCG CGAAGTTCGA CGACAGGATC CAGGCCAATG CCGAAGCGGT CATCGCGAAA 
TACCAGCCGC TCGTCGATGC GGTGAACGCG AAATACAAGC CGCGCCTCGA AGGCAAGAAG 
GTGATGCTCT ATGTGGGCGG CCTGCGTCCG CGCCACGTCG TCGACGCCTA CCATGACCTG 
GGCATGGAGA TCGTGGGCAC CGGCTACGAA TTCGCCCACA ACGACGACTA CAAGCGCACC 
GGCCATTACA TCAAGGAAGG CACGCTGATC TTCGACGACG TCTCGGGCTA CGAGCTGGAG 
AAATTCGTCG AGGCGATCCG TCCCGATCTC GTGGGCTCGG GCATCAAGGA GAAATACAAC 
ACGCAGAAGA TGGGCATCCC GTTCCGTCAG ATGCACTCCT GGGATTATTC CGGCCCCTAC 
CACGGCTACG ACGGCTACGC GATCTTCGCG CGCGACATGG ATCTCGCGAT CAACAACCCC 
GTCTGGGGCA TGTTCGATGC GCCCTGGAAG AAGACGGCCT GA

Protein sequence

MAKDIADSAE TNMKLIEEVL AAYPDKARKK RAKHLNVAAP VAEAEPGLQS KCDNVKSNIK 
SVPGVMTIRG CAYAGSKGVV WGPVKDMLHI SHGPVGCGHY SWSQRRNYYT GTTGVDSFVT 
MQVTTDFQEN DIVFGGDKKL EKTIDELNML FPLNKGISIQ SECPIGLIGD DIEAVSKKKA 
KDIGKRVVPV RCEGFRGVSQ SLGHHIANDM IRDWVLEAGE GARAGYEPGP YDVNIIGDYN 
IGGDAWSSRI LLEEIGLNVI AQWSGDATIA EMERAPAAKL NLIHCYRSMS YICRHMEENH 
GVPWMEYNFF GPSQIAASLR AIAAKFDDRI QANAEAVIAK YQPLVDAVNA KYKPRLEGKK 
VMLYVGGLRP RHVVDAYHDL GMEIVGTGYE FAHNDDYKRT GHYIKEGTLI FDDVSGYELE 
KFVEAIRPDL VGSGIKEKYN TQKMGIPFRQ MHSWDYSGPY HGYDGYAIFA RDMDLAINNP 
VWGMFDAPWK KTA