Gene Rru_A1394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A1394
Symbol
ID	3834809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	1645052
End bp	1646611
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	60%
IMG OID	637825484
Product	nitrogenase iron-iron protein, alpha chain
Protein accession	YP_426482
Protein GI	83592730
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01284] nitrogenase alpha chain [TIGR01861] nitrogenase iron-iron protein, alpha chain [TIGR01862] nitrogenase component I, alpha chain

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCCACC ATACCTTCAA ATGCAGCGAA TGCATCCCCG AGCGCACCAA GCACGCGGTG 
ATCAAGGGCG CCGACGAGGA CCTGACCTCG TGCCTGCCGC TGGGTTATCT CAATACCATT 
CCGGGATCGA TCTCCGAGCG CGGCTGCGCC TATTGCGGCG CCAAGCACGT GATCGGCCAG 
CCGATGAAGG ACGTCATCCA TATCAGTCAC GGACCGATCG GATGCACCTA CGACACCTGG 
CAGACCAAGC GTTATATCAG CGATAACAAC AACTTCCAGC TCAAGTACAC CTATGCCACC 
GATGTTCGGG AAAAGCACAT CGTCTTTGGC GCCGAGAAGC TTCTCAAGCA GAACATCCTC 
GAAGCCTTCA AGGCGTTTCC CGACATCAAG CGCATGACCA TCTACCAGAC CTGCGCCACG 
GCGCTGATCG GCGATGACAT CGACGCCATC GCCTCGGAAG TGATGGACGA GTTGCCCGAT 
GTCGACATCT TCGTCTGCAA CTCGCCGGGC TTCGCCGGGC CCAGCCAGTC GGGCGGCCAC 
CACAAGATCA ATATCGCCTG GGTCAACCAG AAGGTCGGCA CCGTCGAGCC CGAGATCACC 
AGCGATTACG TCATCAACTA TGTTGGTGAG TATAATATCC AGGGCGATCA GGAAGTTATG 
CAGGATTACT TCAATCGCAT GGGCATCCAG ATCCTGTCGA CCTTCACCGG CAACGGATCC 
TATGACGGCC TGCGGGCGAT GCACCGCGCC CATCTCAATG TGCTCGAATG CGCCCGTTCG 
GCCGAATACA TCTGCAATGA ATTGCGCGTG CGCTATGGCA TCCCGCGCCT TGATATCGAC 
GGCTTCGGCT TCGAACCGCT GTCGGACTCG CTGCGCAAGA TCGGCCTGTT CTTCGGCATC 
GAAGACCGCG CCCAGGCGAT CATCGACGAA GAAACCGCCA AGTGGAAACC CCAGCTTGAT 
TGGTACAAGG AACGCCTGCG CGGCAAGAAG GTCTGCCTGT GGCCGGGCGG CTCCAAGCTT 
TGGCATTGGG CCCATGTCAT CCAGGAGGAA ATGGGCCTCA ACGTCGTGTC GCTCTACACC 
AAATTCGGCC ATCAGGGCGA TATGGAAAAG GGCATCGCGC GCTGCGGCGA AGGCGCCCTG 
GCCATCGACG ATCCCAACGA GCTTGAAGGC CTGGAAGCCC TGGAGATGCT CAAGCCCGAC 
ATCATCTTGA CGGGCAAGCG CCCGGGCGAG GTCGCCAAGA AAGTGCGCGT TCCCTATCTC 
AACGCCCACG CCTATCACAA CGGCCCCTAT AAGGGCTACG AGGGCTGGGT GCGCTTCGCC 
CGCGATATCT ACAACGCCAT CTATTCGCCG ATCTTCCAGC TGTCGGCCCT CGATATCAGC 
AAGGACCCGA TCCCGACCGA CCAGGGCTTC CTGACGCCGC AGATGATCTC CGATCCGGCC 
CTGCCCGCCG AGGTGCGGTC TTCGACCGTG CTGACCCCCT ATCGCGGCGC TTACGACACC 
ATTTCCGCCC TGCGCGAGAA GACCTATCCG CGCTTCGATG CCGTTCCTGT CGCCCAATAA

Protein sequence

MPHHTFKCSE CIPERTKHAV IKGADEDLTS CLPLGYLNTI PGSISERGCA YCGAKHVIGQ 
PMKDVIHISH GPIGCTYDTW QTKRYISDNN NFQLKYTYAT DVREKHIVFG AEKLLKQNIL 
EAFKAFPDIK RMTIYQTCAT ALIGDDIDAI ASEVMDELPD VDIFVCNSPG FAGPSQSGGH 
HKINIAWVNQ KVGTVEPEIT SDYVINYVGE YNIQGDQEVM QDYFNRMGIQ ILSTFTGNGS 
YDGLRAMHRA HLNVLECARS AEYICNELRV RYGIPRLDID GFGFEPLSDS LRKIGLFFGI 
EDRAQAIIDE ETAKWKPQLD WYKERLRGKK VCLWPGGSKL WHWAHVIQEE MGLNVVSLYT 
KFGHQGDMEK GIARCGEGAL AIDDPNELEG LEALEMLKPD IILTGKRPGE VAKKVRVPYL 
NAHAYHNGPY KGYEGWVRFA RDIYNAIYSP IFQLSALDIS KDPIPTDQGF LTPQMISDPA 
LPAEVRSSTV LTPYRGAYDT ISALREKTYP RFDAVPVAQ