Gene Paes_1632 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_1632
Symbol
ID	6458431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	+
Start bp	1775706
End bp	1777067
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	49%
IMG OID	642725620
Product	nitrogenase MoFe cofactor biosynthesis protein NifE
Protein accession	YP_002016297
Protein GI	194334437
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01283] nitrogenase molybdenum-iron cofactor biosynthesis protein NifE

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00463409
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAAGA TCGGAATACT CGAAGGAAGA GAAAAACAGG TCTACGAAAA AAAAGGTGAC 
TCAGCTGCGA TTGACATCAA ATGCGAAACC ACCAGCCTTT CCGGATCTGT CAGTCAGAGA 
GCCTGCGTTT TCTGCGGCTC GCGTGTTGTC CTCTATCCTG TTGCCGATGC CCTTCATGTA 
GTTCATGGTC CTATCGGATG TGCCGCGTAT ACGTGGGACA TCCGGGGGGC CGTGTCTTCC 
GGCCCGGAAC TGCACAGGTT GAGCTTCTCG ACCGACCTGA AAGAGATGGA CGTTATCTAT 
GGCGGAGAAA AGAAATTACA CCAATCACTC ACTGAACTTA TCGCACAGTA TCAACCGAAA 
GCAGCGTTTA TTTACTCGAC CTGCATCATC GGACTTATAG GCGACGATAT TGACGCGGTA 
TGTAAAAAAG TTTCACAGGA AACCGGCATT CCTGTTCTTC CCGTTCACTC TGAAGGGTTC 
AAAGGCACAA AAAAAGACGG CTATAAAGCC GCCTGTGACT CACTGATGAA GCTCGTCGGC 
ACCGGATCGA CAGAAGGTAT CGGAAAATAC AGCATTAACA TTTTAGGAGA ATTCAATCTC 
GCAGGCGAAG CCTGGATCAT CAAAAAATAC TACGAAGAAA TGGGTATTGA GGTCGTTGCC 
ACAATGACAG GCGACGGCAG GGTTGACGAT ATCCGGCGCT CACACGGAGC ATCGCTCAAT 
ATCGTCCAGT GCTCGGGATC TATGGTGAAG CTGGCGAAAA TGATGGAAGA AAAGTACGGC 
ATCCCCTACC TGAGGGTCTC CTATTTCGGA ATAGAAGATA TGAGTATGGC GCTCTATGAC 
GTCGCCAAAC ATTTCAGCGA CAACCCGGCG ATTCTTGATG CAGCCAAAAA ACTTGTCAAC 
CGTGAGGTCA GCGAACTCTA TCCGCGTCTG CAGCACTTCC GTCAAGCGCT GGAAGGCAAA 
AAAGCCGCAA TCTATGTCGG TGGAGCATTT AAAGCCTTCT CGCTGATCAA AGCCCTGAAT 
TCCGTAGGAA TGAGCGTCGT ACTTGCAGGA TCACAGACCG GCAACAAAGA CGATTATGAG 
GGACTCAAAG AGATGTGCGA AGAAGGGACC GTTATCGTCG ATGACTCCAA TCCGGTTGAA 
CTCTCCAAAT TCGTACTTGA AAAAGAAGCC GATCTCCTCA TAGGCGGCGT TAAGGAACGG 
CCAATCGCAT ATAAACTCGG TATCGGATTC TGCGACCACA ATCATGAACG CAAAATTCCC 
CTGGCCGGTT TTGTCGGCAT GTACAACTTT ATCCTGGAGG TTTACAATTC CGTCATGAGC 
CCGGTCTGGC AGTTTGCTCC GAGAAAAGGA GGATTATCAT GA

Protein sequence

MEKIGILEGR EKQVYEKKGD SAAIDIKCET TSLSGSVSQR ACVFCGSRVV LYPVADALHV 
VHGPIGCAAY TWDIRGAVSS GPELHRLSFS TDLKEMDVIY GGEKKLHQSL TELIAQYQPK 
AAFIYSTCII GLIGDDIDAV CKKVSQETGI PVLPVHSEGF KGTKKDGYKA ACDSLMKLVG 
TGSTEGIGKY SINILGEFNL AGEAWIIKKY YEEMGIEVVA TMTGDGRVDD IRRSHGASLN 
IVQCSGSMVK LAKMMEEKYG IPYLRVSYFG IEDMSMALYD VAKHFSDNPA ILDAAKKLVN 
REVSELYPRL QHFRQALEGK KAAIYVGGAF KAFSLIKALN SVGMSVVLAG SQTGNKDDYE 
GLKEMCEEGT VIVDDSNPVE LSKFVLEKEA DLLIGGVKER PIAYKLGIGF CDHNHERKIP 
LAGFVGMYNF ILEVYNSVMS PVWQFAPRKG GLS