Gene Daro_1501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1501
Symbol
ID	3568953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	1617197
End bp	1618597
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	63%
IMG OID	637679969
Product	nitrogenase MoFe cofactor biosynthesis protein NifE
Protein accession	YP_284720
Protein GI	71907133
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01283] nitrogenase molybdenum-iron cofactor biosynthesis protein NifE

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCCA GCGAAATCCA GGCCCTGCTC GACGAGCCGG CCTGTAGCCA CAACAAGAAG 
GAAAAGTCCG GCTGCGCCAA GCCCAAGCCT GGCGCCACGG CGGGCGGCTG TTCCTTCGAC 
GGCGCGCAGA TCGCGCTGCT GCCGATTGCC GATGTTGCCC ATATCGTCCA TGGACCGATT 
GCCTGTGCCG GTTCCTCCTG GGACAACCGC GGAACGCGCT CTTCCGGCGT CACGCTGTAC 
AAGATCGGCA TGACCACCGA TCTGTCGGAA ACCGATGTGG TGATGGGCCG TGGCGAGAAG 
CGGCTATTTC ATGCCATCAA GCAGGCGATC GACAGCTATT CGCCCTCGGC CGTCTTCATC 
TACAACACTT GCGTCACGGC GCTGATCGGT GACGATGTCG GCGCCGTCTG CAAGGCGGCC 
ACCGAACGCT GGGGGACGCC GGTTGTGCCG GTCGATGCGG CCGGTTTCTA CGGCACCAAG 
AACCTCGGCA ATCGGCTGGC TGGCGAGGCG ATGTTCAAGC ATGTGATCGG TACCGCCGAG 
CCTGCCCCTG CCGCACCGCG CGCCGACGGC CTGCCAACCT ACGACGTCAA TTTGATCGGC 
GAATACAACA TCGCCGGTGA GTTCTGGCAT GTCGCACCGC TATTTGATGA ACTTGGCCTG 
CGCATTCTTT GCACACTGTC CGGAGACTCG CGTTTCCATG AGGTGCAGAC CATGCACCGC 
GCCAGGGTGA ACATGGTCGT CTGTGCCAAG GCATTGCTCA ACGTGGCACG CAAGATGGAA 
GACAACTTCG GCATTCCCTT CTTCGAGGGT AGCTTCTACG GCGTGCAGGA TGTCTCCAAT 
GCCTTGCGCG ATTTCGCCCG GCTGATCGGC GACCCGGATT TGACGGCGCG TACCGAGGCG 
GTGATTGCCC GCGAGGAAGC CAAGTCGCAT GCCGCGCTGG AACCCTGGCG TGATCGCCTG 
CGCGGCAAGC GGGTGCTGCT CTACACCGGC GGCGTCAAGT CGTGGTCCAT CGTCTCGGCC 
TTGCAGGATC TGGGCATGAA GGTGGTAGCG ACCGGCACCA AGAAATCGAC CGAAGAGGAC 
AAGGCGCGCA TCCGCGAGTT GATGGGTGAC GATACCAAGA TGATCGACGA CGGCAGCCCA 
AAGGCCTTGC TCTCGACTTA CCACGAGTAC AAGGCCGACA TCCTGATCGC CGGTGGCCGC 
AACCTCTACA CCGCCTTGAA GGCGCGCATT CCTTTCCTCG ACATCAATCA GGAACGCGAA 
TTCGGCTACG CCGGCTACGA CGGCATGGTC GAACTGGCCC GCCAGCTGGC GCTATCGATG 
GAAAGTCCGG TCTGGGCCGC CGTGCGCAAG CCAGCGCCGT GGGCGGCGCA AAAGGGGCCC 
GGAACGGTGG TCGTGGCCTG A

Protein sequence

MKASEIQALL DEPACSHNKK EKSGCAKPKP GATAGGCSFD GAQIALLPIA DVAHIVHGPI 
ACAGSSWDNR GTRSSGVTLY KIGMTTDLSE TDVVMGRGEK RLFHAIKQAI DSYSPSAVFI 
YNTCVTALIG DDVGAVCKAA TERWGTPVVP VDAAGFYGTK NLGNRLAGEA MFKHVIGTAE 
PAPAAPRADG LPTYDVNLIG EYNIAGEFWH VAPLFDELGL RILCTLSGDS RFHEVQTMHR 
ARVNMVVCAK ALLNVARKME DNFGIPFFEG SFYGVQDVSN ALRDFARLIG DPDLTARTEA 
VIAREEAKSH AALEPWRDRL RGKRVLLYTG GVKSWSIVSA LQDLGMKVVA TGTKKSTEED 
KARIRELMGD DTKMIDDGSP KALLSTYHEY KADILIAGGR NLYTALKARI PFLDINQERE 
FGYAGYDGMV ELARQLALSM ESPVWAAVRK PAPWAAQKGP GTVVVA