Gene Lferr_1235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Lferr_1235
Symbol
ID	6877208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidithiobacillus ferrooxidans ATCC 53993
Kingdom	Bacteria
Replicon accession	NC_011206
Strand	-
Start bp	1201588
End bp	1202979
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	55%
IMG OID	642789112
Product	nitrogenase molybdenum-cofactor biosynthesis protein NifE
Protein accession	YP_002219680
Protein GI	198283359
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01283] nitrogenase molybdenum-iron cofactor biosynthesis protein NifE

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.00336463
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTGCAGA ACAAAATCCA GGATGTTTTT AATGAACCGG GATGCAGCAA GAACCAGAGC 
AAGTCCGACA AAGAGCGCAA GAAAGGCTGC ACCAAGGCGC TGCAGCCGGG CGGCGCGGCC 
GGTGGTTGCG CTTTCGATGG GGCAAAGATT GCCTTGCAAC CCATTACCGA CGTCGCCCAC 
CTGGTCCACG GTCCCATCGC CTGTGAGGGC AACTCCTGGG ATAACCGCGG CTCCAAATCG 
TCTGGTTCGC AACTGTATCG CACCGGCTTT ACCACCGACA TCAATGAACT GGATGTGGTC 
TACGGCGGCG AAAAACACCT CTTCAAATCC ATCAAGGAAG TACTTGATAA ATACGATCCG 
TCGGCGGTAT TTGTCTATCA GACCTGCGTG ACGGCAATGA TCGGAGACGA TATCGAATCC 
GTCTGTAAAG CGGCCAGTCA AAAATTCGCA AAGCCCATTA TTCCGGTCAA TGCCCCCGGT 
TTTGTCGGCG CCAAGAATCT CGGCAACAAA CTGGCGGGAG AGGCCCTGCT GGATTATGTG 
ATCGGCACGG AGGAGCCAGA ATATAGTACG CCCTATGACA TCAATATCAT TGGCGAATAC 
AATCTTTCCG GTGAACTCTG GCAGGTCAAA CCACTTCTCG ATCATTTGGG GATCCGGGTA 
ACCTGTTGCA TCAGCGGTGA CGCCAAATAT CACGACGTGG CGCAATCCCA TCGTGCCAGG 
GCCAATATGA TGGTCTGCTC TAAATCCATG ATCAATATCG CCCGCAAAAT GGAAGAGCGT 
TATCAGATTC CGTTCTTTGA AGGGTCCTTT TATGGCATCT CCGATACCAC GGAGTCGCTC 
CGGGAGATCA CCCGCCTGCT GATCCAGCAG GGTGCCCCGG CAGAGCTCCA CGACCGCACC 
GAAGCGCTGA TCGCCCGGGA AGAGGCAAGG GCCTGGCAAC GTATCGCCGA ATACACCCAT 
CGCCTGCGCG GCAAACGGGT GTTGCTCTTT ACGGGGGGCG TCAAATCCTG GTCGGTGGTA 
TCTGCATTGC AGGAAGGCGG GATGGAAGTG GTGGGAACCA GCGTCAAGAA ATCCACCAGG 
GAGGACAAGG AAAGAATCAA GGAAATCATG GGTCAGGATG CGCATATGCT GGATGACCTG 
ACCCCTCGGG AAATGTACAA AATGTTTCAG GAGGCGCGTG CGGATGTGTT GCTGTCGGGC 
GGACGTTCAC AATTTGCGGC CCTCAAAAAC AAAATGCCCT GGGTGGACAT CAACCAGGAA 
CGCCATCAGG CCTATAACGG TTATGAAGGG ATGGTCAACC TGGTGAAACA GATCGATTTG 
GCCCTCTACA ATCCCATGTG GGCCTTGTTG CGCAAACCCG CGCCCTGGGA TATGGGGGAG 
GCACGGACAT GA

Protein sequence

MLQNKIQDVF NEPGCSKNQS KSDKERKKGC TKALQPGGAA GGCAFDGAKI ALQPITDVAH 
LVHGPIACEG NSWDNRGSKS SGSQLYRTGF TTDINELDVV YGGEKHLFKS IKEVLDKYDP 
SAVFVYQTCV TAMIGDDIES VCKAASQKFA KPIIPVNAPG FVGAKNLGNK LAGEALLDYV 
IGTEEPEYST PYDINIIGEY NLSGELWQVK PLLDHLGIRV TCCISGDAKY HDVAQSHRAR 
ANMMVCSKSM INIARKMEER YQIPFFEGSF YGISDTTESL REITRLLIQQ GAPAELHDRT 
EALIAREEAR AWQRIAEYTH RLRGKRVLLF TGGVKSWSVV SALQEGGMEV VGTSVKKSTR 
EDKERIKEIM GQDAHMLDDL TPREMYKMFQ EARADVLLSG GRSQFAALKN KMPWVDINQE 
RHQAYNGYEG MVNLVKQIDL ALYNPMWALL RKPAPWDMGE ART