Gene M446_3582 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_3582
Symbol
ID	6134183
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	3999288
End bp	4000277
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	71%
IMG OID	641643749
Product	Fe-S cluster assembly protein NifU
Protein accession	YP_001770397
Protein GI	170741742
COG category	[C] Energy production and conversion [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0694] Thioredoxin-like proteins and domains [COG0822] NifU homolog involved in Fe-S cluster formation
TIGRFAM ID	[TIGR02000] Fe-S cluster assembly protein NifU

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.370448
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0119473
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGGACT ATTCCGACAA GGTCAAGGAC TACTTCTTCA ATCCGAAGAA TGCGGGCCTG 
CTCGCGGAGG CGAACGCGGT CGGCGAGGTC GGGGCGATCG CCTGCGGCGA CGCGCTCAAG 
CTGATGCTCA AGGTCGATCC GGAGACGGAG GTGATCACCG AGGCCAAGTT CCAGACCTTC 
GGCTGCGGCT CGGCCATCGC CTCCTCCTCG GCGCTGACCG AGATCGTCAT CGGCAAGACG 
GTCGACGAGG CGCTGGCCAT CAGCAACCAG GACATCGCGG ATTTCCTCGG CGGCCTGCCG 
CCCGAGAAGA TGCACTGCTC GGTGATGGGC TACGAGGCGC TGCAGGCCGC GGTCGCCCAT 
TACCGCGGCG AGACGGTCGA GGACGACCAT GAGGAGGGCG CCCTCGTCTG CAAGTGCTTC 
GGCGTCGACG AGGGCATGAT CGAGCGGGCG GTGCGCGCCA ACGGCCTGAC CACGCCCGAG 
CAGGTCACCT TCTACACCAA GGCGGGCGGC GGCTGCCTGA CCTGCTTCGA GGCGATCGAG 
GGCACGCTCG CCCGCGTCAA CCGGGAGATG GTCGAGGCCG GCCTGCTCGC GGCGGGCGCC 
GCTTACCGGA TCGGGGCGGC GGATCCCCGC AGCCTGAAGA GCAAGCCCCG GCTCGCCCAG 
GCATTCGGGG ATCCCCCGGC GCCGGGCGCC AGTGCGGCGC CGGGCGCCGG CACCAGGGCG 
TTCCCCTCGC CCCAGAGCCC GCTCGCGCCC GCCGCGCTCA CCCCGATGCA GCGCATCCGG 
CTGATCGACA AGGCGATCGA GGCGTTGCGG CCCGTGCTCC AGCGCGACGG GGGCGACTGC 
GAACTCGTCG AGGTGGAGGG CACCGTGGTG AGCGTGCGGC TCTCGGGCGC CTGCGTCGGC 
TGCCAGATGG CGAGCGTCAC CGTGGCGGGC GTGCAGCAGC GCCTGATCGA GGCCCTCGGC 
CTCCCGCTCC GGGTCGTCCC GGTGAAGTAG

Protein sequence

MWDYSDKVKD YFFNPKNAGL LAEANAVGEV GAIACGDALK LMLKVDPETE VITEAKFQTF 
GCGSAIASSS ALTEIVIGKT VDEALAISNQ DIADFLGGLP PEKMHCSVMG YEALQAAVAH 
YRGETVEDDH EEGALVCKCF GVDEGMIERA VRANGLTTPE QVTFYTKAGG GCLTCFEAIE 
GTLARVNREM VEAGLLAAGA AYRIGAADPR SLKSKPRLAQ AFGDPPAPGA SAAPGAGTRA 
FPSPQSPLAP AALTPMQRIR LIDKAIEALR PVLQRDGGDC ELVEVEGTVV SVRLSGACVG 
CQMASVTVAG VQQRLIEALG LPLRVVPVK