Gene Rpal_5090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5090
Symbol
ID	6412784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	5476822
End bp	5477808
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	67%
IMG OID	642714975
Product	Fe-S cluster assembly protein NifU
Protein accession	YP_001994054
Protein GI	192293449
COG category	[C] Energy production and conversion
COG ID	[COG0822] NifU homolog involved in Fe-S cluster formation
TIGRFAM ID	[TIGR02000] Fe-S cluster assembly protein NifU

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCGGTC TCGGCAAGTT TGACCATCAC TTCTCTACCT CCGCTAACGC TGGTCCGCTG 
CCGCAGGCCA ATGCGGTCGG CCGGTTCGGC AGCATCGGCT GGGGCGATGC CGTCAAGTTG 
ATGTTGAAGG TCGAGCCCGA CGACGGGCGG ATCGCGCAGG CCCGCTTCCA AGCGTTCGGC 
TGTAGCTCGG CGATCGCCGC CTCTGCGGCG CTCACCGACA TGATCACCGG CAAGACCATC 
GACGAAGCCA GCGGCATCAG CGCCGCGGCG ATCGCTGACT ACCTGGGCGA CCTGCCGCGT 
GAGCGGATGT ATTGCGCGGT GATGACTTTC GAGGCCCTGC AGCAGGCGAT TGGTTCGTTT 
CGCGGCAAGG CCGCAGTGGC CGAGGCCGAT GCGCCGCCGG CCTGCAAGTG CCTCGGCGTC 
GGCCAGATGA TGATCGAGCG CACCATTCGC TTCAACCGGC TGACCAGCCT GGACGACGTC 
ACCGCCTACA CCAAGGCCGC CGGCAGCTGC AGCACCTGCT TCAAGCAGAT CGAATCCCTG 
CTGGCGCGGG TCAACGCCGA GATGGTCGAG GACGGCCTGA TCCCGGCCGA AGACGCCTAC 
CGCATCGGCT CGGCGACGCC GCGCGCCACC GAGCTGAAGC CCCATGGCGC GCCGGCTCCG 
GCCGCCAACA TCTTTGCCGC CAAGGCCACG CCTGCGCATC TGCGCCCGAT TGCCAAAGCT 
GCGCCGCGTC CGGCGACGCC GCCGGCTGGA CTGGTCGATG CGCCGCCGCA GGAGGCGCTG 
ATCGCCGAAG CGGTCGAAGA ACTGCGCCCG CATCTGCAGC GTGACGGAGG CGATTGCGAG 
TTCGTCAGCC TCGATGGCAA CATTGTCTAT GTCCGGTTGT CCGGCAATTG CGTCGGATGC 
CAGCTCTCGT CGGTGACGCT GTCGGGCGTC CAGGCCAAGC TTGTCGAAAA GTTCGGCCGG 
CCGCTACGTG TGGTGCCGGT GTCATGA

Protein sequence

MLGLGKFDHH FSTSANAGPL PQANAVGRFG SIGWGDAVKL MLKVEPDDGR IAQARFQAFG 
CSSAIAASAA LTDMITGKTI DEASGISAAA IADYLGDLPR ERMYCAVMTF EALQQAIGSF 
RGKAAVAEAD APPACKCLGV GQMMIERTIR FNRLTSLDDV TAYTKAAGSC STCFKQIESL 
LARVNAEMVE DGLIPAEDAY RIGSATPRAT ELKPHGAPAP AANIFAAKAT PAHLRPIAKA 
APRPATPPAG LVDAPPQEAL IAEAVEELRP HLQRDGGDCE FVSLDGNIVY VRLSGNCVGC 
QLSSVTLSGV QAKLVEKFGR PLRVVPVS