Gene PCC8801_1784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1784
Symbol
ID	7101847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1869530
End bp	1870414
Gene Length	885 bp
Protein Length	294 aa
Translation table	11
GC content	42%
IMG OID	643474852
Product	Fe-S cluster assembly protein NifU
Protein accession	YP_002371986
Protein GI	218246615
COG category	[C] Energy production and conversion [O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0694] Thioredoxin-like proteins and domains [COG0822] NifU homolog involved in Fe-S cluster formation
TIGRFAM ID	[TIGR02000] Fe-S cluster assembly protein NifU

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGGGAAT ATACAGATAA GGTAATGGAG TTCTTCTACA ACCCGCGTAA TCAAGGAACG 
ATTACAGAAA AGCAAGAAGG ACAAGCCATT ACAACTGGAG AAGTCGGAAG CATTGCCTGT 
GGTGATGCCC TAAGATTACA CCTCAAAATT GATGAAGCGA CTCAAATTAT TCTTGATGCT 
AGATTTCAAA CTTTTGGTTG TGCCTCTGCC ATTGCTTCCT CCTCCGCCTT GACGGAATTA 
TTAGTTGGAA AAACCCTCGA CGAAGCCCTC AGTTTAACCA ATAGAGAAAT TGCTGAATTT 
TTAGGGGGTT TACCCGAAGA GAAAATGCAC TGTTCTGTGA TGGGACAAGA AGCCTTAGAA 
GCTGCTATTT TTAATTACCG AGGCATTCCT TTAGACCACC ATGAAGATGA CGAAGGAGCC 
CTGATTTGCA AATGTTTTGG AGTAACTGAT GCGAGGATTC GTCGTGTTAT TATCGAAAAT 
GATCTGACCA CAGCCGAACA AGTTACCAAC TATGTTAAAG CCGGTGGAGG ATGTAGTTCT 
TGTCTGTCTG ATATCGATGA TATTTTAGCC GATATTACTC AAGAAAAAGC CACCGCCGTC 
ACAGCAGCCA CCGAAGTTGT TCAAAGTAAA TTAACTCCCC AAAAACCCCT AAATAACTTA 
CAAAAAATCA CCCTCATTCA ACAAATTCTC GACGAAGAAA TTAAACCAGC CTTGGCAAAA 
GATGGAGGAG ATGTAGAGTT ATTTGATGTC GAAGGAGATT TGGTCAAAGT GATATTACAA 
GGAGCCTGTG GTTCCTGTGC CAGCAGTACC CAAACCTTAA AAATGGGAAT CGAAGCCAGA 
TTACGAGAGC GTGTTTCTCC TGAGTTAACG GTTATTTCTG TGTAA

Protein sequence

MWEYTDKVME FFYNPRNQGT ITEKQEGQAI TTGEVGSIAC GDALRLHLKI DEATQIILDA 
RFQTFGCASA IASSSALTEL LVGKTLDEAL SLTNREIAEF LGGLPEEKMH CSVMGQEALE 
AAIFNYRGIP LDHHEDDEGA LICKCFGVTD ARIRRVIIEN DLTTAEQVTN YVKAGGGCSS 
CLSDIDDILA DITQEKATAV TAATEVVQSK LTPQKPLNNL QKITLIQQIL DEEIKPALAK 
DGGDVELFDV EGDLVKVILQ GACGSCASST QTLKMGIEAR LRERVSPELT VISV