Gene PCC8801_1664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1664
Symbol	lpxB
ID	7101635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	1748671
End bp	1749831
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	45%
IMG OID	643474735
Product	lipid-A-disaccharide synthase
Protein accession	YP_002371871
Protein GI	218246500
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0763] Lipid A disaccharide synthetase
TIGRFAM ID	[TIGR00215] lipid-A-disaccharide synthase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAATCT TTATTAGTAC GGGGGAAGTT TCTGGTGACT TACAGGGGTC GCTGTTAGTC 
GAGTCGCTTT ATCAACGGGC AGAAGCTAGG GGGATACCGC TAGAAATCCT GGCGTTAGGG 
GGCGATCGCA TGGCAGCGGC CGGGGCTAAA CTGTTGGGAA ATACGGCGGC GATCGGTTCT 
ATTGGCATTG TGGAGTCCCT CCCGTTTATT ATTCCCACTT GGTTGATGCA GCGTCGGGTT 
AAGCAGTATT TACGGGAGAA TCCTCCTGAT ATTTTGATTC TCATCGATTA TATGGGTCCA 
AATGCAGCTT TTGGCCAATA TGCGCGGAAA CATCTCCCCC AAGTGCCGAT TATTTATTAT 
ATTGCCCCTC AATCTTGGGT ATGGGCTCCC AATAGTAAAA CGATTCAACA ATTTGCTCAT 
ATTACTGACC TTCTGTTGGC GATTTTCCCT GAAGAAGCGA GATTTTTTGA AGAAAAAGGG 
GTTTCGGTTA AATGGGTGGG TCATCCCTTG CTCGATCGCA TGGCAAAGGC TCCCAGTCGA 
GAGGTGGCGC GTCAACGGTT AAATTTACAT TCGGATCAGT TGATTGTCGC GCTTTTTCCG 
GCTTCGCGCT ATCAGGAGTT AAAGTTTCAT CTGCCGTTGA TGTGTCAAGC AGCAGCCAAA 
TTACAGGAAA AAATCCCTAA TTTACACTTT TTGCTGCCTG TTTCCTTGAG TGAGTATCGC 
AGTACCATTG AAGAGACGGT GAAAGCCTAT CCGTTTTCGG TAACGTTGTT GGATGGTCAA 
GCGTTGGATG TGATGGCGGC GGCAGATTTT GCGATCGCTA AATCGGGAAC GGTGAATTTA 
GAGTTAGCTT TGCTAAAAAT TCCCCAATTA GTGTTATGTT TGGTCAATCC TTTAACGATG 
TGGATTGCTC GCAATATTCT TAAGTTTTCT ATTCCCTATA TGTCACCGCC AAATTTAGTG 
GTGATGGAGG CAATTATTCC CGAATTGTTG CAGGAAGAAG CAACTATAGA GCGCATTGTT 
CAAGAGTCTT TGGATTTATT ATTGAATACA GAACGCCGTC AAAAAACCTT GGCAGATTAT 
GAACAAATGT CTACTCTGTT AGGGGAGGTA GGAGTCTGTG ATCGTGTGGC TAATGAAATT 
TTAGATTATT CTAAAAGTTA G

Protein sequence

MRIFISTGEV SGDLQGSLLV ESLYQRAEAR GIPLEILALG GDRMAAAGAK LLGNTAAIGS 
IGIVESLPFI IPTWLMQRRV KQYLRENPPD ILILIDYMGP NAAFGQYARK HLPQVPIIYY 
IAPQSWVWAP NSKTIQQFAH ITDLLLAIFP EEARFFEEKG VSVKWVGHPL LDRMAKAPSR 
EVARQRLNLH SDQLIVALFP ASRYQELKFH LPLMCQAAAK LQEKIPNLHF LLPVSLSEYR 
STIEETVKAY PFSVTLLDGQ ALDVMAAADF AIAKSGTVNL ELALLKIPQL VLCLVNPLTM 
WIARNILKFS IPYMSPPNLV VMEAIIPELL QEEATIERIV QESLDLLLNT ERRQKTLADY 
EQMSTLLGEV GVCDRVANEI LDYSKS