Gene PCC8801_1079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1079
Symbol
ID	7102249
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1136508
End bp	1137590
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	48%
IMG OID	643474171
Product	rare lipoprotein A
Protein accession	YP_002371309
Protein GI	218245938
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0797] Lipoproteins
TIGRFAM ID	[TIGR00413] rare lipoprotein A

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAA AACTTTGGAG TGGACTAACA ACCACAGCAT TAACCACCGC TTTAGGAACC 
TCCGTTCTAC TCTGCGGTTC TTTCAATGGC TCGGTCGCAT CTGAGATGAA AGATAAAGCC 
GATGACCTAG GAAAACTTCT AGGAGTGACG ACGACTGCCA ACACAGAAAG TTCCGAGCAG 
TTAACAGCTT TAGCCCCAAA AGTTGTTAGT CTGGGTCAAG TAGATCTCCC TCAGGAGAAG 
CAAGACCCCG AAAAAGGAAA CATTCAAGGC GCGTTTTTAG GGAATACGGG AGAAAACCTG 
CTAGTGGAAC CTGAAAAACC CCTTTCAGCC ATCGCCACTC TCCATCCCCA TCAATGGAAA 
TACAGATTAG CCATTACCCT AAGAGTTCGG GAAATTCCCG TCCTAACCTT CGTCGGTTCT 
CAAGCGGATC TAGCCCAACT GAGAAATAAT CAAAATAACC CCGATGCTCC TCAAAAAGAC 
AGCGAGGTGA TGAAAAAGGC CAAAGCCTTA GCCCAACGGC TCAATGAACT TGCTCAGGAT 
GACACCTTTG AAGCCCAAAC CATCACCGTT AGCGAAATTC AAAAAAACAA AACCTATGGC 
ATCAAAATCG ATGGAAAAGA ACTCGTTCGA GTTGATGGCC AAACCATTCT ACCCGACACC 
ACCAACAATC TAGCAGCCGA TGCGCTACAA GTGACTAACC GTCTCCGTCG GTTGATGGGA 
GGTGCATCCC CGTTAACGGC TATTAATCAA GTTCCTGATG GACTCGCTGG CGTTGAAGGA 
CGAGTAACCA GCACCCGTAA AGGGATGGCC TCTTGGTACG GACCTGGATT TCATGGACGA 
CGAACCGCTA ACGGAGAACG GTACAATCAA AACGGTCTAA CGGCGGCTCA TAAAACCCTT 
CCTTTTGGAA CCCAAGTGAA GGTCACTAAC TTAAATAATG GTCGCTCGAT CACCGTTCGG 
ATCAATGATC GCGGTCCCTA CGCCCACGGA CGGATTATTG ACTTATCCAA AGGCGCGGCG 
CAAATTCTGG GCTTAGTCAG TAGTGGAGTA GCCCCGGTTC AAATTGAAAT CCTAGGGCGT 
TAA

Protein sequence

MNKKLWSGLT TTALTTALGT SVLLCGSFNG SVASEMKDKA DDLGKLLGVT TTANTESSEQ 
LTALAPKVVS LGQVDLPQEK QDPEKGNIQG AFLGNTGENL LVEPEKPLSA IATLHPHQWK 
YRLAITLRVR EIPVLTFVGS QADLAQLRNN QNNPDAPQKD SEVMKKAKAL AQRLNELAQD 
DTFEAQTITV SEIQKNKTYG IKIDGKELVR VDGQTILPDT TNNLAADALQ VTNRLRRLMG 
GASPLTAINQ VPDGLAGVEG RVTSTRKGMA SWYGPGFHGR RTANGERYNQ NGLTAAHKTL 
PFGTQVKVTN LNNGRSITVR INDRGPYAHG RIIDLSKGAA QILGLVSSGV APVQIEILGR