Gene PCC8801_0042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0042
Symbol
ID	7105309
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	44334
End bp	45485
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	38%
IMG OID	643473158
Product	polysaccharide biosynthesis protein
Protein accession	YP_002370305
Protein GI	218244934
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3754] Lipopolysaccharide biosynthesis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTTAA ACTCAGAACC TATTAATTCT TCAGAATCCC CATCTGTTTA TTCCGAATCT 
TTTGTTGATA ATATTCGTTT AATTGCTTTC TATTTACCTC AATTTCATCC TATTCCTGAA 
AACGATCAAT GGTGGGGCAA AGGATTTACT GAATGGACGA ATGTTACTAA AGCTAAACCA 
CAGTTTCCAG GGCATTATCA GCCCCATTTA CCAGCCGATT TAGGCTTTTA TGATTTACGC 
CTTCGAGAAG CTCGACAAGC ACAAGCAGAC TTAGCTAGGG AATATGGAAT TTACGGCTTT 
TGTTATTATC ATTATTGGTT TAATGGTCAA CGAATTTTAG AACGTCCCTT TAATGAAGTG 
TTGCAATCAG GAGAGCCAAA TTTCCCCTTT TGTTTGTGTT GGGCTAATGA AAGTTGGACA 
AGAAGATGGG ATGGACAAGA GCAAGAAATT TTGATGAAAC AGGTTTACAC AGAGCAAGAT 
GATCAACAAC ATATTCGTTA TTTAGCTGAA GCTTTTCAAG ACCCAAGATA CATTCGGGTT 
AAGGGAAAAC CCTTATTTTT AGTTTATCGT GCTAATCAAC TACCTAACCC CTTGAAAACT 
ACTGAAATTT GGCGAGAAGA AGCCCAAAAG TTAGGCGTAG GAGAAATCTT TTTGGCTAGG 
GTTGAAAGCT TTTTAGATGA ACACAATGAT CCTCGAAAAA TCGGATTTGA TGCAGCCGTT 
GAATTTCAAC CAGATTGGGG AAAACTCGGC AAAAAATTGC AATCACGAAA GCGTTGGGAA 
ATTGCTAGAA AATATGGGTT AGCTCATCAA TCGTATGGGA TTCATAATAT CTTTGACTAT 
CAAACGATGG TTACCCGAAT GCTTTCCAAA CCTATTGTTA ATTATCCACG ATTTCCTGGT 
GTTACTCCAT CTTGGGATAA TACAGCACGT CGTCAAGTTG CTGCAACTAT TTTGAAAGAT 
TCTACCCCTG AAATTTACGA ATATTGGCTC AAAGCAGTTA TTGAAAAAAC AATCTCCAAA 
CCGGAACTTC CTCCTATCAT TTTTATCAAC GCTTGGAATG AATGGGCTGA GGGAAATCAT 
TTAGAACCCT GTCAACGGTG GGGAAGGAGT TATTTAGAAG CAACCCAACG AGCCATTAAA 
CAATTTTCGT AG

Protein sequence

MTLNSEPINS SESPSVYSES FVDNIRLIAF YLPQFHPIPE NDQWWGKGFT EWTNVTKAKP 
QFPGHYQPHL PADLGFYDLR LREARQAQAD LAREYGIYGF CYYHYWFNGQ RILERPFNEV 
LQSGEPNFPF CLCWANESWT RRWDGQEQEI LMKQVYTEQD DQQHIRYLAE AFQDPRYIRV 
KGKPLFLVYR ANQLPNPLKT TEIWREEAQK LGVGEIFLAR VESFLDEHND PRKIGFDAAV 
EFQPDWGKLG KKLQSRKRWE IARKYGLAHQ SYGIHNIFDY QTMVTRMLSK PIVNYPRFPG 
VTPSWDNTAR RQVAATILKD STPEIYEYWL KAVIEKTISK PELPPIIFIN AWNEWAEGNH 
LEPCQRWGRS YLEATQRAIK QFS