Gene PCC8801_2029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2029
Symbol
ID	7104794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	2101552
End bp	2102541
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	43%
IMG OID	643475088
Product	hopanoid-associated sugar epimerase
Protein accession	YP_002372220
Protein GI	218246849
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR03466] hopanoid-associated sugar epimerase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTATTA AAGCATTTAT CACAGGAGGA ACCGGATTTA TTGGGGCGAA TTTAGTTCGG 
TTATTATTAG ACCAAGGTTA TGAAGTCCGC GCATTAGTGC GTTCCCAAAG CCGTTTAGAT 
AACCTAAAAG GGCTTGATAT TGAATTAGTA GAAGGAGATC TCAATGATGC CAATTTATCA 
GAAAAAATCA GAGGAACTAA CGTCTTATTT CATGTAGCCG CCCACTATTC CCTTTATCAA 
CGCGATCGCC ACCAACTTTA TCAAAGTAAT GTTTTAGGAA CCCGTTCCGT TTTAAAAGCA 
GCCCAACAAG CCGGAATTGA ACGTACCATT TACACCAGTT CCGTCGCTGC TATTGGCGTT 
GGAAACCCAT CAGAAATCGT CAACGAAACC CATCAAAGTC CCGTTGAAAA ATTAGTAGGA 
CACTACAAAA AATCAAAATA TTGGGCTGAA CAAGAAGCCA AAAAAGCCGT TCAAAAAGGA 
CAAGATATCG TCATCGTTAA CCCCAGTACC CCCATCGGTC CGTGGGACAT CAAACCCACT 
CCAACAGGAG AGATTATCCT GCGGTTTTTA CGCCGTAAAA TGCCCGCCTA TGTAGATACT 
GGATTAAATT TAATTGACGT GCGAGACGTA AGTTGGGGTC ATCTGTTAGC CTTAGAAAAG 
GGTAAATCTG GAGAACGCTA TATTTTAGGT CATCAAAATC TCAGTCTCAA AGCCCTATTA 
GACCAATTAT CCAGCCTCAC TGGATTAAGT GCACCCCAAA GAACTATCCC CTTGTGGCTA 
CCCCTAACCA TGGCATGGAT TGACGAATCC CTTCTTACTC CTTTAGGAAA AACCCCGTCC 
CTTCCCTTAG ATGGCGTTCG GATGTCTAAG TCACCGATGT ATTACGATGG ATCAAAAGCC 
GTCAAAGAAT TAGGGTTGCC CCAATCACCT ATTAAAAAAG CCCTCCAAGA TGCAATTAGT 
TGGTTTATCG ATCAAGGCTA TTCTTATTAA

Protein sequence

MAIKAFITGG TGFIGANLVR LLLDQGYEVR ALVRSQSRLD NLKGLDIELV EGDLNDANLS 
EKIRGTNVLF HVAAHYSLYQ RDRHQLYQSN VLGTRSVLKA AQQAGIERTI YTSSVAAIGV 
GNPSEIVNET HQSPVEKLVG HYKKSKYWAE QEAKKAVQKG QDIVIVNPST PIGPWDIKPT 
PTGEIILRFL RRKMPAYVDT GLNLIDVRDV SWGHLLALEK GKSGERYILG HQNLSLKALL 
DQLSSLTGLS APQRTIPLWL PLTMAWIDES LLTPLGKTPS LPLDGVRMSK SPMYYDGSKA 
VKELGLPQSP IKKALQDAIS WFIDQGYSY