Gene PCC8801_0043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0043
Symbol
ID	7103709
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	45598
End bp	46611
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	40%
IMG OID	643473159
Product	UDP-glucose 4-epimerase
Protein accession	YP_002370306
Protein GI	218244935
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1087] UDP-glucose 4-epimerase
TIGRFAM ID	[TIGR01179] UDP-glucose-4-epimerase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGATA GACAGAGAGT AATCTTAGTT ACAGGGGGAG CAGGATATAT TGGATCTCAT 
GTGGTACGGG TTCTCTTAGA AGCTGGTTAT CAAGTGATTA TTCTTGATAA CTTAATCTAT 
GGACATCGAG ATCTGGTGGA AACCATTTTA AAAGTAGAGT TAATTATAGG GGATATTGGC 
GATCTCGCCC TACTAGATCA CCTATTTTCT AGCCATTCCA TTGAGGCAGT CATGCACTTT 
GCGGGGTTTG GTTATGTGGG TGAATCCATT CAACATCCTC AAAAATACTA CCGTAATAAC 
GTTGCCAATA CTCTAACCTT ATTAGAAGCG ATGAACCAAG CTTCTGTCAA TAAATTGGTC 
TTTTCTTCAA CCTGTGCTAC CTATGGAATC GCTCAAACGT TTCCCATTAC CGAAAAACAC 
CCACAGCAAC CAATTAATAC CTATGGCAAG AGTAAATTAA TGGTAGAACG GATGCTGAAG 
GATTTTTCCC AAGCTTATCC CCTCAAATAT GTCTGTTTTC GCTATTTTAA TGCAGCCGGA 
GCTCATCCAG ACGGATTGCT TGGAGAAGAT CATAACCCAG AATCCCATCT CATTCCCTTA 
GTACTGTTAA CAGCATTGGG AAAACGGGAG TCCATCTCCA TTTTTGGGAC AGACTATCCC 
ACCCCTGATG GGACTTGTAT TCGAGATTAT CTTCATGTGA TGGATATTGC CCAAGCCCAC 
CTTTTAGGGT TAGAGTATTT ATTAGCCAAT GAAACCTCTA ATGTGTTTAA TTTAGGTAAT 
GGTAATGGTT TTTCCATTCA ACAAGTGATT GATACGTCCA TGGACATAAC TCAAAGACCG 
ATTTCAGTCA ACCTAGTTAA TCGCCGTCCT GGTGATCCCC CGATTTTAGT GAGTAGTAAT 
GAAAAAGCAC GCCAAATTCT CGGATGGAAA CCCCAATATC CTAATTTAGA AGAAATTCTT 
GCTCATGCTT GGCAATGGCA TCAAAAACGT CATCAAATTA CTGATTTAAC TTAA

Protein sequence

MSDRQRVILV TGGAGYIGSH VVRVLLEAGY QVIILDNLIY GHRDLVETIL KVELIIGDIG 
DLALLDHLFS SHSIEAVMHF AGFGYVGESI QHPQKYYRNN VANTLTLLEA MNQASVNKLV 
FSSTCATYGI AQTFPITEKH PQQPINTYGK SKLMVERMLK DFSQAYPLKY VCFRYFNAAG 
AHPDGLLGED HNPESHLIPL VLLTALGKRE SISIFGTDYP TPDGTCIRDY LHVMDIAQAH 
LLGLEYLLAN ETSNVFNLGN GNGFSIQQVI DTSMDITQRP ISVNLVNRRP GDPPILVSSN 
EKARQILGWK PQYPNLEEIL AHAWQWHQKR HQITDLT