Gene PCC8801_4227 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4227
Symbol
ID	7103782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	4435581
End bp	4436954
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	44%
IMG OID	643477209
Product	O-antigen polymerase
Protein accession	YP_002374308
Protein GI	218248937
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID	[TIGR00947] probable bicarbonate transporter, IctB family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCCTG TTTGGCATCA ATTCACCCTT TCGGACTTCT CTCCCTACCG ATGGCTTGCT 
GCAAGCTATG TATACCGCAT CATCGGGTTA TTAGGACAAT GGAAACAAGG CAGTTTTCTC 
CTACAATGGG GAGAACCCCT AGGGGCACTA CTAATCAGCA TTGTCTTTAT TTTTGGACCA 
TTTATCTCCA CAGGGTTGAT CGGACTCTGG TTATTCGCCT TAGCAGCCTA TTGGGGACTG 
TTAACCCTTG CTGATAAAGG AAAACCGGGT ATTACCCCCA TTCATCTATT AGTCATGGTG 
TATTGGGGAA TGGCCGCGAT CGCCGTTGCC TTGTCTCCCG TCAAAACAGC AGCCTTGACC 
GGGTTTGTGA AATTAAGCCT ATATCTGCTA TTTTTTCTAC TATCAGCGCG AATTTTGCAA 
TCTCCTCGCC TCACCAATGG CTTAATTACA GTTGTCTTAC TGATCGGGTT GGTGGTGAGT 
TCTTATGGAG TCAGACAAAA CTTTTTTGGA GTAGAACAAT TAGCCACTTG GAACGATCCC 
ACCTCTGAAT TAGCCCAAGC AACCCGCGTT TATAGCTATT TAGGCAATCC TAACCTACTC 
TGTTCCTATT TATTCGCTGC GATCGCCCTT AGTATCGGCG CGGTTTTTGT TTGGCAAGGA 
CGACTCCCCA AAGCGTTAGC GGTAACGATG GTTCTGGTTA ATTCATCGTG TCTCTACTTT 
ACGGGAAGTC GAGGCGGTTG GATCGGCATG ATGGCTTTAT TGGTTAGCTT TGCTTTGTTG 
CTGTTTGTCT GGTTTCGGGA TAGTTTACCC CCCTTTTGGC GTAAATGGCT ATTACCTTTA 
GTTTTAGGGG GTTTTGCCGG GGTTGTTCTC GTTGCTATCG TCGCTTTAGA ACCGATAAGA 
TTACGAGTCA TGAGTATTTT TGCGGGACGA GAAGACAGTA GTAATAATTT TCGGATGAAT 
GTTTGGATGG CAGCGATCGA GATGATTAAA GATTATCCCC TAACGGGTAT TGGACCGGGG 
AATGCTGCTT TTAATAGTAT TTATCCCCGT TATATGAGTC CTAAATATAG TGCCCTAAGT 
TCCTATTCTA TCTTTTTAGA AAACGCTGTA GAAATGGGAT TAATTGGACT AAGTATTTTC 
CTTTGGTTGA TTATTGTGAC GGTTAATCAA GGAATCGCAC AAATGCAACG GTTACGGTTA 
GAAAATAATC GCCAAGGGAT TTGGTTAATT GCCGCGATCG CCGGAATGGC TGGTTTATTA 
GGACAAGGTT TAGTAGATAC GGTTTGGTAC CGTCCCCAAG TGAATATTTT CTGGTGGTTT 
TTAGTCGCTT TAATTGCCAG TCAATATCAG TTTAAAGGCA ATGGGGAACA GTAA

Protein sequence

MNPVWHQFTL SDFSPYRWLA ASYVYRIIGL LGQWKQGSFL LQWGEPLGAL LISIVFIFGP 
FISTGLIGLW LFALAAYWGL LTLADKGKPG ITPIHLLVMV YWGMAAIAVA LSPVKTAALT 
GFVKLSLYLL FFLLSARILQ SPRLTNGLIT VVLLIGLVVS SYGVRQNFFG VEQLATWNDP 
TSELAQATRV YSYLGNPNLL CSYLFAAIAL SIGAVFVWQG RLPKALAVTM VLVNSSCLYF 
TGSRGGWIGM MALLVSFALL LFVWFRDSLP PFWRKWLLPL VLGGFAGVVL VAIVALEPIR 
LRVMSIFAGR EDSSNNFRMN VWMAAIEMIK DYPLTGIGPG NAAFNSIYPR YMSPKYSALS 
SYSIFLENAV EMGLIGLSIF LWLIIVTVNQ GIAQMQRLRL ENNRQGIWLI AAIAGMAGLL 
GQGLVDTVWY RPQVNIFWWF LVALIASQYQ FKGNGEQ