Gene PCC8801_1034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1034
Symbol
ID	7104252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1088376
End bp	1089545
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	37%
IMG OID	643474125
Product	glycosyl transferase group 1
Protein accession	YP_002371265
Protein GI	218245894
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAT TACAAATTGT GCCTTCAATT TCTTTGGTTT ATGGTGGACC TAGTCAAATG 
GTTTTAGGAC TATCGGAAGC ATTAGCTAAC CAAGGTATTG ATGTTACTAT CTTAACTACC 
AATTCCAATG GAGATGCCGG ACAACTCCCC CTAGATGTTC CTTTAGGCAT TCCTATCCAA 
CAAAAAGGCT ATCAAATTAT TTATTTTCCC TGTTCTCCTT TCCGTCGCTA TAAGTTTTCT 
TTGGATTTAT TAAAATGGTT AATCAACCAC GCTTCAAATT ACGATATTGC TCATATTCAT 
GCCTTGTTTT CTCCTATTAG TACGGCTGCT GCTACGGTTG CTCGCTATTG CCAATTACCT 
TATATTCTGC GACCTTTAGG AACCTTAGAT CCGGCTGATT TGCAGAAAAA AAAGCTTTTA 
AAAAAAATTT ATGGAAACTG TCTAGAAAGA GCCAATTTAT TAGGTTCTGT AGCAGTCCAT 
TTTACCACCG AGCAAGAGGC AAAAATTTCC CACCGTTACG GGGTTAAAAC CAATGATTTA 
GTTATTCCTT TGGGGGTTAA TTTACCTGAT TATTTTCCTC CTGTGGGACA CACTAGACAA 
CAATTAGGAA TTGCTAACGA TGTTCCTTTA GTCCTATTTA TGTCTCGTAT TGATCCCAAA 
AAAGGCTTGG AGTTACTGTT AGAATCAGCC GAAAAGTTAG CAAAAAAAGG CGTTGAATTT 
AAGTTAGTTA TAGCGGGGTC TAATCCTCAA GACCCGATTT ATGAGAAAAA AATTCAAGAA 
AAAATTACTA ATTCTTGTTT AGCAAAACAA ACAGCTATTA CAGGGTTTGT TCAAGGAGAA 
TTAAAGTTAG GTTTGCTACA AGATGCCGAT TTATTTGTGT TACCTTCCTA TTACGAAAAT 
TTCGGTATTG CTGTTGCTGA AGCGATGGCA GTAGGGACTC CCGTAGTCAT CTCTCAAGGG 
GTTTATATTT GGCCAGATGT TCAAAAAGCT GCTGCGGGTT GGGTGACATC AATGGATATA 
GAAGACTTAA CCAATACCTT AGATGAGGCA ATTTTTAATC AAAATGAAAG GCAAAAACGC 
GGACAAAATG CGCGTGAATT GGTTGTGAAA AACTATCTTT GGCCGACTAT TGCTCAACAA 
ATGATTAACG CTTATAGCCA CTTTCAATAA

Protein sequence

MKVLQIVPSI SLVYGGPSQM VLGLSEALAN QGIDVTILTT NSNGDAGQLP LDVPLGIPIQ 
QKGYQIIYFP CSPFRRYKFS LDLLKWLINH ASNYDIAHIH ALFSPISTAA ATVARYCQLP 
YILRPLGTLD PADLQKKKLL KKIYGNCLER ANLLGSVAVH FTTEQEAKIS HRYGVKTNDL 
VIPLGVNLPD YFPPVGHTRQ QLGIANDVPL VLFMSRIDPK KGLELLLESA EKLAKKGVEF 
KLVIAGSNPQ DPIYEKKIQE KITNSCLAKQ TAITGFVQGE LKLGLLQDAD LFVLPSYYEN 
FGIAVAEAMA VGTPVVISQG VYIWPDVQKA AAGWVTSMDI EDLTNTLDEA IFNQNERQKR 
GQNARELVVK NYLWPTIAQQ MINAYSHFQ