Gene PCC8801_3566 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3566
Symbol
ID	7105791
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	3716261
End bp	3717484
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	37%
IMG OID	643476576
Product	glycosyl transferase group 1
Protein accession	YP_002373685
Protein GI	218248314
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTTG CTTACTTAAT TAACCAATAT CCTAAAATTA GTCATAGTTT TATTCGACGA 
GAAATTCTCG CTTTAGAAGA GTTAGGGTTG CCGATTACGC GATTTTCTAT TCGTTCGTGT 
GCAGAACCCC TAATTGATGA AGCGGATCAA CAAGAATTAG CCAAAACCAA CATTATTTTA 
GATGCGGGAA TCTTGGGGTT ATTAATCAGT CTGCTGAAAG TGGCTATCAC TAGACCTCAA 
CGTTGGATAG AGGCTTTTAT ATTAACCTTG AAATTGGGTT GGAAGTCTGA TAGAGGAATT 
TTGTTATACT GTGCTTATTT GGCGGAAGCT TGTGTTTTAA TTGACCATTT TTCTGAACTA 
CAGATATCTC ATTTTCATGC TCATTTTGGG ACTAATTCTA CCATGGTGGT TTTACTCAAT 
CATATTTTAG GAGGGGCTTC TTATAGTTTT ACTTTACATG GTCCTAAAGA ATTTGAAAAA 
GTAGAAGCGA TCGCTTTACC AGAAAAAATT AAACAAGCTG AGTTTGTTGT GGGGATTAGT 
TCCTATGGTC GCAGTCAACT TTGTCGCTGG TGTGACTATA CTAAATGGGA CAAAATCAAG 
GTTATTCATT GTGGTCTTGA TCAGTCTTTT TTTTCCTTGC CTCGCCAACC TATTCCTCAA 
GAAAATACAT TAGTTTGTGT TGGAAGATTA TGTGAGCAAA AAGGACAATT ATTATTAATT 
GAAGCAGCCA GTAAATTAGT GGCGCAAGGC TTTAAATTTA AGTTGATTTT AGTCGGAGAT 
GGACCTTTAA GAGAACCCAT TGAACAAGCG ATCGCTCGTT GGCAATTAAA AGAGACGGTT 
GAGATTACTG GATGGGCAAC TCAAGCAGAA GTTCAACAAC ATATTTTAGC CTCAAAAGCG 
ATGGTTTTAC CGAGTTTTGC CGAAGGACTC CCAGTGGTAT TAATGGAAAG TTTAGCCCTT 
GGTCGTCCTG TTATTAGTAC CTATGTTGCA GGGATTCCTG AATTAGTTAT TCCTGGTAAG 
TCAGGATGGT TAGTTCCCGC AGGATCAGTT AATCCTTTAG TTGATGCTAT GAAAAAGGTT 
TTAGAAACAC CAATTTCTCA ATTAGAGGAT ATGGGAAAAA CTGGAGCTAA CTATGTTAAA 
GAACATCATA ATGTTTTGAC TGAAGCCCAA AAACTCATGT TATTATTTCA AGAAGCAAAA 
CATTCAAATA AAAGTCCAGT TTGA

Protein sequence

MKVAYLINQY PKISHSFIRR EILALEELGL PITRFSIRSC AEPLIDEADQ QELAKTNIIL 
DAGILGLLIS LLKVAITRPQ RWIEAFILTL KLGWKSDRGI LLYCAYLAEA CVLIDHFSEL 
QISHFHAHFG TNSTMVVLLN HILGGASYSF TLHGPKEFEK VEAIALPEKI KQAEFVVGIS 
SYGRSQLCRW CDYTKWDKIK VIHCGLDQSF FSLPRQPIPQ ENTLVCVGRL CEQKGQLLLI 
EAASKLVAQG FKFKLILVGD GPLREPIEQA IARWQLKETV EITGWATQAE VQQHILASKA 
MVLPSFAEGL PVVLMESLAL GRPVISTYVA GIPELVIPGK SGWLVPAGSV NPLVDAMKKV 
LETPISQLED MGKTGANYVK EHHNVLTEAQ KLMLLFQEAK HSNKSPV