Gene PCC8801_4382 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4382
Symbol
ID	7104834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	4604209
End bp	4605219
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	39%
IMG OID	643477361
Product	glycosyl transferase family 2
Protein accession	YP_002374460
Protein GI	218249089
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAGC AGTTAATTTG CTCCCTATCA GATGACCTCA AGCAACTCAA GAAATTACCT 
GAGATATCCA TTGTTGTTCC TATTTACAAC GAAGAAGAAA CCTTGATAAA ATTGGTAAAA 
AACATTGCTA ATTATTTGGT CAATTATTCC TCCTATGAAA TTATTTGTGT TGATGACGGT 
TCTCAAGATG GAACAACAGA AATTTTAAAA AGATTAGCGA AAGAACGCCA TGACTTAATT 
GGAATTATTC TGAGGCGAAA TTACGGTCAA ACTCCGGCTA TGGCAGCAGG ATTTGAATAT 
GCTAAAGGTC AAATAATTGT CACCCTAGAT GGAGATTTAC AAAACGATCC TGCTGATATT 
CCCCAATTAA TTGCTAAACT CAATGAAGGA TACGATCTAG TGAGTGGTTG GCGTAAAAAT 
CGACAAGATG ATACCTTAAC TCGTTTACTT CCTTCAAAAA TTGCCAATTG GATTATCGCT 
AAAGTCACGG GGGTGAATCT TCATGACTAT GGTTGCTCCT TAAAAGCCTA TCGCGCTGAA 
TTAATCGCCG ATATGAACCT CTATGGAGAA CTCCATCGCT TTTTACCAGC CTTAGCCTAT 
ATCGAAGGTG CAAGAATTGC CGAAATTCCC GTCGGACACC ATCCCCGTCG CTATGGAAAA 
AGTAAATATG GCTTAGGGCG AACCTTTCGG GTCATTATGG ATTTATTGAC CGTTTTCTTT 
ATTAAAAAAT TCCTAACCCG TCCGATGCAC GTCTTCGGCT CATTTGGCTT AGGTTCAATA 
CTCTTAGGAA TACTATTAGG AGCTTATTTA ACCTATCTTA AATTAGGCTT AGGGGAAAGT 
ATTGGCCAAC GCCCCTTGCT GATTTTAGCG GTACTATTGG TCTTAACTGG GGTACAATTA 
TTGAGTTTTG GTTTACTAGC AGAATTGGTC ATGCGAACCT ATCATGAATC TCAAAAACGC 
CCGATTTATC GCGTGCGAGA AATCATTGGG AAAACATTGA ACAGGGAATA G

Protein sequence

MEKQLICSLS DDLKQLKKLP EISIVVPIYN EEETLIKLVK NIANYLVNYS SYEIICVDDG 
SQDGTTEILK RLAKERHDLI GIILRRNYGQ TPAMAAGFEY AKGQIIVTLD GDLQNDPADI 
PQLIAKLNEG YDLVSGWRKN RQDDTLTRLL PSKIANWIIA KVTGVNLHDY GCSLKAYRAE 
LIADMNLYGE LHRFLPALAY IEGARIAEIP VGHHPRRYGK SKYGLGRTFR VIMDLLTVFF 
IKKFLTRPMH VFGSFGLGSI LLGILLGAYL TYLKLGLGES IGQRPLLILA VLLVLTGVQL 
LSFGLLAELV MRTYHESQKR PIYRVREIIG KTLNRE