Gene PCC8801_1736 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1736
Symbol
ID	7101809
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1821396
End bp	1822574
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	37%
IMG OID	643474803
Product	glycosyl transferase family 2
Protein accession	YP_002371939
Protein GI	218246568
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGTTA AGAATGAAGC CGAAAATTTA CCACCGTGTT TAGAAAGCGT TAGAAATGTT 
GTTGATGAAA TGGTGGTAAT GGATACAGGA TCAACGGATC AAACGGTAGA AATTGCTCAA 
CAATTTGGTG CAAAAGTTCC TTACTTTGAA TGGTGTAATG ATTTTGCGAT CGCTCGTAAT 
GCGGCTCTTG ATCATGTCAC AGGAGACTGG GTATTAATCT TAGATGCGGA TGAGAGATTA 
AACCCCAATG TTGTCCCTCA ACTCAAACAA GCCATCACCG ATGAAAATAG TTTAGTCATC 
AATTTAGTGC GTCATGAAAT TGGCGCATCT CAGTCTCCTT ATTCTTTAGT TTCGCGGTTA 
TTTCGGAAAC ATCCAGAGGT TGAGTTTTCC CGTCCCTATC ATGCCATTAT TGATGATAGT 
GTTAGTGAAT TGTTGAAAAA AGAAAGCCAT TGGAAAATTG TTGATTTACC CGCGATCGCA 
GTTTTCCATT ATGGTTATGA TCCCCAAACC ATTACCGCTT TGGATAAATA TACCAAAGCG 
CAAAAATCAA TGGAGGGATT TTTGGACAAA AATCCCAATG ATCCCTACAC TTGTAGTAAG 
TTAGGGGCAC TATACTTACA AATTGGCAAG GAAAAAGACG GCATTAAATT ACTCAAAAAA 
GGATTAAAAT CCAATAAAGC TGATGCTCAT GTTTTATTTG AATTACATTA TCATCTAGCT 
AATGCTTATA CCCGTGAAAA TGAATCAGAA AAGGCTATTA AGCACTACCA AAAAGCCATT 
GTTCAAGAAA TCATGGCTCC CTTAAAATTA GGTGCTTATA ATAATTTTGG AGTAGTATTA 
CAAAGCATCG ATGACTTTAA AAATGCTGCT AAAATGTACG AAACAACCCT ACAAATTGAT 
CCCAATTTTA TTACAGGCTA TTATAATTTA GCCATGACCT TGAGTAGCAT GGGACGCTTA 
GCAGATGCAG AAGCGGTTTA TAATAAATTG CTCTCTCTAA GTCCTAATTA TGCACCAGCC 
TATCAAAATT TAGGCGTTGT CTTATTTAAG TTAAAGAAAT TACCTGAAAG TTCAGCCGCG 
TTTAAAAAAG CCATGAGTCT TTATGAATCG CAAAATTATC ATCAAGAAGC GCAAAAACTC 
AAAGCTGGAC TACAAGAATT AGGCATTTGG GAAGAGTAA

Protein sequence

MIVKNEAENL PPCLESVRNV VDEMVVMDTG STDQTVEIAQ QFGAKVPYFE WCNDFAIARN 
AALDHVTGDW VLILDADERL NPNVVPQLKQ AITDENSLVI NLVRHEIGAS QSPYSLVSRL 
FRKHPEVEFS RPYHAIIDDS VSELLKKESH WKIVDLPAIA VFHYGYDPQT ITALDKYTKA 
QKSMEGFLDK NPNDPYTCSK LGALYLQIGK EKDGIKLLKK GLKSNKADAH VLFELHYHLA 
NAYTRENESE KAIKHYQKAI VQEIMAPLKL GAYNNFGVVL QSIDDFKNAA KMYETTLQID 
PNFITGYYNL AMTLSSMGRL ADAEAVYNKL LSLSPNYAPA YQNLGVVLFK LKKLPESSAA 
FKKAMSLYES QNYHQEAQKL KAGLQELGIW EE