Gene Cyan8802_4444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_4444
Symbol
ID	8393796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	4594901
End bp	4595911
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	39%
IMG OID	644982353
Product	glycosyl transferase family 2
Protein accession	YP_003140064
Protein GI	257062176
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.412924
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAAGC AGTTAATTTG CTCCCTATCA GATGACCTCA AGCAACTCAA GAAATTACCT 
GAGATATCCA TTGTTGTTCC TATTTACAAC GAAGAAGAAA CCTTGATAAA ATTGGTAAAA 
AACATTGCTA ATTATTTGGT CAATTATTCC TCCTATGAAA TTATTTGTGT TGATGACGGT 
TCTCAAGATG GAACAACAGA AATTTTAAAA AGATTAGCGA AAGAACGCCA TGACTTAATT 
GGAATTATTC TGAGGCGAAA TTACGGTCAA ACTCCGGCTA TGGCAGCAGG ATTTGAATAT 
GCTAAAGGTC AAATAATTGT CACCCTAGAT GGAGATTTAC AAAACGATCC TGCTGATATT 
CCCCAATTAA TTGCTAAACT CAATGAAGGA TACGATCTAG TGAGTGGTTG GCGTAAAAAT 
CGACAAGATG ATACCTTAAC TCGTTTACTT CCTTCAAAAA TTGCCAATTG GATTATCGCT 
AAAGTCACGG GGGTGAATCT TCATGACTAT GGTTGCTCCT TAAAAGCCTA TCGCGCTGAA 
TTAATCGCCG ATATGAACCT CTATGGAGAA CTCCATCGCT TTTTACCAGC CTTAGCCTAT 
ATCGAAGGTG CAAGAATTGC CGAAATTCCC GTCGGACACC ATCCCCGTCG CTATGGAAAA 
AGTAAATATG GCTTAGGGCG AACCTTTCGG GTCATTATGG ATTTATTGAC CGTTTTCTTT 
ATTAAAAAAT TCCTAACCCG TCCGATGCAC GTCTTCGGCT CATTTGGCTT AGGTTCAATA 
CTCTTAGGAA TACTATTAGG AGCTTATTTA ACCTATCTTA AATTAGGCTT AGGGGAAAGT 
ATTGGCCAAC GCCCCTTGCT GATTTTAGCG GTACTATTGG TCTTAACTGG GGTACAATTA 
TTGAGTTTTG GTTTACTAGC AGAATTGGTC ATGCGAACCT ACCATGAATC TCAAAAACGC 
CCGATTTATC GCGTGCGAGA AATTATTGGG AGAACATTGA ACAGGGAATA G

Protein sequence

MEKQLICSLS DDLKQLKKLP EISIVVPIYN EEETLIKLVK NIANYLVNYS SYEIICVDDG 
SQDGTTEILK RLAKERHDLI GIILRRNYGQ TPAMAAGFEY AKGQIIVTLD GDLQNDPADI 
PQLIAKLNEG YDLVSGWRKN RQDDTLTRLL PSKIANWIIA KVTGVNLHDY GCSLKAYRAE 
LIADMNLYGE LHRFLPALAY IEGARIAEIP VGHHPRRYGK SKYGLGRTFR VIMDLLTVFF 
IKKFLTRPMH VFGSFGLGSI LLGILLGAYL TYLKLGLGES IGQRPLLILA VLLVLTGVQL 
LSFGLLAELV MRTYHESQKR PIYRVREIIG RTLNRE