Gene PCC8801_2165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2165
Symbol
ID	7103422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	2238905
End bp	2240065
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	38%
IMG OID	643475218
Product	N-acetylglucosamine-6-phosphate deacetylase
Protein accession	YP_002372349
Protein GI	218246978
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1820] N-acetylglucosamine-6-phosphate deacetylase
TIGRFAM ID	[TIGR00221] N-acetylglucosamine-6-phosphate deacetylase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAAAA ATCTTACAAT TATTAATGCT AAACTAGCTA ACTATCGAGA AAAACAACAA 
ATTGTTATCA ATTGTGCGGG TATTATTGAA GCAATTGAAC CAATTAAAAT AGAGTTTAAT 
CATCAAAACA ATCAGGATAT TTTTGATGTC AATGGAGATT ATTTATCCCT AGGAGGAATC 
GATTTACAAA TTAATGGAGG ATTAGGCTTA GCTTTTCCTG AAATTCAAGA AAAAGATCTC 
GATCTTCTCG ACAAAATTTG TGATTTTTTA TGGCAAGAAG GAATAGATGG TTTTTGTCCA 
ACAATAGTAA CAACATCCGT TAAAAATATT CAGCGATCGC TCTCAACTAT TGATCAATTT 
ATGAGCCTTC AAAAACAACA ATCACGACAA ACCAGTCAAA TCCTAGGGGT TCACCTAGAA 
GGACCTTTTC TTAACCCCCA AAAAAAGGGA GCTCATCCGG CTGAATATTT ATTAACTCCC 
AGTGTAGAAG CCATTAAATT CATTTTAGGA GACTATGCTC ATCGAGTAAA AATTATGACT 
TTAGCTCCCG AATTAGACCC CAGTGATGAA GTTATCCCGT ACCTAATCTC CCAAGGAATA 
GTTGTTAGTT TAGGTCATTC CCAAGCTACC GATCAAGACG CGAAAAAAGC CTTTCAATTA 
GGCGCGTCAA TGGTCACTCA TGCCTATAAT GCTATGCCTT CTTTACATCA TCGTCAACCT 
GGACTATTAG GCGAAGCTAT ACTCAATCCT AAGGTCTATT GTGGCTTAAT TGCAGATGGT 
CAGCACGTCT GTTTAACAAT GATTCAAATT TTATTGCGAT CGAGTTATTA TGAACAAGGG 
GTTTTTCTGG TTAGTGATGC TCTTTCTCCC ATTGGTTTAG GAGATGGCAT TTATCCTTGG 
GATGATCGCC AAATTGAAGT TAAACAAGGC ACTGCCAGAC TTGCTGATGG CACATTATCC 
GGAACAACTT GGCCTCTATT AGTCGGCGTA GAAAACTTAG TAAAATGGGG AATCTGTACA 
CCAGACGTTG CTATAGCCAT GGCCACAGAA TCCCCCAGAA AAGCGATTAA TTTGTCCGGC 
ATTTCCCCAG GGCAACCAGC TAATTTATTA CGCTGGAATT GGGATAAAAA GAACCAGAAA 
TTAAGTTGGG AAAGATTATA G

Protein sequence

MLKNLTIINA KLANYREKQQ IVINCAGIIE AIEPIKIEFN HQNNQDIFDV NGDYLSLGGI 
DLQINGGLGL AFPEIQEKDL DLLDKICDFL WQEGIDGFCP TIVTTSVKNI QRSLSTIDQF 
MSLQKQQSRQ TSQILGVHLE GPFLNPQKKG AHPAEYLLTP SVEAIKFILG DYAHRVKIMT 
LAPELDPSDE VIPYLISQGI VVSLGHSQAT DQDAKKAFQL GASMVTHAYN AMPSLHHRQP 
GLLGEAILNP KVYCGLIADG QHVCLTMIQI LLRSSYYEQG VFLVSDALSP IGLGDGIYPW 
DDRQIEVKQG TARLADGTLS GTTWPLLVGV ENLVKWGICT PDVAIAMATE SPRKAINLSG 
ISPGQPANLL RWNWDKKNQK LSWERL