Gene PCC8801_2108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2108
Symbol
ID	7104341
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	2178184
End bp	2179665
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	44%
IMG OID	643475165
Product	alpha amylase catalytic region
Protein accession	YP_002372296
Protein GI	218246925
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTAATA ATCTTTATCC CTCTCTTTAT CAAATTAATA CCCGTGTTTG GCTCAATCAA 
CTCTCTGGCC AACTCGGTCG TCCAGCTACC CTAGATGACA TTCCCGATAC AGAACTCGAC 
AAACTCGCTA ATTTTGGGTT TGATTGGGTT TATTTTTTGA GTGTTTGGCA AACGGGAGAG 
GCCGCACGTC AAGTATCCAT GAGTAATCCC CAATGGTTAG CCGAATATCA CGAACTGTTA 
CCCGATTTGC AAGATGAAGA TATTGTCGGC TCAGGATTTG CTATCAAAGA TTATACCTTA 
AATACCCGTT TAGGGACATC AGCCTCATTA ATTCGTCTGC GCGATCGCCT CCATCAACGA 
AACCTCAAAT TAATGTTAGA TTTCGTTCCT AATCATACTG CTCCCGATCA TGCTTGGGTT 
AACTCCCATC CTGAGTATTA TCTTGCTGGA AATGAAAGTC TATTGGCTGA ACAGCCCCAA 
AATTATACTA AAATTGACTT GCCTGAAGGA TCAAGAATTT TCGCCTATGG ACGAGATCCC 
TATTTTGATG GTTGGCCAGA CACCCTACAA CTCAATTATG GCAATCGGGA CCTGCAAACA 
GCCCTAATCA ACGAATTATT AAGGATTTCT CAATGGTGTG ATGGCTTACG CTGTGATATG 
GCCATGCTAG TCTTACCGGA AATTTTTCAA CGAACTTGGG GTATTACGAC TGAACCCTTC 
TGGCCTAAAG CCATCCCCCA AATTAAAGAA CAACAGCCCA ATTTTGTCTT TATGGCCGAG 
GTTTATTGGG ATATGGAATG GACGCTGCAA CAACAGGGGT TTGACTATAC CTATGATAAG 
CGATTATACG ATCGCCTGAG AGAACAGATT TCCCGTCCCA TTCGAGAGCA TTTTTGGGCT 
GATCTTGACT ACCAAAACAA ATCAACCCGT TTTTTAGAAA ATCACGACGA ACCTCGCGCG 
GCTGCTACCT TTCCATCGGG TATTCACCAA GCAGCCGCCA TTTTGACCTT TTTCTGTCCA 
GGGTTGCGCT TTTTCCACCA AGGACAGTTA CAGGGATGGA CAAAACGCAT CTCGGTTCAC 
TTGGGACGGG GGCCAGACCA ACCCACTGAT CCTAACGTAG AACAGTTTTA TAGCCAATTG 
ATCGAAAGTT TACAGTTTAA GGCCTTTCAG GAGGGACAAT GGCAATTACT CGAATGTCAT 
CCCGCTTGGT CTGATAATTG GACGTGGGAC TGTTTTATTG CCTTTGCTTG GCAAGGAAAG 
GAAGAAGAAC AGGCGATCGT TGTGGTTAAT TATGCGGGAA ACCAAAGTCA AGGTTATATT 
TCCGTTCCTT GGTCAAATTT AGCTGGCCAA CACTTTCACC TGCAAGACAT GATGAGTGAT 
ACGGTTTACG AGGTTGAGGG TGATAATTTA TTTTCCCCCG GTCTTTATGT AGATTATTCC 
CCCTGGGAAT ATCATGTATT TAAGCTAGTT AAAAAAGGAT AA

Protein sequence

MSNNLYPSLY QINTRVWLNQ LSGQLGRPAT LDDIPDTELD KLANFGFDWV YFLSVWQTGE 
AARQVSMSNP QWLAEYHELL PDLQDEDIVG SGFAIKDYTL NTRLGTSASL IRLRDRLHQR 
NLKLMLDFVP NHTAPDHAWV NSHPEYYLAG NESLLAEQPQ NYTKIDLPEG SRIFAYGRDP 
YFDGWPDTLQ LNYGNRDLQT ALINELLRIS QWCDGLRCDM AMLVLPEIFQ RTWGITTEPF 
WPKAIPQIKE QQPNFVFMAE VYWDMEWTLQ QQGFDYTYDK RLYDRLREQI SRPIREHFWA 
DLDYQNKSTR FLENHDEPRA AATFPSGIHQ AAAILTFFCP GLRFFHQGQL QGWTKRISVH 
LGRGPDQPTD PNVEQFYSQL IESLQFKAFQ EGQWQLLECH PAWSDNWTWD CFIAFAWQGK 
EEEQAIVVVN YAGNQSQGYI SVPWSNLAGQ HFHLQDMMSD TVYEVEGDNL FSPGLYVDYS 
PWEYHVFKLV KKG