Gene PCC8801_2137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2137
Symbol
ID	7103400
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	2210839
End bp	2213096
Gene Length	2258 bp
Protein Length	752 aa
Translation table	11
GC content	47%
IMG OID	643475194
Product	glycoside hydrolase starch-binding
Protein accession	YP_002372325
Protein GI	218246954
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2755] Lysophospholipase L1 and related esterases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATCGAT TTCAGATAAC GGCACACACG CAGGTAGGAG AATCCATCGC TATTGTGGGG 
AACATCCCTG AGTTTGGCGA ATGGGATGTC ACCAAATGCT TAGAACTACG CACCAGTGGC 
GATCGCTATC CTCTGTGGTG GGTAGAGACG GATATCGACC TCAGTCCATT TTTAGATCCC 
GCCAACGACC AAAGAATCGA GTATAAATAT GTGCGATTAT ACCCCGATGA AGGCGTGGAA 
TGGGAAACCC AGGGGTCAAA CCGTTGGCTA CCCCTTGACC CTCAGCCGGG GTCTTTTACC 
ATCACCGTAG AAGATGGCCA ATTTGGTCGC GTACAACCGT GGCCCTTTGG TTACTGGGAT 
GCACCGAGGA CACCTCTACC CAAAGCTAAA GACGGACTAA AAATTGTGGT CATCGGCAGT 
TCCGTCGCTG AAGGATACAA CGCTTGGCTC TTTAAAGGGT GGGTTTGGCG GTTAGAACAA 
GCCTTAAATG CAAAATACGG ACATCAGGTG GTCAATGTTT CCCAGTTAGG AACGAACATT 
ACGACCACTA TGGAACGGTT TTCTCGCGTT GTTCCTCCCG AAAAGCCCGA TATTGTCATT 
ATTTCCCTCT CTCTGGGCAA TGAAGGACTG GCCTATTGTC CTCCCCACGA ACGACCAGCC 
GTTCAGCGAC GCTTTGAAAC CGGATTACAG GAACTGGTCA AAATGACCCA AGACTTGGGA 
GCCATGCCCA TGTTAGGAGC AGTCTATCCC CACGGAGACT ATACCCCTGA CCATAACTGG 
TTCCTACAGG ATACTCACCA GCGAATGCGA AGCTGGGGGA TTCCCCTTCT GAATTGGTTA 
GCCGCCTTAA ATAACGGCCA AGGTCGCTGG AAACCGGGAA TCTCCTTTGA ACCCCCTCAC 
CCGAATACGG AAGGACACCG TCTGATGTAT GAAGCGATCG ATCTGAGTCT CTTCAATGTT 
ACTCAGGCCG AATTAGCGCA AAAAAAAAAG GACTCCAGCC AGCAAAAGAC GAAATAATCC 
TTTATTCCGA CGAAAAGGGT TTTCAAATCG TTAGTGAGAG ACATCAAAGA AGTTTACGAG 
TCATCAATAC CTCAGAACAT CCCTACACCC TTACTCCTTC GTGGACGGAA CTGCAACAGC 
CCCTACAAAC AACAGGAGTC TTAAAACCAG GGATCTATCT CTCTAAAACC GTCGCTCAAT 
CAATCCCACA GTCTTTTTGG GTTCGAGACG ACGGAAGCAT TGAAACAACC CTTAATATCT 
TGCCTTCTGT CGATCTGGAA TATTCCCCTG CTTTCGAGTT CTTTTCGCCT AAAATTTCCG 
AAATTTTATT TTACGACGGG CATTTAGGGA TTTTAAAACA AGGCGATTTT CTCGTCCGAG 
TCATCAACGA ATCTGACCAC GAATACAGCA TCCAACCCAT GTGGAAAGAG GTGTGTCATG 
CCTTTAAACA GATGCCGAGT GGGGTCTACG TCGATGTTGT TGAACCCGAT ACCCCTTTTC 
GTACCATGAT GATCGGTCAA GATGGACTAG AAAGTCGCGT TAAAGTCCCT CCCAAGTCGG 
CGGTATGCTT TGAATATCAA TGCAAGTTAT CGGATATCAG CCGTGTGGCG ATTCTGCCAT 
TAGGCGATCG CTGTGCTATT CGCATGGTGT TGCACAAAAT GGAATACGAT GGACCCGCCT 
ATCCCTTTGA CCTAACCCGG ACGACGAATC TCAGCGATGT AGCTGATATT ATTGAAAGTG 
GGTTTTGGGA TATGTGGAAC CCCGCTTTTC TCGACTACAA CGATGAAGCT GGCCGAATTT 
ACCATACTAA ATGGACGGGT TTATCTTTTG CCCACGAAGT CGAAGAGACA GACGACCCAA 
TTAACGATAT GTCCCCAGTC TATGAACGTA TGCGGACTCG TTATGAGGCG CGTTCGGCTC 
GTTTTTGGTA CACCATTAAT CATTGCGATG AAGTCCTGTT TATTCGGACG GGTTTTGCAA 
CGCGCAGCCA GGTCATCGAT TTAGCCGATA AACTTGCAGA AAAATGTCAG GGAAAACCCT 
TCCGCATTAT GATTATTTCG GCTCAGTCTA GCGACGAGTT TGCCGGACTT CCTAATGTTT 
TGCATTACAG TATGTATTTT AATCCCGATC AAATGTACGA AGATTTAGGC TACTGGATGC 
ACTGTACTAA TGTCATGCGC TCTATCCTTG ACTCGGTGGG AATATCGAGT AAAAATCTCT 
TTTGGTGTCC CCCTAAAATC CCCAAAAGTT CTATTTAG

Protein sequence

MYRFQITAHT QVGESIAIVG NIPEFGEWDV TKCLELRTSG DRYPLWWVET DIDLSPFLDP 
ANDQRIEYKY VRLYPDEGVE WETQGSNRWL PLDPQPGSFT ITVEDGQFGR VQPWPFGYWD 
APRTPLPKAK DGLKIVVIGS SVAEGYNAWL FKGWVWRLEQ ALNAKYGHQV VNVSQLGTNI 
TTTMERFSRV VPPEKPDIVI ISLSLGNEGL AYCPPHERPA VQRRFETGLQ ELVKMTQDLG 
AMPMLGAVYP HGDYTPDHNW FLQDTHQRMR SWGIPLLNWL AALNNGQGRW KPGISFEPPH 
PNTEGHRLMY EAIDLSLFNV TQAELAQKKK GLQPAKDEII LYSDEKGFQI VSERHQRSLR 
VINTSEHPYT LTPSWTELQQ PLQTTGVLKP GIYLSKTVAQ SIPQSFWVRD DGSIETTLNI 
LPSVDLEYSP AFEFFSPKIS EILFYDGHLG ILKQGDFLVR VINESDHEYS IQPMWKEVCH 
AFKQMPSGVY VDVVEPDTPF RTMMIGQDGL ESRVKVPPKS AVCFEYQCKL SDISRVAILP 
LGDRCAIRMV LHKMEYDGPA YPFDLTRTTN LSDVADIIES GFWDMWNPAF LDYNDEAGRI 
YHTKWTGLSF AHEVEETDDP INDMSPVYER MRTRYEARSA RFWYTINHCD EVLFIRTGFA 
TRSQVIDLAD KLAEKCQGKP FRIMIISAQS SDEFAGLPNV LHYSMYFNPD QMYEDLGYWM 
HCTNVMRSIL DSVGISSKNL FWCPPKIPKS SI