Gene Cyan8802_2034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_2034
Symbol
ID	8391350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	2052780
End bp	2054048
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	36%
IMG OID	644980015
Product	extracellular solute-binding protein family 1
Protein accession	YP_003137760
Protein GI	257059872
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.718211
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.822994
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAGAT TATTCCAACT AATTTGGCAG CGATCGCGTC TATATTCTCT CTTCCTAGCC 
AGTTTTCTGA TTCTATTAAC CGGGTGTCAG TTGAATCTGT TTGAGCAGCC ATCTCTTATG 
CGAGGAAGGC TGTTAATTTA CCATCCCTTT CAAGGAGAAA ATGGTATAAT TTTTGAGAAT 
TTCCTCGATA ATTTTGAACA ACTTTACCCC GAGGTTCAAC TATTAAGTGA ATATATTAGA 
GAGGACAGAC TTTCTCAACA GTTTATCTCA AAATCAAGAG CCGGGTTAGG AGCAACAGTC 
TTGATTGATT TTGCACGACA TATTCCTCAA TTAGTTAAAA GTAATAGTAT TCAACCTCTT 
GAAGATAAAA ATATAGATAC ATCTAGGTTT TTATCTTCAA ATATCATTCA ATCTCGCTAT 
CAGGGTAAAA TTTATGGTAT TCCTCTGGTT TCTCAGGTGC GTGTACTTTG CTACAATCTA 
GCTAAACTTC AACCTAATTC TAATACTCAA GATCCTATCC TTACTCAACC TCCTTTTGGG 
TTAGAAGGAC TATTAACACG AGCCAAAAAA GGCTACTCTG TGGGGATGGT TTCCAGTTTT 
GAAGATACGT TTTGGGGGTT AGGCATTTTT GGGGCGAAAT TCTTCGATAA TCAAGGATTC 
ATTAACCCCC AGTTAGAAGG GTGGGGAAAG TGGTTAGAAT GGCTTAAAAA AGCGGAAACT 
CAACCTAATT TTATACTCAG TCGCAATCGA GAGATTCTTC ATGAAGCTTT TGCTAAAGGG 
AAGTTGACTT ACTACGTTTG TAATTCTGAT GAAATTGGAG ATTTAAAAAA TATCTTGAAA 
GAGAACTTAC AGATAGTTTT TCTCCCTGGA GAACCTGACC ATCCGGCAAC CCCTTTGCTT 
TATACCATAG TGATGATGGT CAATAATAGT GCTAGTTCCC ATGAAACTGA ATTAGCTTTA 
CAATGGGCAC AGTTCATGAC TAACCCTGAA CAACAATTAA AAGCATTAAT AGGTTCTTTA 
AACTTTATTC CTACTAACCA AAAGATCAGT GTTAATCAAC AGTTATTACC CATAGAAGCC 
ACTTTACATA AACAGTCTAA AATGGCACTC ACTATTCCCA TCGACTCTAT AGAAAAAATT 
CTTAAAATTT TTAAAGAAGG GGAGATTGTA TATCAAAAAG CTATGGCTGG AGATCTGACT 
TCATCTCAAG CTGTTCAGGA ACTAACTGAT ATTATTAAAA CACAATTGAA TTTTCAAACA 
AGGAACTAA

Protein sequence

MSRLFQLIWQ RSRLYSLFLA SFLILLTGCQ LNLFEQPSLM RGRLLIYHPF QGENGIIFEN 
FLDNFEQLYP EVQLLSEYIR EDRLSQQFIS KSRAGLGATV LIDFARHIPQ LVKSNSIQPL 
EDKNIDTSRF LSSNIIQSRY QGKIYGIPLV SQVRVLCYNL AKLQPNSNTQ DPILTQPPFG 
LEGLLTRAKK GYSVGMVSSF EDTFWGLGIF GAKFFDNQGF INPQLEGWGK WLEWLKKAET 
QPNFILSRNR EILHEAFAKG KLTYYVCNSD EIGDLKNILK ENLQIVFLPG EPDHPATPLL 
YTIVMMVNNS ASSHETELAL QWAQFMTNPE QQLKALIGSL NFIPTNQKIS VNQQLLPIEA 
TLHKQSKMAL TIPIDSIEKI LKIFKEGEIV YQKAMAGDLT SSQAVQELTD IIKTQLNFQT 
RN