Gene Cyan8802_2086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_2086
Symbol
ID	8391403
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	2098646
End bp	2099737
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	44%
IMG OID	644980065
Product	extracellular solute-binding protein family 3
Protein accession	YP_003137809
Protein GI	257059921
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.256894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAATC GAACCTGGTC TATGACTAAA CAACCGTTTT TAGTTCTAGC AACGCTCTTG 
TTACTGTCTC CTTTAACCGC TTGTGGTGGA GGACAACCGA CAACCGAAAC GACCCCCGCA 
CAAGAGAGTT CATCAAAAGT CAGTGGGAGT CGTTTAGCGA CGATCAAAGA ACGGGGAACC 
CTCATTTGTG GGGTTAACGG AGAAGTCCCT GGATTTAGCT TTGTTGATGA ACAAGGCCAA 
TATTCTGGGT TAGATGTGGA TATGTGTCGG GCGATCGCGG CTGCTTTATT TGATGACCCC 
TCTAAGGTTG AATATCGCAA ACTCAGTGCC CAAGAACGCT TAACGGCTGT TCAGTCCGGC 
GAAGTGGACG TTCTTAACCG TAATACCACC TGGACGATGA GTCGTGATAC TGCCGTGGGA 
ATGGAATTTG CTCCTACAGT TTTCTATGAT GGTCAAGGAA TCATGGCAAC TAAAGCCAGT 
GGAGCGAATA CATTAAAAGA TTTAACGGGT AAATCGATTT GTGTCCTAGC AGGAACCACA 
ACGGAACAAA ATTTAGCCGA TCAGATGCGT AAAGAAGGGG TAACGGATTA TAATCCCGTC 
GTTTCCGATG ATGTGGATGC GCTCTATGCA GCCTATCAAG AAGGTCGCTG TGAGGCGGTT 
ACGTCTGATC GCTCGCAATT AGTCGCTCGT CGTTCTATTT TCCCCAAAAA AGACGATCAT 
GTCATCTTAG ATGTGGTTAT GTCTAAAGAA CCTTTAGGAC CTGTGGTAGC TGATGGGGAC 
TCCACTTGGT ATGATGCCGT TAAATGGATT ACTTTTGCCG TTATTCAAGC CGAAGAATTT 
GGCATTACTT CCCAAAATTT AGCCACCTTT GAATCGACTG AAGATCCTAA TATTAAACGA 
TTTTTAGGAA TCGATGATAA ATTAGGCGAA GACATGGGAT TACCGAACGA TTTCGCCGCT 
CGTATTATTA AGCACGTTGG TAATTATGGA GAAATTTATG AGCGTAACAT CGGTAAACCG 
TTAGGATTAG AACGGGGTCA AAATCAACTT TGGACTAATG GCGGTTTACT TTATTCTCCT 
CCTTTTCGAT AG

Protein sequence

MFNRTWSMTK QPFLVLATLL LLSPLTACGG GQPTTETTPA QESSSKVSGS RLATIKERGT 
LICGVNGEVP GFSFVDEQGQ YSGLDVDMCR AIAAALFDDP SKVEYRKLSA QERLTAVQSG 
EVDVLNRNTT WTMSRDTAVG MEFAPTVFYD GQGIMATKAS GANTLKDLTG KSICVLAGTT 
TEQNLADQMR KEGVTDYNPV VSDDVDALYA AYQEGRCEAV TSDRSQLVAR RSIFPKKDDH 
VILDVVMSKE PLGPVVADGD STWYDAVKWI TFAVIQAEEF GITSQNLATF ESTEDPNIKR 
FLGIDDKLGE DMGLPNDFAA RIIKHVGNYG EIYERNIGKP LGLERGQNQL WTNGGLLYSP 
PFR