Gene PCC8801_4268 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4268
Symbol
ID	7105323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	4481249
End bp	4482904
Gene Length	1656 bp
Protein Length	551 aa
Translation table	11
GC content	45%
IMG OID	643477248
Product	extracellular solute-binding protein family 5
Protein accession	YP_002374347
Protein GI	218248976
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAACT GTTTTTCCTT AAATTTTAAA CAATTGGGGC GATTAGGACG ATTTTTTGCC 
CTGTTTAGTC TATGTTTTTT CTTAACGGTC GCTTGTAACC AACAAAAGAC TAGCGAACCT 
ATCCAGGGAA CGCCACCGAA TAGCGATCGC ATCACCATCG GAACCATTGC CAAACCCCGC 
ACCATCGATC CCGCCGATAG CTACGAATTA TCCGGCTTAA TCCTTATTTA TAACCTCACC 
GATACCCTTT ATAGCTACGA ACTGGGAACC ACAACCCTAA AGCCCCAATT AGCCGCCGAA 
ATGCCTAAAA TTAGTGCCGA TGGCTTAACC TATACCATCC CCCTCCGTCA AGGAGTCACC 
TTCCACGACG ACACTCCTTT TAACGCCGAA GCGATGGTAT TTTCCTTAGA ACGCTTCATG 
AAAAATGGCG GTAAACCCTC CTTCTTGTTA GCAGACACCA TCGACACGGT AAAAGCCACA 
GGAGACTATG AAATCACCAT TACCCTGAAA AAACCCTTTT CCGCCTTCCC TGCCCTATTA 
GCCTATCCTG GGGCTGCTGC GGTGTCTCCA AAAGCCTACG AAATTGGGGC AGGAAAGTTT 
CAACCCGATC GCTTAGTGGG AACCGGTCCT TACAAATTAG CAGCCTTTAG CAGTGATTCA 
GTGCAGTTAG AGGTCTTTGA CAAATACTGG GGAGAAAAAC CGAAAAACCA GGGAATTAAC 
CTACAAATTT ACCCCGATAA CCCCGCTAAT TTATTTAATG CCTTTAAAAC AAAAGCCGTT 
GATGTCGCCT ATCAATCTTT GTTAGCGCAA CAGATCAAAG CCCTCAAAGA ACAAGCCACT 
CAAGGACAGG GACAAGTTAT TGAAGCCCCA GGAACCGCGA TCGCCTTTAT GGCACTTAAT 
CTTAACAGTG ACTCCCTCAA AAATAAACCC GTTCGTCAAG CGATCGCCGC TTTAATGAAC 
CGTCAATTAC TCATAGATCG GGTTTTGCAA GGTCAAGGAG AACCCCTCTA CAGTATGATT 
CCAAACGCCT TTGAAGCCTC ACAACCCGTC TTTAAAGACC GTTATGGGGA TGCTAATAAA 
GAAGAAGCCC TAAAATTCCT GACAGAAGCG GGATATTCTG CCGAGAAGCC CGTCCCTGTT 
GAAATCTGGC ACACTTCTAG TTCCACCAAT GCCAGTCAGG TTGCTGCTAT TCTCAAAGAA 
TTAGGCAAAC GGGACTTAGG AGGAGTCATT GAATTTCAAC CCAATAGTAT TGCCTCAGCA 
GCCTTTTTTA AGAACCTTGC CCAAGGATTA TATCCCGCGA CTTTATCCAA TTGGTATCCC 
GACTTTTTGG ATGCCGATAA CTATATTTAT CCCTTCTTAC ATTGTGCCAA AGGCAGCCCA 
GAACAAGGGT GTAGTGAAGG AGGATCGCAA GCCCAAGGGT CATTTTATTA CAGCGATCGC 
ATCAATGAAT TAATCGATCA ACAACGTCGT GAAGCCAACC CCGAAAAACG CCAAGCGATC 
TTCAAAGAAA TTCAAACTAT CTTAGCCGAA GATGTTCCTT TTATTCCCCT CTGGCAAACC 
AAAGAATATG CCTTTGCTCA AAATAATATT AATGGGATCA CAATTAATCC TAGTCAAACT 
TTTCCTTTTT GGACAATTAG TCGGGGAACA AAGTAA

Protein sequence

MINCFSLNFK QLGRLGRFFA LFSLCFFLTV ACNQQKTSEP IQGTPPNSDR ITIGTIAKPR 
TIDPADSYEL SGLILIYNLT DTLYSYELGT TTLKPQLAAE MPKISADGLT YTIPLRQGVT 
FHDDTPFNAE AMVFSLERFM KNGGKPSFLL ADTIDTVKAT GDYEITITLK KPFSAFPALL 
AYPGAAAVSP KAYEIGAGKF QPDRLVGTGP YKLAAFSSDS VQLEVFDKYW GEKPKNQGIN 
LQIYPDNPAN LFNAFKTKAV DVAYQSLLAQ QIKALKEQAT QGQGQVIEAP GTAIAFMALN 
LNSDSLKNKP VRQAIAALMN RQLLIDRVLQ GQGEPLYSMI PNAFEASQPV FKDRYGDANK 
EEALKFLTEA GYSAEKPVPV EIWHTSSSTN ASQVAAILKE LGKRDLGGVI EFQPNSIASA 
AFFKNLAQGL YPATLSNWYP DFLDADNYIY PFLHCAKGSP EQGCSEGGSQ AQGSFYYSDR 
INELIDQQRR EANPEKRQAI FKEIQTILAE DVPFIPLWQT KEYAFAQNNI NGITINPSQT 
FPFWTISRGT K