Gene PCC8801_4441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4441
Symbol
ID	7104880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	4673662
End bp	4674561
Gene Length	900 bp
Protein Length	299 aa
Translation table	11
GC content	36%
IMG OID	643477420
Product	extracellular solute-binding protein family 3
Protein accession	YP_002374518
Protein GI	218249147
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGAAAA AAGTCACCCT ATTTATTTTA ACGTTAGTAT TAGCAACTAC TGGTCAAGCC 
TCCAGTTGGG CTGGTCAAGT ATTAGAGAAA ATTAAACAAA CTGGCGTTAT TAATGCAGGA 
ACTCGTAAGG ATGCTATTCC CTTTGGTTAT ATCAATGAAC AAGGAAAATG GGTTGGTTAT 
TCCCTCGATG TTCTAGAAAT TATTCGCAAA GATGTAGAGA AACAACTAGG AAAACCTATT 
AAACTGAACT TAGTAGAAGT GACAACACAA GATCGCTTTA ATAAGATTAA AGATGGTAGT 
ATTGATATTG AATGCGCCTC TACTACCTTT ACTTGGGAAA GGAATAAAAC CGTTGATTTT 
ACTGTTAGTT ATTTTGCCAG TGGAACTAAA GTCTTAGTTA AAAAAGATAG AGGGATCGGT 
TCTGTTGAAA CTTTAGCGGG TTTAAAAGTT GGTGTAATAC CAAAAACTAC CAATGAACAA 
GCTATTAAGA TTCAACACCC TGCCGCCCAA TTAGTGATGG TAAAAGACCG AAAAGAGGGA 
TTACAAAAGT TAGAAGCAGG AACTATAGAT GCTTTTGCCA GTGATGGAAT TCTCCTAGAA 
GGATTGAAAA AAGAATCGAG TAATCCTAAT AACTTAGAAG TGGTTCCAGA ATTTCCTTAT 
GCTTATGAAT CCTATGCTTG TATGATCCCT CAAGATCAGT CCCAGTGGCG AAATATGGTT 
AATTATAGTT TAGTCAAGTT TATGGAAGGA ATTGTCAGCG ATCAACCCGA ACCTGTGGCA 
ATTTATGAAA AATGGTTTGG AGAAGAAAAC GGGGTAACTC CCTATCCCCG TGATAGTATT 
AATGATTATT TTCAAGGAAT TGTTGATAGT CATGAATGGA TTCCTCTTGT AAATTATTGA

Protein sequence

MGKKVTLFIL TLVLATTGQA SSWAGQVLEK IKQTGVINAG TRKDAIPFGY INEQGKWVGY 
SLDVLEIIRK DVEKQLGKPI KLNLVEVTTQ DRFNKIKDGS IDIECASTTF TWERNKTVDF 
TVSYFASGTK VLVKKDRGIG SVETLAGLKV GVIPKTTNEQ AIKIQHPAAQ LVMVKDRKEG 
LQKLEAGTID AFASDGILLE GLKKESSNPN NLEVVPEFPY AYESYACMIP QDQSQWRNMV 
NYSLVKFMEG IVSDQPEPVA IYEKWFGEEN GVTPYPRDSI NDYFQGIVDS HEWIPLVNY