Gene PCC8801_1444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1444
Symbol
ID	7103647
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1516043
End bp	1517095
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	43%
IMG OID	643474520
Product	extracellular solute-binding protein family 1
Protein accession	YP_002371657
Protein GI	218246286
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTAAAG TATCGAGAAG AGTGTTTTTA GGAACGGGTG CAGCAGCAGC AACAGTTGCC 
TTAAGTCCGT TAATTCATGT CAAAGAAAGT TCCGCCCAAA ACCGAGAGGT TAACGTCTAT 
TCATCGCGTC ATTACAATAC CGATAGTCGC TTATATGAAA ACTTCACCCG TCAAACCGGA 
ATTAAGGTTA ATTTAATTGA AGGAGAAGCC GATCCGTTAA TAGAAAGAAT CAAAAGTGAA 
GGAAAAAATA GTAAGGCAGA TATCTTAATT ACTGTTGATG CAGGACGCTT ATGGAGAGCG 
GATCAAGCAG GAATTTTTGC CCCTGTTAAC TCTAAGATTT TACAACAAAA AATCCCCGCT 
TCTCTCAGAC ATCCTAAAGG GCATTGGTTC GGGTTTAGTA AGCGATTGCG CGTTATTATG 
TATAGCAAAG CAAGGGTCAA TCCATCCCAA CTTTCAACCT ATGAAGATCT CGCTAATCCG 
AAGTGGAAAG GAAAGGTCAT TACTCGTTCT TCTACTAATA TTTATAGCCA ATCTCTTTGT 
AGTTGGATGA TCGCCGTTAA TGGACAAGGG GCAACGGAAA AATGGTGTCG AGGATTAGTG 
GCTAATTTTG CCCGTTCTCC CCAAGGTAAT GATACTGCCC AAATTGAAGC ACTCGCAGCA 
GGGGTAGCTG ATTTAGCCCT AGTTAATACC TATTATTTGG CGAATTTAAT CGATAGTAAA 
GACGAGAAAA AACGGGCGAT TGGTCAACAA GTCGGGGTAT TTTTCCCCAA TCAAAAAGGA 
CGGGGAACTC ACGTCAATAT CAGTGGCGGA GGTTTGGTCA AAACTGCCCC AAATCGCAAC 
GCAGCCGTTA AATTCCTCGA ATATCTCGTC AGTCCTCAAG CACAAACTTT CTTTGCCCAA 
GGAAACCTCG AATATCCCGT GGTTTCAGGG GTACAGATTG ATCCCGTTTT AGCGAAATTT 
GGAAAATTTA AGTCTGATAT CGCCAGGGTA GACGATTATG GACTTAATTT GGCCAAGGCT 
GTCCAGGTGA TGGATCGGGC GGGGTGGAAA TAG

Protein sequence

MTKVSRRVFL GTGAAAATVA LSPLIHVKES SAQNREVNVY SSRHYNTDSR LYENFTRQTG 
IKVNLIEGEA DPLIERIKSE GKNSKADILI TVDAGRLWRA DQAGIFAPVN SKILQQKIPA 
SLRHPKGHWF GFSKRLRVIM YSKARVNPSQ LSTYEDLANP KWKGKVITRS STNIYSQSLC 
SWMIAVNGQG ATEKWCRGLV ANFARSPQGN DTAQIEALAA GVADLALVNT YYLANLIDSK 
DEKKRAIGQQ VGVFFPNQKG RGTHVNISGG GLVKTAPNRN AAVKFLEYLV SPQAQTFFAQ 
GNLEYPVVSG VQIDPVLAKF GKFKSDIARV DDYGLNLAKA VQVMDRAGWK