Gene PCC8801_3472 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3472
Symbol
ID	7101563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	3627033
End bp	3628184
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	40%
IMG OID	643476484
Product	hypothetical protein
Protein accession	YP_002373593
Protein GI	218248222
COG category	[S] Function unknown
COG ID	[COG4222] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACCCG TTGTCGTATT TGTTACCCAT TTGATTTTAG TCATTTTTTT AACTGCTTGT 
GGGATATCTC CTCAAGTTCT GGCCGAACAG CGATTATTTC CCCCCGTTTC CCTAGAATTT 
TTAGGAGAAT ACCAGCTACC GAAGCAAACC TTTGAGGGAA CCTCCGTTGG AGGACTATCG 
GGATTAAGCT ATGATCGTCA ACGCGATCGC TTTTATGCTT TATCAGATGA TCGCTCCCAA 
AAAGCACCCG CTCGATTTTA TAGCTTAAAA TTGTCAATCT CTGACGGAAA TGATGGCAAA 
ACCGAGATTA ACAGCATCAC GGTTGAAGCA GTGACGTTTC TGAAAAATTC ATCAGGGGAG 
TTTTATCAAG TTCAAACCAT TGATCCCGAA GGAATTGCTC TTTCTCCTAG GGATACAGTC 
TTTATTAGTA GCGAAGGAGT TCCCAAACGG GGAATTAATC CTTTTATTGG AGAATTTAAT 
CTCAAAACGG GTCAACTAGA ACGAACTTTA CCCCTACCTG AACGGTTTTT ACCGGGAAAG 
GAACCCGATG GAACTCCTCG CGGGGTGGAG GATAATTTAG GGTTTGAGTC TTTAACCATT 
AGTGCAACCA GTACCCTGAA AGATGATCCA TTTCGGTTAT TTACGGCAAA TGAATGGTCG 
TTAAGTCAAG ATACGGCTCA AACTGACCAA AAACAAAAAC CCCTGCGATT ACTGCATTAT 
GGCATTAATT CTATTGGATC TCCTGTACTG ATTGCTGAAC ATTTATATCT GTTGGATGAG 
ACTCCTAACG GGGTAGTTTC TAATGGGTTA ACGGATTTAT TGGCCTTACC TCAAGAGGGA 
TTTTGGTTAA GTTTAGAACG AACTTTTGGA TTATCAGGAA ATGGTGCAAA ATTGTTTGAA 
CTGGTTAATA GTAATGCGTC AGATATTTCT ACTCGATTGA AGCTCACAGG GGACTTAAAA 
GATATTAACC CATTACAAAA GAAGTTATTA TTAGATTTGA GCGACTTAGG GATTGAGTTA 
GATAATTTAG AAGGGATGAC GTTTGGTCCT CGCTTATCCG ATGGGAGTCA GTCTTTAATT 
TTAGTGAGTG ATGATAATTT TAATCAAACT CAGGTGACTC AGTTTCTTTT GTTTCGATTA 
AAGCAAGAAT AA

Protein sequence

MKPVVVFVTH LILVIFLTAC GISPQVLAEQ RLFPPVSLEF LGEYQLPKQT FEGTSVGGLS 
GLSYDRQRDR FYALSDDRSQ KAPARFYSLK LSISDGNDGK TEINSITVEA VTFLKNSSGE 
FYQVQTIDPE GIALSPRDTV FISSEGVPKR GINPFIGEFN LKTGQLERTL PLPERFLPGK 
EPDGTPRGVE DNLGFESLTI SATSTLKDDP FRLFTANEWS LSQDTAQTDQ KQKPLRLLHY 
GINSIGSPVL IAEHLYLLDE TPNGVVSNGL TDLLALPQEG FWLSLERTFG LSGNGAKLFE 
LVNSNASDIS TRLKLTGDLK DINPLQKKLL LDLSDLGIEL DNLEGMTFGP RLSDGSQSLI 
LVSDDNFNQT QVTQFLLFRL KQE