Gene PCC8801_2272 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2272
Symbol
ID	7105109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	2343277
End bp	2344413
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	44%
IMG OID	643475318
Product	GUN4 domain protein
Protein accession	YP_002372447
Protein GI	218247076
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAATC AAACATCAAC TCCGTTGCTT TTTATTTCTT ACCGTCGAGA CGATAGTGCT 
GATGTAACGG GGAGAATTTA TGATCGTTTA ATTCAATATT TTGGGAAAGA CACGATTTTT 
AAAGATGTGG ACTCGATTCC CATCGGCGTT GATTTCCGTC AGTATATCGA TCAAGAAGTG 
GGGCGATGTC AAATCTTATT AGCGATTATT GGTCAACAAT GGCTCAATAT TACTGATACC 
ACGGGAAAAC GTCGCCTAGA CGATCCCCAA GATTTTGTTA GACTCGAAAT TGAATCCGCC 
CTGAAGCGCA ATATTCCCGT GGTTCCCGTT CTGGTTAGGG GAGCAAAGGT TCCTACTGAA 
CAAGAATTAC CCCCCAGTTT AAGGGAATTG GCTTACCGGA ATGGGAGTTT AGTGCGATCT 
GATCCCGATT TTCACGGAGA TCTCGATCGC TTAATTCTGG GGATTGAGCG CCATCTTGAA 
GAACATCAAG CCAAATCGCC TCAACCCTCC TTAAAGACTT CCTTTCCCTT CAAATTCAAG 
TCCTGGTGGT TGCTAGGAGG ATTAGGGGGG GCGATCGCTC TTATCCTGGG TATTGGCTCG 
CTTTTGTCCC AAGTTTCGAT CTTTGTTGAC ATTCAACCCC TTCAATACAA ACAACTGGAA 
AAATTTTTAA ACGAGCAAAA TTGGCAAGCG GCTGATCGAG AAACGGCAAA AATCATGTTA 
GCAGCAACGG GAAGAGAACA AGAAAAATGG ATCGATAAAA AGGGGATCAA TCAGATGTCT 
TGCCAAGAGA TTCGCAAGAT CGACGATCTT TGGCTCAAAG CGAGTCAAGG AAAGTTTGGG 
TTTAGTACAC AGCGAGAAAT CTGGAGAAAA GTCGCTAATA ACGATAAATT TGGCGATCTA 
ATAGGCTGGC GACAGAATAA TCAATGGCTA ACGACCGATC AATTACAGTT TAATTTAAGT 
GCACCGAAGG GGCATTTACC GTCGAGTTCC CGTGAAGGCA AATTATCAGG GGGATGGTTA 
GTCTGGTATT TATTACCGAT GACGACGACG GGCAATCAAT CAGATTCTAA GGCGAGTCAG 
TGTTGGCCAG AGGAAAAAGC AGTTAGTTTC TCCGATTCTG CTTCTGCATT TTCTTGA

Protein sequence

MKNQTSTPLL FISYRRDDSA DVTGRIYDRL IQYFGKDTIF KDVDSIPIGV DFRQYIDQEV 
GRCQILLAII GQQWLNITDT TGKRRLDDPQ DFVRLEIESA LKRNIPVVPV LVRGAKVPTE 
QELPPSLREL AYRNGSLVRS DPDFHGDLDR LILGIERHLE EHQAKSPQPS LKTSFPFKFK 
SWWLLGGLGG AIALILGIGS LLSQVSIFVD IQPLQYKQLE KFLNEQNWQA ADRETAKIML 
AATGREQEKW IDKKGINQMS CQEIRKIDDL WLKASQGKFG FSTQREIWRK VANNDKFGDL 
IGWRQNNQWL TTDQLQFNLS APKGHLPSSS REGKLSGGWL VWYLLPMTTT GNQSDSKASQ 
CWPEEKAVSF SDSASAFS