Gene Cyan8802_3051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_3051
Symbol
ID	8392381
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	3084580
End bp	3086106
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	53%
IMG OID	644981000
Product	photosystem II chlorophyll-binding protein CP47
Protein accession	YP_003138732
Protein GI	257060844
COG category
COG ID
TIGRFAM ID	[TIGR03039] photosystem II chlorophyll-binding protein CP47

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000997071
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.381945
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGACTAC CTTGGTATCG AGTTCACACA GTTGTCCTGA ATGATCCAGG CCGACTTATT 
TCCGTTCACC TCATGCACAC CGCCCTTGTT GCGGGTTGGG CAGGTTCCAT GGCTCTGTAT 
GAGCTAGCTA TTTTTGATCC GAGTGATCCC GTTCTCAACC CCATGTGGCG ACAAGGGATG 
TTCGTCCTTC CCTTCATGGC CCGCTTAGGA GTCACTGGCT CCTGGGGTGG CTGGAGTGTC 
ACCGGAGAAA CAGGTGTAAA CCCTGGTTTC TGGTCCTTTG AAGGCGTTGC TGCCGCCCAC 
ATCGTTCTCT CTGGGTTACT CTTCCTAGCT GCCGTTTGGC ACTGGGTTTT CTGGGATCTC 
GAACTCTTCG TTGATGCCCG TACTGGCGAA CCCGCCCTCG ACTTACCTAA GATGTTCGGG 
ATTCACCTGT TCTTATCTGG GTTACTCTGC TTCGGTTTCG GAGCCTTCCA TCTTACCGGC 
CTCTGGGGAC CGGGGATGTG GGTATCTGAC CCCTACGGCT TAACCGGCCA TGTCCAACCC 
GTTGCCCCAG AATGGGGTCC GGCCGGGTTT AACCCCTTCA ACCCAGGGGG AGTTGTGGCT 
CACCACATTG CAGCCGGAAT TGTGGGCATT ATTGCGGGTC TATTCCACCT AACGGTACGA 
CCCCCCGAAC GGCTCTATAA AGCCCTCAGA ATGGGAAATA TTGAAACCGT TCTTTCTAGC 
AGTATTGCCG CCGTCTTCTT TGCGGCCTTT GTCGTTGCTG GAACGATGTG GTACGGTAAC 
GCAACCACCC CCATTGAACT GTTCGGACCG ACCCGTTATC AATGGGATAA TGGCTACTTC 
AAACAAGAAA TTGAACGTCG TGTTGAAGCC AATGTAGCGG CGGGCGATAC TTTAGGGGAA 
GCTTGGTCTA AAATTCCCGA AAAACTCGCC TTTTACGACT ATGTTGGCAA CAGCCCCGCA 
AAAGGCGGGT TATTCCGTAC CGGAGCCATG GATAGTGGCG ATGGTATCGC CCAAGCTTGG 
TTAGGTCATC CTGTCTTTAC GGACAAAGAC GGTCGGGAGT TAACCGTACG TCGGATGCCT 
AACTTCTTTG AAACTTTCCC CATCGTTCTA ACCGATGCTG ATGGAGTCGT CCGTGCTGAC 
ATTCCCTTCC GTCGGGCAGA ATCTAAACTG AGTATTGAGC AAAGCGGTGT TACCGTTAGC 
TTCTATGGTG GTGCGCTTGA TGGCCAAAGC TTCAGCAACC CCGCCCAAGT TAAACAGTTT 
GCCCGCCAAG CCCAATTAGG CGAACCCTTC GAGTTTGACC GCGAAACCCT CGGTTCTGAT 
GGGGTATTCC GTACCAGTCC TCGCGGTTGG TTTACCTTCG GACACGCCGT CTTCGCCCTA 
CTGTTCTTCT TTGGTCATAT TTGGCATGGT TCTCGTACCC TGTACCGAGA TGTCTTCGCT 
GGAATTGACC CCGACCTAGA GGAACAAGTG GAATTTGGCT TGTTTGCTAA GGTGGGTGAC 
TTAAGTACCC GTCGTACCGA GTCTTAA

Protein sequence

MGLPWYRVHT VVLNDPGRLI SVHLMHTALV AGWAGSMALY ELAIFDPSDP VLNPMWRQGM 
FVLPFMARLG VTGSWGGWSV TGETGVNPGF WSFEGVAAAH IVLSGLLFLA AVWHWVFWDL 
ELFVDARTGE PALDLPKMFG IHLFLSGLLC FGFGAFHLTG LWGPGMWVSD PYGLTGHVQP 
VAPEWGPAGF NPFNPGGVVA HHIAAGIVGI IAGLFHLTVR PPERLYKALR MGNIETVLSS 
SIAAVFFAAF VVAGTMWYGN ATTPIELFGP TRYQWDNGYF KQEIERRVEA NVAAGDTLGE 
AWSKIPEKLA FYDYVGNSPA KGGLFRTGAM DSGDGIAQAW LGHPVFTDKD GRELTVRRMP 
NFFETFPIVL TDADGVVRAD IPFRRAESKL SIEQSGVTVS FYGGALDGQS FSNPAQVKQF 
ARQAQLGEPF EFDRETLGSD GVFRTSPRGW FTFGHAVFAL LFFFGHIWHG SRTLYRDVFA 
GIDPDLEEQV EFGLFAKVGD LSTRRTES