Gene Cyan8802_3404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_3404
Symbol
ID	8392740
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	3474132
End bp	3475337
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	38%
IMG OID	644981341
Product	pentapeptide repeat protein
Protein accession	YP_003139067
Protein GI	257061179
COG category	[S] Function unknown
COG ID	[COG1357] Uncharacterized low-complexity proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.559073
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACTA TTGCAGCAAT TCTTGTCGTA ACTCCTTTAT TCCTAAGTTC TGTCGTCAAA 
GCCGAAAATC CTAGTTCAGT ACAACGGTTA TTAACAACTA AAGAATGTAT CGGTTGTAAC 
TTACAAAATG CTAACCTAAA AGGCCTTAAT TTAGAAGGAG TCAATCTAGA AAAAGCCAAC 
TTAAAAAATG CTAATTTGCA GGGAGCTAAC CTGAACAATG CTCACCTCAA ACAGGCCATT 
TTACAGGATG CTCGATTGAT GGATGCTCAA CTCGAAGGAA CTGTACTCGA AGCAGCTAAT 
CTGATCAATA CAAAGCTTGA TGGTGCTAAT TTAAATAATG CTAACCTTAA AGGCGTTAAT 
CTGGTCAATT CACAGATGAA TGGCATTATT TTGACTAATG CAAACTTAGA AGGAGCCACA 
ATGAGGGGTG TTTCCCTCCA AGAAGCCAAT TTAGATGGAG CTATCTTAAT CCAGGCTGAT 
TTAACCGTTC ATGATGAAAA ACGAGCGAAT CTGACGGGTG CGAGTCTCAA AAATGCGGAT 
TTGTCAGGGG CACATCTTCG CGGTATCAGA CTCAAAGATG CTAACCTTGA AGGGGCTAAT 
CTGGAAAAAA CTGACTTTAC CCGCGATATT CCTAATAATA CCACCGCTAA AGGAGCTCTC 
AGTGTAGCTA CCTCACCCAT TCCCTTAGTT TTGCCTGGTG CTGTCTTGGG TGCTATTGGG 
AACTTTGCTA TTGGAGAAGC TTCTGCGTTG AATGCGGATG TTAGTAATAC CAATTTAGCA 
GGAGCCAATT TAGAAGAAGC TAATCTCCAA GACATTAATT TAGAGAACTC CAATCTCAAG 
AATGCTAACT TAGAAAAAGC TAATTTACAC AATGCTTATT TAGTCAATAC GAATTTGACT 
AATGCCAATT TAAGTTTAGC CAAATTAACT AATATTAATA TGGAGGGAGT TAACTTAAGT 
AGTGCTAACT TAGCCGGGGC TAATTTGGAT AAATCCTATC TAGCTAAAGC TAATTTGACT 
AATGCTAAGC TTGAATCAGC CAAATTAACG AATGTTAATT TAACGGACAC TCAGTTAACA 
AATGCTAACT TAATGAAAGC CCAATTAGCT AATGCTAACT TAAGCAATTC TAACTTGTGT 
GGGGCAACCA TGCCTGATGG TTTGATTTCT CAAATAGGAT GTACTGCGGC CAATATTCAG 
TCATAA

Protein sequence

MKTIAAILVV TPLFLSSVVK AENPSSVQRL LTTKECIGCN LQNANLKGLN LEGVNLEKAN 
LKNANLQGAN LNNAHLKQAI LQDARLMDAQ LEGTVLEAAN LINTKLDGAN LNNANLKGVN 
LVNSQMNGII LTNANLEGAT MRGVSLQEAN LDGAILIQAD LTVHDEKRAN LTGASLKNAD 
LSGAHLRGIR LKDANLEGAN LEKTDFTRDI PNNTTAKGAL SVATSPIPLV LPGAVLGAIG 
NFAIGEASAL NADVSNTNLA GANLEEANLQ DINLENSNLK NANLEKANLH NAYLVNTNLT 
NANLSLAKLT NINMEGVNLS SANLAGANLD KSYLAKANLT NAKLESAKLT NVNLTDTQLT 
NANLMKAQLA NANLSNSNLC GATMPDGLIS QIGCTAANIQ S