Gene PCC8801_0078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0078
Symbol
ID	7103737
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	80859
End bp	82700
Gene Length	1842 bp
Protein Length	613 aa
Translation table	11
GC content	37%
IMG OID	643473193
Product	HTTM domain protein
Protein accession	YP_002370340
Protein GI	218244969
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAATA AATTATTCTC TAAACTAAAG GAAATTTTCG CCTTAGACTT AAGATCATTA 
GGGATTTTTC GGATAGGTTT AGCCTTGGTT GTTATGACTG ATTTAATCAG TCGAGCTAGG 
GGATTAACTG ACCATTATAG CGATGCTGGA GTGATGCCTA GAGAGGCATT AACCAAAGAA 
TTACTACACC CTTGGTATTG GTCTTTTCAT CTGATAAGTG GGAATTATTT ATTTCAAATT 
GTCCTATTTA TTTTAGCTTT TTTGATAGCA ATAGCCATGT TAGTTGGTTA TCGAACTCGA 
CTAGCCACTA TTGCTACTTG GGCGTTTAAT ATTTCTGTCC AAAATCGCAA TCCTGCCTTG 
ATTTTTGCCG GAGACGATGT CTTACGCGCC ATGCTTTTTT GGGCAATGTT CTTACCATTA 
GGAGCCGCTT ATTCCATCGA TAGTGCCCTT AATTCTTCCC AGAAACCTCT CCCCAAACAG 
GTCATTAGTG GGGCAACTGT TGCTTTTTTA GTGCAACTGA TTTTTATTTA TACTTGGTCA 
GCCGCTTATA AAACCAAAAG TGAAATTTGG TGGCCTAATG GGGAAGCCGT TTATTATTCC 
CTAAGCTTTG ATCAATACGT CACAGAATTA GGTCAATTGT TATTAGGATT TCCCTTACCA 
TTATTACAAT TTCTTACCTT TTCAGCCCTA ATTTTTGAAT GGGTTGCCCC CTTTATGATC 
TTTATCCCTT GGCGAACAAC CTTTTGGCGT TGTTTAGCTA TTATTTCTTT TATTTTATTA 
CATATTGGCT TTGAATTATC CTTTTCTATT GGGGTTTTAA GTTACCTTAG TATGGTCAAT 
TGGTTAGCCT TAATTCCTAC TCCGGTATGG GATAAAATAG CCCATCAATT AAAGACCCCC 
CAACGAGAAG GATTAATCAT TTATTATGAT CAAGATTGCG GGTTTTGTAA AAAAGTCGTT 
CATTTAATTC GGACATTTTT AATTTTACCC GGAACCCCTT TATTAGTTGC CCAAGATAAC 
GAGTCAATTT ATAGCGATAT GCTTGCCCAA AATTCCTGGG TTATCGTAGA TTGGCAAGGA 
AATCGTTATT TCAAATTTGA AGGCATTATT TATGTTTGTA GCTTATCTCC TATTTTTCAA 
TTTATCACCC CTATTCTGCG TTGGCAACCC ATCAAAACAG GAGGCACAAA ATTCTATGAA 
ACCATTGCCT CTAATCGAAA ATTTGCCGGA AATTTTACAA AACCCTTCCC GTTCCGTCCT 
CTGGAAATTA ATAACTCATT ACCCCTAAAT ATTGTCACAC TACTGTTACT GTTTTTAACC 
ACCCTATGGA ACTTAAAAAG CTTTGTTGAT CAAACCGTTT ACCGTCGTCC CTTTAAAGAT 
GATTGGATTA ACACTACCCA TAAAATCTTT ACCAAAAGAA CCTTTCAAGC AATTAATATC 
ATTAGCTATC TAACCCGTTT AGATCAGTCT TGGAGTATTT TTGCCCCCGC CCCCCCTAGG 
GATGATGGAT GGCACGTTAT TGTCGGGAAA CTCAATGACG GAACCGAGGT TAATCTCCTC 
AATGAAAACA GCCCCATTCG ATGGGAAAAA CCCACCCTAA AACAACGACA AAACCTTTAT 
CAAACCATAC AATGGCGGGT TTATTTCATC AATCTCAATC GTGCCATGGG GCAAAAACTG 
TATCCCCACT TTGCTGAATA TTTATGTAAT CAGTGGAATA CGAATCATAC AAGAGATAAA 
AAATTAAAAA GCCTAGAAAT TTATTTTATG GATGAAAGAA CCGTTCCTGC GGATCAAAAA 
CAACCGATTA AAAAAGAACT CCATTTCAAA AAAGAATGCT AA

Protein sequence

MNNKLFSKLK EIFALDLRSL GIFRIGLALV VMTDLISRAR GLTDHYSDAG VMPREALTKE 
LLHPWYWSFH LISGNYLFQI VLFILAFLIA IAMLVGYRTR LATIATWAFN ISVQNRNPAL 
IFAGDDVLRA MLFWAMFLPL GAAYSIDSAL NSSQKPLPKQ VISGATVAFL VQLIFIYTWS 
AAYKTKSEIW WPNGEAVYYS LSFDQYVTEL GQLLLGFPLP LLQFLTFSAL IFEWVAPFMI 
FIPWRTTFWR CLAIISFILL HIGFELSFSI GVLSYLSMVN WLALIPTPVW DKIAHQLKTP 
QREGLIIYYD QDCGFCKKVV HLIRTFLILP GTPLLVAQDN ESIYSDMLAQ NSWVIVDWQG 
NRYFKFEGII YVCSLSPIFQ FITPILRWQP IKTGGTKFYE TIASNRKFAG NFTKPFPFRP 
LEINNSLPLN IVTLLLLFLT TLWNLKSFVD QTVYRRPFKD DWINTTHKIF TKRTFQAINI 
ISYLTRLDQS WSIFAPAPPR DDGWHVIVGK LNDGTEVNLL NENSPIRWEK PTLKQRQNLY 
QTIQWRVYFI NLNRAMGQKL YPHFAEYLCN QWNTNHTRDK KLKSLEIYFM DERTVPADQK 
QPIKKELHFK KEC