Gene PCC8801_4536 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4536
Symbol
ID	7095915
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011723
Strand	-
Start bp	28123
End bp	29277
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	33%
IMG OID	643467516
Product	transposase IS4 family protein
Protein accession	YP_002364812
Protein GI	218203959
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	0.0600651
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.65428
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTTTT TGCCTTTCTA TCAGGACTAT TTACAAAACG CATTATCAAA AAGTAAATTT 
TTACTTTTAC GAATATTAAT ATGGCTTTTA CAAGTTCATA AACAAGTTAG AATAGAACGG 
TTAGCGGCTT ATCTTCCTCT TCCTATTCTA TACGAAAGTC GTAGAAAGAA GATTCAAAGA 
TTTTTAGTCG AACCGTGCTT AAGCCTTGTC TTATTATGGT TTCCTCTGAT AAAATTAATA 
GTAGAACGAG AATTTAAACC AGGAAGTCGT TTAACTTTAG TTTTGGATAG GACTCAGTGG 
CAGGATAAAA ATGTGTTCAT GATTAGTGTA GTTTGGAGAA AGAGAGCCTT CCCTATTTAC 
TGGCAAATTC TAGAGAAAAA AGGAAGCAGC AACGTCAAAG AACAAATCGC TTTAATCCGA 
CCGGTCTTGA AATTATTTGC CGACTATGAG TTATTAATTT TAGGGGATAG GGAGTTTCAT 
GGGGTAGAAT TATCTTATTG GTTAAAGAAA CGAAACCGAA CGGCTAAAAA TCCCATCTAT 
TTTGCTTTTC GAGAAAGGAA AAATGTCTAC ATTAGAAGAA GTAAGAAGAA TCAAAAACGC 
TTTCAAGATT TAACCCTGAC CCCAGGAGTC AAAGTTTTTG AAAAAAACAT TTTTATCACC 
AAGCAAAAAG GGTTTGGTCG CTTTAATGTA TTGGCTTATC AGAAGAGAAA ATATAGAAAC 
CATCAGGAAG AAGAACCTTG GTTTATTATA ACCAATTTAG ATAACCCATC CGAAGTCATA 
AAATATTATA AAATCAGAGG TGGAATTGAA GCTATGTTTC GAGATTATAA GAGTGGAGGA 
TATAATCTCG AAGGGAGTAA AGCTAATATT CATCGACTTA CTAACTTGAT TTTATTAATA 
GCTATTGCTT ATACTTTATC GGCTTTAAAA GGGAAGTCAA TTAAAAATAG AGGATATCAA 
AAGTATATAT CTAGACTAAC AGAACCGAAA AGACAAGTCA GAAGACATAG TGAATTTTGG 
GTAGGGCTAT ATGGACAAAG TTGGGTCTTA GCCTGGGATT TCTGTTACTT GTTTGTTGAA 
CAAATTATGA GAATTAACCT TCACAAAATT AATGAATATA ACCGAGGTTT AAAAGCCTTA 
TCTGCTATTA GTTAA

Protein sequence

MDFLPFYQDY LQNALSKSKF LLLRILIWLL QVHKQVRIER LAAYLPLPIL YESRRKKIQR 
FLVEPCLSLV LLWFPLIKLI VEREFKPGSR LTLVLDRTQW QDKNVFMISV VWRKRAFPIY 
WQILEKKGSS NVKEQIALIR PVLKLFADYE LLILGDREFH GVELSYWLKK RNRTAKNPIY 
FAFRERKNVY IRRSKKNQKR FQDLTLTPGV KVFEKNIFIT KQKGFGRFNV LAYQKRKYRN 
HQEEEPWFII TNLDNPSEVI KYYKIRGGIE AMFRDYKSGG YNLEGSKANI HRLTNLILLI 
AIAYTLSALK GKSIKNRGYQ KYISRLTEPK RQVRRHSEFW VGLYGQSWVL AWDFCYLFVE 
QIMRINLHKI NEYNRGLKAL SAIS