Gene PCC8801_4514 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4514
Symbol
ID	7095895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011723
Strand	-
Start bp	7330
End bp	8484
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	33%
IMG OID	643467496
Product	transposase IS4 family protein
Protein accession	YP_002364792
Protein GI	218203939
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	69
Plasmid unclonability p-value	0.810745
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.887559
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTTTT TGCCTTTCTA TCAGGACTAT TTACAAAACG CATTATCAAA AAGTAAATTT 
TTACTTTTAC GAATATTAAT ATGGCTTTTA CAAGTTCATA AACAAGTTAG AATAGAACGG 
TTAGCGGCTT ATCTTCCTCT TCCTATTCTA TACGAAAGTC GTAGAAAGAA GATTCAAAGA 
TTTTTAGTCG AACCGTGCTT AAGCCTTGTC TTATTATGGT TTCCTCTGAT AAAATTAATA 
GTAGAACGAG AATTTAAACC AGGAAGTCGT TTAACTTTAG TTTTGGATAG GACTCAGTGG 
CAGGATAAAA ATGTGTTCAT GATTAGTGTA GTTTGGAGAA AGAGAGCCTT CCCTATTTAC 
TGGCAAATTC TAGAGAAAAA AGGAAGCAGC AACGTCAAAG AACAAATCGC TTTAATCCGA 
CCGGTCTTGA AATTATTTGC CGACTATGAG TTATTAATTT TAGGGGATAG GGAGTTTCAT 
GGGGTAGAAT TATCTTATTG GTTAAAGAAA CGAAACCGAA CGGCTAAAAA TCCCATCTAT 
TTTGCTTTTC GAGAAAGGAA AAATGTCTAC ATTAGAAGAA GTAAGAAGAA TCAAAAACGC 
TTTCAAGATT TAACCCTGAC CCCAGGAGTC AAAGTTTTTG AAAAAAACAT TTTTATCACC 
AAGCAAAAAG GGTTTGGTCG CTTTAATGTA TTGGCTTATC AGAAGAGAAA ATATAGAAAC 
CATCAGGAAG AAGAACCTTG GTTTATTATA ACCAATTTAG ATAACCCATC CGAAGTCATA 
AAATATTATA AAATCAGAGG TGGAATTGAA GCTATGTTTC GAGATTATAA GAGTGGAGGA 
TATAATCTCG AAGGGAGTAA AGCTAATATT CATCGACTTA CTAACTTGAT TTTATTAATA 
GCTATTGCTT ATACTTTATC GGCTTTAAAA GGGAAGTCAA TTAAAAATAG AGGATATCAA 
AAGTATATAT CTAGACTAAC AGAACCGAAA AGACAAGTCA GAAGACATAG TGAATTTTGG 
GTAGGGCTAT ATGGACAAAG TTGGGTCTTA GCCTGGGATT TCTGTTACTT GTTTGTTGAA 
CAAATTATGA GAATTAACCT TCACAAAATT AATGAATATA ACCGAGGTTT AAAAGCCTTA 
TCTGCTATTA GTTAA

Protein sequence

MDFLPFYQDY LQNALSKSKF LLLRILIWLL QVHKQVRIER LAAYLPLPIL YESRRKKIQR 
FLVEPCLSLV LLWFPLIKLI VEREFKPGSR LTLVLDRTQW QDKNVFMISV VWRKRAFPIY 
WQILEKKGSS NVKEQIALIR PVLKLFADYE LLILGDREFH GVELSYWLKK RNRTAKNPIY 
FAFRERKNVY IRRSKKNQKR FQDLTLTPGV KVFEKNIFIT KQKGFGRFNV LAYQKRKYRN 
HQEEEPWFII TNLDNPSEVI KYYKIRGGIE AMFRDYKSGG YNLEGSKANI HRLTNLILLI 
AIAYTLSALK GKSIKNRGYQ KYISRLTEPK RQVRRHSEFW VGLYGQSWVL AWDFCYLFVE 
QIMRINLHKI NEYNRGLKAL SAIS