Gene PCC8801_3952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3952
Symbol
ID	7103450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	4140719
End bp	4141999
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	36%
IMG OID	643476950
Product	transposase IS4 family protein
Protein accession	YP_002374051
Protein GI	218248680
COG category	[L] Replication, recombination and repair
COG ID	[COG5659] FOG: Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTAAGC CTCGTCCACC GCGACCAACG GTTCAATTCG TAGATACATA CTGTGAATTA 
TACAGAGACT TATTCGTAGA AGTCAGAGCT TATGAGTCCT TTAAATATCT TCAGTTGGGA 
CTAATAAGTG AGCTAAAAAG AAAGAGTTTA CCAGCTATAG CTAAGGTGGT AGGATTAAAA 
AATGGACAAG GATTACACCA TTTTATTAGT CAATCGCCTT GGCAAGCTTG TGACCTAGAG 
AAAAGAAGAA GAGAAATTAT GGTAATAATA GATGAGACAG GAGATAAAAA GAAAGGAGAA 
AAGACCGATT ATGTCAAGAG ACAATATATC GGCAATTTAG GAAAAATTGA AAAGGGGATA 
GTATCGGTGA ATGCCTATGG GTATTGCGAG GGAATGACTT TTCCGTTAAA GTTTAAAATC 
TTTAAACCGA AAGAGAGATT AAAAGAGGGA GATAAGTATC AAACAAAACC AGAACTAGGA 
GCAGAATTAG TGAAAGAAAT TCAAGAGATG GGCTTTAATA TAAAAAGAGT ATTAGCTGAT 
AGTTTGTATG GGGAAAGCCA TAGTAACTTT ATTAGTATTT TAGAAAAATT GGGAATAGAA 
TATGCAGTGG GAATCCGCAG TAATCATGGG GTATGGCTAC CCAAAGGACA AATAGTAAGA 
GCTAATAGAT GGAGAGCTTA TAAGAATATC AGATGGAATG GTCAAGAAGA AACTCGTTAC 
ATTCGAGAGA TAATTTATGG CAAAAGAAGA GAGGTGCAAG ACTGGCAAAT TACCACCGAT 
AAAGAAACTG TTCCTGATGA CTCAACTTGG TTTGTTATGA CCAAAATTCC GAGCCTTAAT 
TATAAAGAAG TTGGCGATAT TTACAAAATA CGAGCTTATG AAGAACAAGG ATTTAGAAAC 
AGTAAAAATG AGTTAGGATG GGCAGATTTT CGCTTGACAA ACTATGCAGA TATACAAAAA 
TGGTGGGAAT TAGTGATGTG TGCCTATCTC CTGGTTTGTC TACATCATGA TATTTTTAAC 
CCTTCCGTTG CTCCCATCCC TAACTGCTAT CAACAACATG ACTTATGGGA CTCAGAAAAA 
GGCTGGAAAA ATCAGCTAAA TAACCTTCAG TTGATTTTAC AGCCTTTTAT CTGTTTTAAT 
TTGATTTTAA GATGGCTGAA AATTTTTCCT ATCCCTCAAT TATCGTTAGG TTTTCCTAGG 
CTTATTGCCA AATTTAATGA CTTTGATTGT TTACGATATT TGGTTTATTG TTGGCATGAC 
TTTTGTTATT CTTCTGCCTA G

Protein sequence

MVKPRPPRPT VQFVDTYCEL YRDLFVEVRA YESFKYLQLG LISELKRKSL PAIAKVVGLK 
NGQGLHHFIS QSPWQACDLE KRRREIMVII DETGDKKKGE KTDYVKRQYI GNLGKIEKGI 
VSVNAYGYCE GMTFPLKFKI FKPKERLKEG DKYQTKPELG AELVKEIQEM GFNIKRVLAD 
SLYGESHSNF ISILEKLGIE YAVGIRSNHG VWLPKGQIVR ANRWRAYKNI RWNGQEETRY 
IREIIYGKRR EVQDWQITTD KETVPDDSTW FVMTKIPSLN YKEVGDIYKI RAYEEQGFRN 
SKNELGWADF RLTNYADIQK WWELVMCAYL LVCLHHDIFN PSVAPIPNCY QQHDLWDSEK 
GWKNQLNNLQ LILQPFICFN LILRWLKIFP IPQLSLGFPR LIAKFNDFDC LRYLVYCWHD 
FCYSSA