Gene PCC8801_4154 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4154
Symbol
ID	7105443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	4353498
End bp	4354649
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	36%
IMG OID	643477143
Product	transposase, IS605 OrfB family
Protein accession	YP_002374242
Protein GI	218248871
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAACA AAGCCTACAG ATTTAGGTTG TACCCCAATC AAGAACAGCA GCAATTCTTA 
GCTAAGTGCT TTGGTTGTTC AAGATTTGTG TACAATCATT TTTTGCGCTT AACTACTGAT 
GTCTATGCCG ATGGCAAAAA GAATTTGCGC TATAAAGAGT GGGCTAAGTT ACTAACTTCT 
TTAAAAAAGG AGTTTGAGTG GCTAAAAGAT GTTAATTCTC AAGCGTTACA GCAAACTTTG 
AAAGACCTAG AAACAGCCTA TTCTCGTTTT TTCAAAGGAT TAGCCAAGTT TCCCCAATTT 
AAAAAAAGGT CTAATAAGCA ATCTTTTCGG ATTCCTCAGC ACTTTTCTCT TACAGAAGAT 
AGAAAATTAA AACTTCCAAA AATGTCTCCT ATTAAGATGG TCATTCATCG AGAAATAGAA 
GGAGAGATTA AGAGTGTAAC TATTAGTAAA ACTCCATCAG GTAAATATTA TGCTTCAATT 
GTTACCGAGT TAGATATCCC CAAAGCTCCT TTGAATGGGG AAAAAATAGG AATGGATCTC 
GGTATTAAGG AGTTTGCTAT TACTTCTAAA CCAGAGAAGT TTGAAAATCC TCGTTATTTT 
CAACGCTCAT TAAGACGATT AAAAATCAGA CAAAGGAGGT TAAGTCGCCG AGTAAAAGGC 
TCTAAAAACA GGAATAAAGC CAGAGTTAGA GTGGCTAAAA TTCATGAAAA AGTAGCCAAT 
CAAAGATTAG ACTATCAACA CAAAATAAGT CTCAAATTAA CTAACGAGAA CCAAGTTATT 
AGTTGTGAGG ACTTAAACAT CAAAGGGATG GTCAAAAACC GAAAGTTATC TAGGCAAATT 
AGTGATGTAG CCTGGGGGCA ATTCTTAACT CTTTTAGAAT ACAAAGGTGA TATCTACGGC 
TGTGAAATTA AACCCGTGAA AAGATGTTTC CCTAGCTCCA AAAGATGTTC TAATTGTGGG 
TATATCAAAG AAGATTTAAC CCTAAAAGAC AGAGAATGGA CTTGTCCAGA ATGCCATGTA 
CACCACGACA GAGATATCAA TGCTTGCCAT AATTTGCTTC AATTCTCTGA CGGATATATA 
GGGTGGGAAG CACCCAAATC TACGCCTAAC CAGACTGTTG AAATGCAGTG CATCAAGAGC 
GTTAGTTCTT GA

Protein sequence

MSNKAYRFRL YPNQEQQQFL AKCFGCSRFV YNHFLRLTTD VYADGKKNLR YKEWAKLLTS 
LKKEFEWLKD VNSQALQQTL KDLETAYSRF FKGLAKFPQF KKRSNKQSFR IPQHFSLTED 
RKLKLPKMSP IKMVIHREIE GEIKSVTISK TPSGKYYASI VTELDIPKAP LNGEKIGMDL 
GIKEFAITSK PEKFENPRYF QRSLRRLKIR QRRLSRRVKG SKNRNKARVR VAKIHEKVAN 
QRLDYQHKIS LKLTNENQVI SCEDLNIKGM VKNRKLSRQI SDVAWGQFLT LLEYKGDIYG 
CEIKPVKRCF PSSKRCSNCG YIKEDLTLKD REWTCPECHV HHDRDINACH NLLQFSDGYI 
GWEAPKSTPN QTVEMQCIKS VSS