Gene PCC8801_1857 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_1857
Symbol
ID	7105546
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	1948287
End bp	1949471
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	38%
IMG OID	643474923
Product	transposase, IS605 OrfB family
Protein accession	YP_002372056
Protein GI	218246685
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAAAG TCGTCAAAGT TCGGCTATAC CCAAATACAG AGCAACAGCA GTTACTAGAA 
CAAAGTTTTG GTAATGTTCG TTGGCTGTGG AATTATTGCC TAAATTTGAT GAATCAAACA 
TATTTGGATA CTGGAAAAGG ATTATCAGGA TATGAGGTCA AAAAACTGAT TCCTTCTCTT 
AAAAAAGAGC ATGAATGGTT AACTTTGACT TATTCTCAGT GCTTGCAACA AACCTGCTTA 
AACCTTGGAG TTGCTTTTAA TAACTTTTTT GAGCGTAGAG CAAAGTATCC TAGGTTTAAG 
TCAAAACATG GGAAACAATC TATTCAGTAT CCTCAAAATG TCAAGGTATT AGATTGTGGC 
TTAAATCTTC CTAAAATTGG GGCAGTAAAA GCAGTAATTC ACCGTCCAAT CGAAGACAAG 
ATTAAGACTG TTACCGTCTC TAAAAATAGC TGCAATCAAT ACTTTGCATC CATTTTGTTT 
GAAGATGGCA AAGAAACCCC CCTAATAGGG GGGACAGAGG GGGGTGAGGG AAAAGCAGTA 
GGAATTGACG TAGGCTTAAC TCATTTTTGC ATTACTTCAG ATGGCTCTAA ATTTGACAAT 
CCCCGATTTT TAACCAAGCA CGAAAGGAAT TTAAAACGGA AACAGCAGCA ACTATCTAGA 
AAGCAAAAAG GGTCTAATAA TCGTAATAAA GCTAGAAAGA AAGTTGCTAA AGTGCATCGA 
AAAATAACTA ACTGTCGTGA AGATTTTCTA CACAAACTAT CTCGTAGGAT AGTAGACGAA 
AACCAAGTTA TTGTGACAGA GAATCTTAAC GTTAAGGGCA TGATGAAAAA CCACTTCCTA 
GCTAAAGCTA TTGCACAAGT TGGGTGGGGA ATGTTCATGA CTATGCTTAA ATACAAAGCA 
GAAAATGATG GAAAAACCTA TCAAGAAGTT GATAGGTTTT TCCCTTCATC TAAAACTTGT 
CATGTTTGCT TAAATCAGGT GGGAAGTTTG CCGCTTGATA TCAGACATTG GACTTGTGAA 
AACTGCCAAA CAAAACACGA CAGAGATGTT AACGCCGCAA TCAACCTCCG CGATGAGGGA 
CTACGAATCT TGACCTGTGG AACGCGGGAC AAAGCTTATC GCCAGACTGT AAGTCGTAGT 
AATAGAGGAC GCAAGAAATC TACTACTGCG CTTGTCTCTG GGTAA

Protein sequence

MLKVVKVRLY PNTEQQQLLE QSFGNVRWLW NYCLNLMNQT YLDTGKGLSG YEVKKLIPSL 
KKEHEWLTLT YSQCLQQTCL NLGVAFNNFF ERRAKYPRFK SKHGKQSIQY PQNVKVLDCG 
LNLPKIGAVK AVIHRPIEDK IKTVTVSKNS CNQYFASILF EDGKETPLIG GTEGGEGKAV 
GIDVGLTHFC ITSDGSKFDN PRFLTKHERN LKRKQQQLSR KQKGSNNRNK ARKKVAKVHR 
KITNCREDFL HKLSRRIVDE NQVIVTENLN VKGMMKNHFL AKAIAQVGWG MFMTMLKYKA 
ENDGKTYQEV DRFFPSSKTC HVCLNQVGSL PLDIRHWTCE NCQTKHDRDV NAAINLRDEG 
LRILTCGTRD KAYRQTVSRS NRGRKKSTTA LVSG