Gene Cyan8802_4194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_4194
Symbol
ID	8393545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	4321892
End bp	4323043
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	37%
IMG OID	644982109
Product	transposase, IS605 OrfB family
Protein accession	YP_003139821
Protein GI	257061933
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAACA AAGCCTACAG ATTTAGGTTG TACCCCAATC AAGAACAGCA GCAATTCTTA 
GCTAAGTGCT TTGGTTGTTC AAGATTTGTG TACAATCATT TTTTGCGCTT AACTACTGAT 
GTCTATGCCG ATGGCAAAAA GAATTTGCGC TATAAAGAGT GGGCTAAGTT ACTAACTTCT 
TTAAAAAAGG AGTTTGAGTG GCTAAAAGAT GTTAATTCTC AAGCGTTACA GCAAACTTTG 
AAAGACCTAG AAACAGCCTA TTCTCGTTTT TTCAAAGGAT TAGCCAAGTT TCCCCAATTT 
AAAAAAAGGT CTAATAAGCA ATCTTTTCGG ATTCCTCAGC ACTTTTCTCT TACAGAAGAT 
AGAAAATTAA AACTTCCAAA AATGTCTCCT ATTAAGATGG TCATTCATCG AGAAATAGAA 
GGAGAGATTA AGAGTGTAAC TATTAGTAAA ACTCCATCAG GTAAATATTA TGCTTCAATT 
GTTACCGAGT TAGATATCCC CAAAGCTCCT TTGAATGGGG AAAAAATAGG AATGGATCTC 
GGTATTAAGG AGTTTGCTAT TACTTCTAAA CCAGAGAAGT TTGAAAATCC TCGTTATTTT 
CAACGCTCAT TAAGACGATT AAAAATCAGA CAAAGGAGGT TAAGTCGCCG AGTAAAAGGC 
TCTAACAACA GGAATAAAGC CAGAGTTAGA GTGGCTAAAA TTCATGAAAA AGTAGCCAAT 
CAAAGATTAG ACTATCAACA CAAAATAAGT CTCAAATTAA CTAACGAGAA CCAAGTTATT 
AGTTGTGAGG ACTTAAACAT CAAAGGGATG GTCAAAAACC GAAAGTTATC TAGGCAAATT 
AGTGATGTAG CCTGGGGGCA ATTCTTAACT CTTTTAGAAT ACAAAGGTGA TATCTACGGC 
TGTGAAATTA AACCCGTGAA AAGATGTTTC CCTAGCTCCA AAAGATGTTC TAATTGTGGG 
TATATCAAAG AAGATTTAAC CCTAAAAGAC AGAGAATGGA CTTGTCCAGA ATGCCATGTA 
CACCACGACA GAGATATCAA TGCTTGCCAT AATTTGCTTC AATTCTCTGA CGGATATATA 
GGGTGGGAAG CACCCAAATC TACGCCTAAC CAGACTGTTG AAATGCAGTG CATCAAGAGC 
GTTAGTTCTT GA

Protein sequence

MSNKAYRFRL YPNQEQQQFL AKCFGCSRFV YNHFLRLTTD VYADGKKNLR YKEWAKLLTS 
LKKEFEWLKD VNSQALQQTL KDLETAYSRF FKGLAKFPQF KKRSNKQSFR IPQHFSLTED 
RKLKLPKMSP IKMVIHREIE GEIKSVTISK TPSGKYYASI VTELDIPKAP LNGEKIGMDL 
GIKEFAITSK PEKFENPRYF QRSLRRLKIR QRRLSRRVKG SNNRNKARVR VAKIHEKVAN 
QRLDYQHKIS LKLTNENQVI SCEDLNIKGM VKNRKLSRQI SDVAWGQFLT LLEYKGDIYG 
CEIKPVKRCF PSSKRCSNCG YIKEDLTLKD REWTCPECHV HHDRDINACH NLLQFSDGYI 
GWEAPKSTPN QTVEMQCIKS VSS