Gene PCC8801_3220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3220
Symbol
ID	7103946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	3363426
End bp	3364640
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	38%
IMG OID	643476241
Product	transposase, IS605 OrfB family
Protein accession	YP_002373351
Protein GI	218247980
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTACAGAA GCGTAAAGGT TAGAATCTAC CCAACATCTG AGCAGTCCCA AAAACTAAGT 
CAAGTTATGG GGTCAGCAAG ATGGTGGTGG AATTATGCCT TGAATCTGTG CAATCAAACT 
TATAAGGAAA CGGGTAAAGG ATTGACACAA ATAGCTCTTA ACAAGGTTTT GCCTAAGCTT 
AAAAAAGAAG AAGAAACTGC ATGGCTAAAA GACTGTTATT CTCAGGTCTT ACAGTCAACA 
ACTCTTAACT TGACTAAAGC TTTCAAAAAC TTTTTTGACA AAAGAGCGAA ATATCCCAGA 
TTCAAGTCCT ATCATGGCAA ACAATCCTGT CAATATCCTC AAAACTGTCA AGTTGTTGAA 
AAGGGAATAA AGATCCCCCA AGTTGGGGTT ATAAAAGCTT CAATTCATCG ACTTTTTGAT 
GGACAACTCA AAACCGTTAC TATTACAAAA ACACCAACCG GAAAATATTA TGCTTCATTG 
TTGTTTGACA CTGAACAAGA GATTCCTGGT TTGGTAGTAA CAGGTAAAAC AATTGGGATT 
GACTTAGGAC TTACAGACTT TTGTATTACC CATGATGGGC AAAAAACGTC TAAATTTGCC 
AATCCTAGAC ACATCAAAAA ACATGAGAAG AATTTAGCCA GAAAACAAAC TAAATTAGCT 
CGTAAAAAGA AAGGGAGTAA ATCTAGAGAA AAAGCACGAA AGCTTGTAGC TAGAGTTCAC 
GAACGTATTA GTAATGCCCG TCAAGATTTT CTACATAAAT TATCAAGAAA AATTGTCAAT 
GATAATCAAG TAGTCGTCGT TGAGAATTTA AACGTCAAGG GTATGGTTCG TAATCACAAC 
TTAGCTAAAG CTATTTCTGA TGTCGGATGG GGAATATTTG TCAATTTTCT TGACTATAAA 
CTACAACAAA AAGGCGGTTT TTTGGTAGAA ATTGATAGAT GGTTCCCGTC TTCTAAAACT 
TGCTCTAATT GTCTACATCA AATGTCAGAA ATGCCATTAG ATGTAAGACA ATGGACTTGT 
CCGAGTTGTG GGACACACCA CGATAGAGAT GAAAATGCAG CCAAAAACAT TAGAGCAGAA 
GGCATCAGGC AATTATCGGT CTTGGGAACC AGGACTGCTG CTGAAGGAGG AGAAGTAAGA 
CCAAAAGGTG GACGTAAGTC TGTCTTGAGG CATTCTCCTG TGAGTTCAGA ACCCCCAACT 
ATACCGATAG GTTAG

Protein sequence

MYRSVKVRIY PTSEQSQKLS QVMGSARWWW NYALNLCNQT YKETGKGLTQ IALNKVLPKL 
KKEEETAWLK DCYSQVLQST TLNLTKAFKN FFDKRAKYPR FKSYHGKQSC QYPQNCQVVE 
KGIKIPQVGV IKASIHRLFD GQLKTVTITK TPTGKYYASL LFDTEQEIPG LVVTGKTIGI 
DLGLTDFCIT HDGQKTSKFA NPRHIKKHEK NLARKQTKLA RKKKGSKSRE KARKLVARVH 
ERISNARQDF LHKLSRKIVN DNQVVVVENL NVKGMVRNHN LAKAISDVGW GIFVNFLDYK 
LQQKGGFLVE IDRWFPSSKT CSNCLHQMSE MPLDVRQWTC PSCGTHHDRD ENAAKNIRAE 
GIRQLSVLGT RTAAEGGEVR PKGGRKSVLR HSPVSSEPPT IPIG