Gene PCC8801_3949 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3949
Symbol
ID	7103892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	4137456
End bp	4139153
Gene Length	1698 bp
Protein Length	565 aa
Translation table	11
GC content	37%
IMG OID	643476947
Product	Tn7-like transposition protein C
Protein accession	YP_002374048
Protein GI	218248677
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAAAGTA AAGATTTTAC CAATAAATAT GACTATTATA ATTGGATAGA AATTCCTGAT 
GGTACACGCG CTGCTGTGTC TAAATATCGT CAGTTTAAGC AGATAGAATA TAATAATAAT 
CCTATTATTG AAGCTTTACC ACCGATATTT TCTCAAGCTG AATTTGTAGA TTTAGCCACA 
AGATTACCGT TATATGACCC TTTAGAAAGA CAATTAGAAG CACAAGATAG GTTTCATTGT 
ATTGAGCGAT TATCTCGCTA TTTTGACCCC CTTTCTATCA CCATTGATTT ACAACAAACT 
ATCTGTGTTT TATTAATGAG TGGTTATATT TCTCGGAATC CTTTACAACC AGAATATGCA 
AGACGTTCAA GACAAATTTA TGGGTCAATT CAAGCTAAAG ATGGTCACAA TTTAGAACAA 
TATGTGACAG TTCCTACGAC TGCTTCAGGA CTAACTATTA TTGGAGAATC AGGGTTAGGA 
AAGTCAACAA ATTTAGCGAA TATTCTTGAT ATTTATCCAC AAGTGATTCT TCATCCTCAA 
TATAATGTGA CTCAAATTGT TTGGTTAAAG GTAGATTGTC CTCATGCGGG TTCTTTGAAA 
GGGTTATGTA CGGATATTTT TCTCGCTGTT GACAGGTTAT TAGGGACAAA TCACTTCAAA 
AAATTCGGTT CTAAGGGTAA TTCTGAGGAT TATATGTTAG CGCAAGTGGC ACAAATTGCC 
CATACTCATC ATTTAGGGTT ATTAGTGATT GATGAGATGC AAAATTTAGC TAATGCGAGG 
AGAGGACGGG ATGATTTACT GAATTTTTTG GTGAAAATGG ATAATATTAT TGGTATTGCC 
GTGATAAGAG TGGGAACCAA TGAAGCAGAA CCGATTTTGA CAGGAAATTT TAGGAATGCG 
AGACGGGGAA CAGGAGAAGG TGCAGTACGC TGGAAACGGA TGGAAAATAA CGGAAATTGG 
CAGTTTTTTG TCGAGGGAAT GTGGGATTAT CAGTGGACAA AAACTGAGGT TCTCTATTCT 
GAGGAAATTA GTGACGCACT CTATGAAGAA ACCCAAGGAA TCATCGATAT TGTGATTAAA 
TTATACAAAA TGGTGCAATG GCGAGCTATT TCTCTGGGTG ACGATGAAAT AATCACGGTT 
GATTTAATTC AGCAAGTTGC ACAAGAGGGG TTATATCTGG TGAAACCGAT GTTAGATGCG 
ATACGTTCGG GGAATCTGGT ACAAATGAAA AAGTACCGAG ATATTGCCCC TGTAGATATT 
TCTGACTATC GAGAAAAGTG TTTAAATGAT ATCAATTTTG AGGATTTAGC AGAATTAAGA 
CGCATCAGAC GCAATAATAA ACAGTCAGCA ACTCTGTCTC CTCTGCTTAA GCAAGTGATT 
GTGGAATTAC TAGAGTTGGA GGTTGAACCC ACTTTAGCGA AACGGTTGGG GGAAAGGATG 
GTTAATGAAA ATCCCCAGGA AACGGATATT TCTAAGTTAG TTAATCAAGC GTATAAGATA 
GCATTACAAG GGGAAGCATT TAAGGGCAAT AAATCAAGAA AACCGCAGTC CAAAGGTAAA 
TTAAATCCGA ATTATGTTGA AAATGACATG AGAAAGATTC TAGAGGAGGC TAAAAATAAT 
CAAATTCCTG TTTATGAACC GTTGGTAGAA GCAAAGATTA TTAAAGATAG TCCTGAAGTC 
GATTTTTTCT TAATTTAG

Protein sequence

MESKDFTNKY DYYNWIEIPD GTRAAVSKYR QFKQIEYNNN PIIEALPPIF SQAEFVDLAT 
RLPLYDPLER QLEAQDRFHC IERLSRYFDP LSITIDLQQT ICVLLMSGYI SRNPLQPEYA 
RRSRQIYGSI QAKDGHNLEQ YVTVPTTASG LTIIGESGLG KSTNLANILD IYPQVILHPQ 
YNVTQIVWLK VDCPHAGSLK GLCTDIFLAV DRLLGTNHFK KFGSKGNSED YMLAQVAQIA 
HTHHLGLLVI DEMQNLANAR RGRDDLLNFL VKMDNIIGIA VIRVGTNEAE PILTGNFRNA 
RRGTGEGAVR WKRMENNGNW QFFVEGMWDY QWTKTEVLYS EEISDALYEE TQGIIDIVIK 
LYKMVQWRAI SLGDDEIITV DLIQQVAQEG LYLVKPMLDA IRSGNLVQMK KYRDIAPVDI 
SDYREKCLND INFEDLAELR RIRRNNKQSA TLSPLLKQVI VELLELEVEP TLAKRLGERM 
VNENPQETDI SKLVNQAYKI ALQGEAFKGN KSRKPQSKGK LNPNYVENDM RKILEEAKNN 
QIPVYEPLVE AKIIKDSPEV DFFLI