Gene Synpcc7942_1842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_1842
Symbol
ID	3774417
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	+
Start bp	1908945
End bp	1910213
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	54%
IMG OID	637800283
Product	transposase IS605
Protein accession	YP_400859
Protein GI	81300651
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.119511
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAATCC GTGAAGCCAA GTTAGCTGGA ACCCCTGAGC AGTTTGCCCA ACTCGATGCA 
GCAATCCGCA CGGCTCAGTG TGTCCACAAC CGCTGTCTTC GCTACTGGCG AGACAACGCT 
GGGGTTAGCA AAAACGACTT GCAAAAGTTC TGTGCTGTCT TAGCTAAAGA TGCTGAGCAG 
CCTTGGATGG GCTTGCTGAA TTCGCAGGCT CGACAAGCAG CCGCGGAACG GACTTGGCAG 
TCGATTCAGT CTTTTTATCG CCGTTGCAAG GAGGGCGCGA AACACAAGGG CTATCCCAAG 
TTCAAAAAGC ATTCCCGCTC AGTGGAGTAC AAAACGTCGG GCTGGAAACT CTCGGATGAT 
GGGATGTCGA TCACGTTCAC CGACGGTTTT AAGGCGGGTC AGTTGGAGCT GTGGTTGGAC 
GGTTCTGCTC GGCAGTTAAT TCTGTCATCC AAAATCAACC GCGTTCGGGT GGTGCGCCGT 
GCTGATGGGT ACTACGCTCA GTTCTGTTTG GACGTAGAAC GACAGGAAGC TGGAGTCTAC 
AGCGGCAACG TCATTGGCTT GGACTTGGGG CTGAAGTATT TCACCAAGGA CTCTAATGGC 
GCTGAGGTTG CTTGTCCCAA GTTTTTCCGC AAGGGAGAAA AGCGGCTCAG ACGGGCCCAA 
CGGCGGCTAT CCAAGCGGTT CAAGAAAGGA GCGAAGCCTC AGAGCAAGAA CTACCACAAG 
CAACGTCAGC GAATAGGCAA AGTCCACCTC AAAATTCAGC GCCAACGTAA AAGCTGGGCT 
ATTGAACAAG CACGGCGCGT AATGGTGTCT AACGACATCG TGGTCTATGA AGATTTGCGG 
GTGCCTAACT TAGTTCGCAG CCGACACTTA GCAAAATCCA TCCACGATGC AGGCTGGACG 
CAGTTCACCC ACTGGCTGGA CTACTACGGC AAACTTTGGA GAAAAGTCGT CGTCGCGGTT 
AATCCGGCCT ACACCAGCCA AGACTGCTCT GGTTGCGGTT ATCGGGTGCA GAAGTCACTC 
TCGACCAGAA CCCATGACTG CCCACACTGC GGCTTAACGA TTTGCCGCGA CCAAAATGCC 
GCGCTCAATA TCCTCAAGCG AGGGTTAGAA GTCGTCGGCG CGGAATGGAA CAACGGTACG 
GCAGGGCATG CCGAAACCGG CTCGCAAGAG CAAACGACTG GGGAGATAAG CACCTCTGCC 
GAAGTAGGGC AACCCACTTC TGTAAGTGCT GTCGCTGAAC CAGTAAGAAC AAGCCGCGAG 
GCTGTTTGA

Protein sequence

MLIREAKLAG TPEQFAQLDA AIRTAQCVHN RCLRYWRDNA GVSKNDLQKF CAVLAKDAEQ 
PWMGLLNSQA RQAAAERTWQ SIQSFYRRCK EGAKHKGYPK FKKHSRSVEY KTSGWKLSDD 
GMSITFTDGF KAGQLELWLD GSARQLILSS KINRVRVVRR ADGYYAQFCL DVERQEAGVY 
SGNVIGLDLG LKYFTKDSNG AEVACPKFFR KGEKRLRRAQ RRLSKRFKKG AKPQSKNYHK 
QRQRIGKVHL KIQRQRKSWA IEQARRVMVS NDIVVYEDLR VPNLVRSRHL AKSIHDAGWT 
QFTHWLDYYG KLWRKVVVAV NPAYTSQDCS GCGYRVQKSL STRTHDCPHC GLTICRDQNA 
ALNILKRGLE VVGAEWNNGT AGHAETGSQE QTTGEISTSA EVGQPTSVSA VAEPVRTSRE 
AV