Gene Synpcc7942_1070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_1070
Symbol
ID	3774002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	-
Start bp	1081730
End bp	1082851
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	57%
IMG OID	637799494
Product	oxidoreductase aldo/keto reductase
Protein accession	YP_400087
Protein GI	81299879
COG category	[R] General function prediction only
COG ID	[COG1453] Predicted oxidoreductases of the aldo/keto reductase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.587482
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.00485834
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCACTATC GCCAATATGG TCGGACAGGG CGATTGATCT CGCGCTTTTC CCTCGGCTTG 
ATGCGCTGTT TGGACTCTGC CGCGCAATTG GAGGCTGTGC TTGATGCTGC GTGGCGGCTT 
GGCATCAACC ACTTTGAGAC GGCGCAGTCC TACGGCCCCA GCGAAGCCTA TCTGGCGCAA 
GCCCTGCATT CTCTGCAATT GCCCCGTGAT CAAGTCATCA TCACGACTAA AATCCTGCCC 
GATCGCGACC CCCAGCAGAT GGTAGAAGCC GTGTTGCGAT CGCGTGATCG CTTAGGGATT 
GACTCGATCG ATTGTCTTGC CCTGCATGGT CTCAACCAGC CCGAGCATTT GCAGCAGGCG 
ATCGCTGCAT TACCGGCGCT CCAAACCCTG CAAGCGGAAG GCGTCTTTCA GCATTTGGGC 
TTTTCCAGTC ACGGCGATCG CGAATTGATT CTGGAGGCGA TCGCTACCGA TGCGTTTGAC 
TTTGTCAGCC TCCATTACTA CCTGCTGTTT CAACGTCACG CGCCGGTCAT TGAAGCAGCT 
GCAGCCAAAA ATCTAGGAAT TTTCATCATT TCGCCCGTCG ATAAGGGTGG ACTCCTGCAC 
CAACCTTCTG CCCAACTGAT CGAGGACTGT CAGCCCTTCA GTCCTCTGGC ACTCAACTAT 
CGATTTCTGC TCAGCGATCG CCGGATTACA ACCCTCAGTT TTGGTGCTGC AAAGGCCGAG 
GAATTAGCGG TTCTTCAGGA CTTCGTTGAT GCGGATCAGC CGCTGAGTCT GGAGGAAGCT 
GAGGCGATCG CGCGACTGGA ACAAGTTCGC CAGCAGCGGC TGGGCAGGGA CTACTGTCAG 
CAGTGTTATG CCTGTTTGCC CTGTCCCGAG GCGATCAACA TTCCTGAGGT ACTGCGGCTG 
CGGAATCTGG CAATCGCCCA CGACATGCAA GCCTACGGAC GATATCGATA TCGCATGTTT 
GAAAATGCCG GACATTGGTT CCCGGGGCAG CGAGGCAGCC GCTGCACGGA TTGTGGCGAT 
TGCCTACCCC GTTGCCCCCA TCACTTGCCG ATCGCGGATT TGGTGCGCGA TGCTGATCAG 
CGATTAGCAG GCGCTCCTCG GCGGCGTTTG TGGGGAGATT AG

Protein sequence

MHYRQYGRTG RLISRFSLGL MRCLDSAAQL EAVLDAAWRL GINHFETAQS YGPSEAYLAQ 
ALHSLQLPRD QVIITTKILP DRDPQQMVEA VLRSRDRLGI DSIDCLALHG LNQPEHLQQA 
IAALPALQTL QAEGVFQHLG FSSHGDRELI LEAIATDAFD FVSLHYYLLF QRHAPVIEAA 
AAKNLGIFII SPVDKGGLLH QPSAQLIEDC QPFSPLALNY RFLLSDRRIT TLSFGAAKAE 
ELAVLQDFVD ADQPLSLEEA EAIARLEQVR QQRLGRDYCQ QCYACLPCPE AINIPEVLRL 
RNLAIAHDMQ AYGRYRYRMF ENAGHWFPGQ RGSRCTDCGD CLPRCPHHLP IADLVRDADQ 
RLAGAPRRRL WGD