Gene Synpcc7942_2035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_2035
Symbol
ID	3774254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	-
Start bp	2104481
End bp	2105518
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	58%
IMG OID	637800480
Product	hypothetical protein
Protein accession	YP_401052
Protein GI	81300844
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTCTCA AGAACTACTG GTATCCCGTG GCGCTGGCTC AGAAGGTCGG CGATCGCCCC 
CTGTCTGTCA CTCTCTGCGG TGAAGCGATC GCCCTCTACC GCGACAGTGC GGGTCAAATT 
CACGCCTTGA GCGATCGCTG TGTGCATCGG GGTGCAGCAC TTTCCGGCGG CTGGGTTGAA 
AATGACTGTC TCGTCTGTCC GTACCACGGT TGGCAGTACG ACGCCCAAGG GCACTGCCGC 
AAAATTCCTG CCAATACGGA GCAACAGCGC ATTCCCTTTG CAGCCAAAGT TCCCCACTAT 
GATGCGATCG AACGCTACGG CCTAGTCTGG CTGTTCTACG GCGATCTACC TGAAGCGGAT 
CGTCCACCCT TGCCGCCCTT GCCGGAATAC GACGATCCAG CCTGGCGCAC CGTGCAGGGT 
GAAGTGACCT ACACCACCCA CTACACCCGC GTCACCGAAA ACCTGATGGA TTTCGCCCAT 
GCACCCTTCA CCCACTCGGG TTCGTTTGGG GCAGCGTCCG ATCCATTAAT TGAGCCTTAC 
AAAGTCGAAC AACTTCCAGA CGGTCTACGC GCCCAAACCC AGTTCACCAA ATCGGCCTAT 
CGCGGCATTT GGAAGCTGTT CAATCGTGGC GATGCCCCAC GTACCGTCAC CACCACAATC 
ACCCTTTACA TGCCCTGCAT CGTCCGCACC GAAACGGACT TAGGCAACGG CTTCCGCTTC 
ATTGGCTACG GTGCCAATCT GCCGATCGAT GCCGAGACCA CCAAGACCTT TTGGCTGACC 
GTGCGCACCT TCTTTACCGG TGCTTGGGCG GATGGCGACA CGGTGCGCCG CAGTCTCAAA 
ATCATCGAAG AGGACAAACG GATCGTCGAA ACCCAGCGTC CCAAGATGAT TCCCTTGGAC 
GATCGCAGTG AAACCCACGT CGCCGCTGAT GCCCTACAAA TCGGCTACCG CAACTTGCTG 
CGACAAGCCC GCGATCGCGG TTGGGCAATT GCCGAATCTC AGCCAGCCGA TCAGGAACTG 
GTGCCCGCCG CTAAGTAG

Protein sequence

MFLKNYWYPV ALAQKVGDRP LSVTLCGEAI ALYRDSAGQI HALSDRCVHR GAALSGGWVE 
NDCLVCPYHG WQYDAQGHCR KIPANTEQQR IPFAAKVPHY DAIERYGLVW LFYGDLPEAD 
RPPLPPLPEY DDPAWRTVQG EVTYTTHYTR VTENLMDFAH APFTHSGSFG AASDPLIEPY 
KVEQLPDGLR AQTQFTKSAY RGIWKLFNRG DAPRTVTTTI TLYMPCIVRT ETDLGNGFRF 
IGYGANLPID AETTKTFWLT VRTFFTGAWA DGDTVRRSLK IIEEDKRIVE TQRPKMIPLD 
DRSETHVAAD ALQIGYRNLL RQARDRGWAI AESQPADQEL VPAAK