Gene Synpcc7942_2036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_2036
Symbol
ID	3774255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	-
Start bp	2105522
End bp	2106526
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	56%
IMG OID	637800481
Product	hypothetical protein
Protein accession	YP_401053
Protein GI	81300845
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.502892
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAATC TAGACGTCGC GCTGCTACCG AATCACTGGT ACGCGATCGC TGCCAGTACT 
GATCTGGGTT CCACACCGAT CGCAGCGTCG CTACTCGATC AACAGCTGGT GGTCTATCGC 
ACTACTGCTG GACAAGTTGT GGTGCTCGAC GATCGCTGCC CCCACCGTGG GGCTTCGCTA 
GCCTGCGGTC AGGTCAAGGG CAACGCGATT GCCTGTCCCT ATCACGGTTG GCAATTTGAT 
CTCGATGGTC ATTGCGCTCA GATTCCATCT CAGCAGGCTT CGGCACGAAT TCCCCAAGCG 
GCAAAAGTGG CGAGCTATCC TGTCCAGGAG CGCTATGGCT TGATTTGGGT GTTCACCGGC 
GATCGCGATC GGGCGGCACA AACGCCGTTG TGGGAACTGC CGGAATATGA CCAAGCCGGT 
TGGCGGGTGG TTCAAGGTCA GTTCGATTGG GCGGCAGACT ATCGTCGCGT TACCGAAAAT 
GGCATGGATG TGGCGCATTC ACCCTTCGTG CATGCCAATT CCTTTGGTGC TAGCGGCAAT 
GAAGTGATCG CCGATTTTGA GTTGGAAAAG AGCGATCTCG GCGCCCAAAT CTGGATTCCG 
ATCGAGCCGA AGGCGAACTA TCGTGGCAGC TTCAACCTGC TAGGACGCAA GCAAGAAACC 
CCCAAGGCAG GGCGATCGGG GGCAGCCTTT CACTTACCGA ACATCACTCG TATCGATATT 
GAATTCGGCA ACTTTCATTT GATCTTGGTC GGTATTCACC AGCCGATCTC GGCCACAACG 
ACCCGTAGTC ACTGGCTCCA TGTCCGCAAT TTCTTGACGG CAGGCTGGGC GGATGGTGGG 
ACACGCAAAC GCACCGCCAA GCTTTTTCAG GAAGATCAAA AGATCATTGA GGGGATTGCT 
CCTCTGCGCG ATCGCAATGA AATTTCGGTT GCCTCCGATC GCCTGCAACT CTACTACCGC 
CAGCTCTGGC AACAGCACCA TTCCTCCCTC GTCGCCCAAG GCTGA

Protein sequence

MANLDVALLP NHWYAIAAST DLGSTPIAAS LLDQQLVVYR TTAGQVVVLD DRCPHRGASL 
ACGQVKGNAI ACPYHGWQFD LDGHCAQIPS QQASARIPQA AKVASYPVQE RYGLIWVFTG 
DRDRAAQTPL WELPEYDQAG WRVVQGQFDW AADYRRVTEN GMDVAHSPFV HANSFGASGN 
EVIADFELEK SDLGAQIWIP IEPKANYRGS FNLLGRKQET PKAGRSGAAF HLPNITRIDI 
EFGNFHLILV GIHQPISATT TRSHWLHVRN FLTAGWADGG TRKRTAKLFQ EDQKIIEGIA 
PLRDRNEISV ASDRLQLYYR QLWQQHHSSL VAQG