Gene Synpcc7942_1462 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_1462
Symbol
ID	3773634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	-
Start bp	1514071
End bp	1515141
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	56%
IMG OID	637799894
Product	imelysin
Protein accession	YP_400479
Protein GI	81300271
COG category	[R] General function prediction only
COG ID	[COG3489] Predicted periplasmic lipoprotein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0336824
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0166245
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCGTGA CAGGCTCTCA GGTCAGGCAA GGTTTAAACA CTTGGTTTGT GCTCCCGCTG 
CGTAGGACTG CGATCGGCCT GGGCTGCGCC GGAGTTGCAA CGCTCTTCTC TGCCTGTGGT 
CAAACCCAGG CATTGATTAC CAATCAGACC ATTCAAGGAT TTGTCGATCA GGTTGTCGTT 
CCTAGCTATG TCAGCGTTGC TGCTGGCGCA ACTCAGCTGG AACAAGCCCT CCAAACCTAT 
CAGCAGGCAC CGACTGCTGC CAATTTGGAG GCGGCTCGAC AAGCCTGGCG GGTCGCCCGC 
GATCGCTGGG AGCAGACTGA ATGTTTTGCT TTTGGGCCAG CGGATAGCGA AGGGTTTGAT 
GGGGCAATGG ACACCTGGCC TATCGATCGC CAAGGCTTGA AAACTGCCGC AGCTCAGCCA 
GTGGAGCAAC GGGAAGATAG CCGTAAGGGC TTCCACGCGA TCGAGGAGTT GTTGTTTGCC 
GCAACGGAAC CGACGCTGAG CGATCGCCAG CATCTTGTGA TCTTGGCGAC GGACCTTACC 
AAGCAAGCAC AGGGGTTGGT CACCCGTTGG CAACAAGCGA GTGATCAGCC TGCCTATCGC 
TCAGTTTTGC TCAGCGCTGG CTCGACAGAT TCGGCCTATC CCACCCTGAA TGCTGCGGGA 
ACCGAGATTG TTCAAGGCCT GGTTGATAGC CTCTCAGAGG TCGCCAGCGA AAAGATCGGC 
GGGCCACTCG AGACTCAAGA ACCCGATCGC TTTGAAAGTT TTGTTAGCCG CAATACTCTG 
TCTGACCTGC GCAACAACTG GACTGGCGCT TGGAATGTCT ATCGCGGTCA GCGGTCTGAT 
GGGGTCGCGG CAGGAAGTCT GCAACAGCGT TTACAGCAAC AACATCCAGT GATCGCTCAG 
CAACTCGATC AGCAATTTGC AACTGCCCGC CAAGCCCTTT GGGCTATTCC TGAACCGATT 
GAAACCAACC TTGCCAGCCC AAGAGGCAAA GTGGCTGTCC TCACGGCTCA AACTGCGATC 
GCAGCAGTCA GCGACACCCT AGAGCGTCAA GTTCTCCCGC TGGTTCAGTA G

Protein sequence

MIVTGSQVRQ GLNTWFVLPL RRTAIGLGCA GVATLFSACG QTQALITNQT IQGFVDQVVV 
PSYVSVAAGA TQLEQALQTY QQAPTAANLE AARQAWRVAR DRWEQTECFA FGPADSEGFD 
GAMDTWPIDR QGLKTAAAQP VEQREDSRKG FHAIEELLFA ATEPTLSDRQ HLVILATDLT 
KQAQGLVTRW QQASDQPAYR SVLLSAGSTD SAYPTLNAAG TEIVQGLVDS LSEVASEKIG 
GPLETQEPDR FESFVSRNTL SDLRNNWTGA WNVYRGQRSD GVAAGSLQQR LQQQHPVIAQ 
QLDQQFATAR QALWAIPEPI ETNLASPRGK VAVLTAQTAI AAVSDTLERQ VLPLVQ