Gene Synpcc7942_1691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_1691
Symbol
ID	3775390
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	+
Start bp	1757155
End bp	1758315
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	61%
IMG OID	637800129
Product	hypothetical protein
Protein accession	YP_400708
Protein GI	81300500
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.187562
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAGTA GTGACGTTCC CTCCTTTGCT CCCGATCAGG CACTCCCACA GTGGCGACTG 
TTCTGGGGCA GCAGCGCTGC CGTCATTGCG ATCGCGATCG CAGCGAGTTT ACATGGTGGG 
CGGCAGACGA TGTTGTTATT GCTGGGTGCA GCGATCGGGG CCGTTCTGTA TCACGGGCGC 
TTTGGGTTTA GCAGCGGGTT TCGCAAACTG CTACAGCGTC AGGATGGCAA TCCTGCCTTG 
GCGCAGTTGT GGTTGTTGGC GCTAACCTCG ATCGCTTTTG CTGGCGTTTT TAGCCTGGCG 
GAACTCAGGG GTTGGGAGCT ACGACCCGCG ATCGCGCCGG TGGGCTGGGC TAGTCTGGGC 
GGAGCTTTCC TATTTGGCAT TGGCATGCAG CTCAGCCGCG CCTGTGGTTG CGGTACTTTG 
GCAGCCGTTG GCGGCGGTTC TTACAACCTA TTGATCACCC TGATTGCCTT TGGCATCGGG 
GCGTTTGGGG CGACCTTGAC ACGGCCGCTG TGGAGCCAGC TTCCTGCTTG GGAGCCTTGG 
TCTTTTGCCA GCCAATTGGG TTGGGGCAGT GCCCTCCTCC TGCAACTGTG GCTGCTCTTA 
ATTCTGGCCG TGGCTCTCTG GCGCTGGGCA CCCCTGCCGA TGGTCAAATC TCGGCGGCTC 
TGGCTGGCGG CGACAGCGAT CGCCCTGCTT TATACCGGCA CCCTCGTGGT TGACGGCCAA 
CCTTGGCGAG TGACCTGGGG CTTGGCTCTG ACGACTGCGC AAGTTGCCCA AAACTTGGGC 
TGGGATCCCC AGAGCAGCGT CTTTTGGGGG CGCCAACTGG GACGCCTCAG CAGCAGCTTA 
CTGGCAGACC CCAGTGTGAT CACCGATCTA GGTCTGATTT TGGGTGCTTT GACGGCTGCC 
GCCTATGAAG GCCGCTGGCG CTGGCAAGGT AGCCTCCAAC CCCATGCAGT TGGGCTCTCG 
ATCGCAGGCG GATTGAGTAT GGGCTTTGGA GCATTTCTGG CGGCCGGCTG TAATATCAGC 
GCCTATTTGG CCGGTATTGC CTCCACCAGT TTGCACGGCT GGGTCTGGCT GGTTGCGGCA 
CTCCTAGGGT CTTGGGTCGG CATTCACTTG CGATCGCGCT GGCAACCGAG TTCGCCACCT 
GCTTCAACCA ATCTGAGCTA G

Protein sequence

MASSDVPSFA PDQALPQWRL FWGSSAAVIA IAIAASLHGG RQTMLLLLGA AIGAVLYHGR 
FGFSSGFRKL LQRQDGNPAL AQLWLLALTS IAFAGVFSLA ELRGWELRPA IAPVGWASLG 
GAFLFGIGMQ LSRACGCGTL AAVGGGSYNL LITLIAFGIG AFGATLTRPL WSQLPAWEPW 
SFASQLGWGS ALLLQLWLLL ILAVALWRWA PLPMVKSRRL WLAATAIALL YTGTLVVDGQ 
PWRVTWGLAL TTAQVAQNLG WDPQSSVFWG RQLGRLSSSL LADPSVITDL GLILGALTAA 
AYEGRWRWQG SLQPHAVGLS IAGGLSMGFG AFLAAGCNIS AYLAGIASTS LHGWVWLVAA 
LLGSWVGIHL RSRWQPSSPP ASTNLS