Gene Synpcc7942_2107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_2107
Symbol
ID	3774326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	-
Start bp	2186865
End bp	2188454
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	50%
IMG OID	637800552
Product	ABC-type nitrate/sulfonate/bicarbonate transport systems periplasmic components-like
Protein accession	YP_401124
Protein GI	81300916
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.287431
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCCCCC CAACACTTCT TGAGGAGCAA TCTAAGCTCC TCCATTCTGC TGCGTGTCGC 
TGTCAGGATT GCTATCGTCT GACGACCGAT CACGATCGCT TTTTGGAAGA TATGCCGCAA 
GACCCTGAGA TCTTGATGGC AGATTTTCAA AAGATGGGTT TATTCAAACC TGAATCGATT 
GCGATCGCCG ATCGTCTGAC GACTTCAGAG TTGCGCCAAG CCTTGTTCTT TAAAAATGCT 
TCCCAAGGGG ATCCTGAACA GGAAGCAATG CTGAGAGCTT TGGCTGCAGA AGCAGGTGGT 
TTAGATCAGG CATTTGCTGC TGCTTTTGGA CCGCAAGCGG GTCGTTTTTT CAGCAACATT 
CAAGCTAGTG GCGGGGTCAG TCGTCGGGTT TTCCTGCGCA ACTTGGTCGT TGGTGCAGCT 
CTCGTGACGC TGACCAACTG TGCCCAACAG GCTCAACAAC CCGATAGCCC AACCACGACT 
GGCAGTGGCA ATTTAGAAAA AACGGATCTG AAGGTTGGCT TTATCCCGAT TACCTGCGCC 
ACTCCGATCA TCATGTCAGA TCCCTTGGGC TTCTATCAGA AATATGGCTT GAAAGTCCAA 
GTTGTGAAGA TGCCGAGCTG GGGGGCAGTT CGAGATTCTG CGATCGCAGG CGAATTGGAT 
GCCTATCACA TGCTGGCACC GATGCCGATC GCGATGACCT TGGGTCTTGG CTCAGCTCCC 
TTCAGTGTCA AGTTAGCCAG TATTGAAAAT ATTAACGGTC AGGCGATTAC GGTTGCCAAA 
CGTCACCTTG GCAAAGTCAA AGAAGCGAAA GACTTCAAAG GCTTTGTGAT TGGGGTCCCC 
TTCCCCTTCT CAATGCATAA CCTGCTGTTG CGCTACTATC TCGCTGCTGG TGGTTTGAAT 
CCCGATACCG ATGTCCAAAT TCGGCCAGTT CCCCCGCCAG ATAGTATTGC TCAGCTCGTC 
GCAGGTGATA TCGATGCGAT GCTGATGCCC GATCCCTTTA ATCAGCGGGC AGTGTATGAA 
GATGCTGGCT TTATTCATCT GTTAACTAAA GAAATTTGGA ATGGTCATCC TTGCTGTGCA 
TTTGCAGCAG GTGAGCCTTG GATTCAAGAA AATCCCAATA CGTTCCGAGC GCTTAACAAA 
GCAATTATTG AAGCAACTGG TTATGCCAGT AAGGCCGAAA ATCGTGCTGA GATTGCCAAG 
GCTATTTCTA GCCGTCAGTA CTTAAATCAA CCACCCGAAG TCGTGGAAGC TGTGCTGACC 
GGTAAGTTCC CCAATGGTCA AGGTCAAGAA CTGGATGTTC CCGATCGCAT TGACTTCAAT 
CCCTACCCAT GGCAGAGCTT TGCCAACTGG ATTCAATCGC AGCTAGTGCG TTGGGATCTG 
GGTAAAGCTG CCGGTGTGAT CCAGCCCGAT CAGTACGACA AGAACGGTCA GGCAATTTAC 
CTGACGACTG AAGCACAAAC CCTCGAGAAG GAAGTGGGCC TGCAGCCGCC GACTGAAATC 
TATCGGGAAG AAAAGCTCGC TTACGACACC TTTAACCCGC AGGATCCAGT CGCTTACCTC 
GCATCTCAAA AGCAGAAATA CGGGAGATAA

Protein sequence

MVPPTLLEEQ SKLLHSAACR CQDCYRLTTD HDRFLEDMPQ DPEILMADFQ KMGLFKPESI 
AIADRLTTSE LRQALFFKNA SQGDPEQEAM LRALAAEAGG LDQAFAAAFG PQAGRFFSNI 
QASGGVSRRV FLRNLVVGAA LVTLTNCAQQ AQQPDSPTTT GSGNLEKTDL KVGFIPITCA 
TPIIMSDPLG FYQKYGLKVQ VVKMPSWGAV RDSAIAGELD AYHMLAPMPI AMTLGLGSAP 
FSVKLASIEN INGQAITVAK RHLGKVKEAK DFKGFVIGVP FPFSMHNLLL RYYLAAGGLN 
PDTDVQIRPV PPPDSIAQLV AGDIDAMLMP DPFNQRAVYE DAGFIHLLTK EIWNGHPCCA 
FAAGEPWIQE NPNTFRALNK AIIEATGYAS KAENRAEIAK AISSRQYLNQ PPEVVEAVLT 
GKFPNGQGQE LDVPDRIDFN PYPWQSFANW IQSQLVRWDL GKAAGVIQPD QYDKNGQAIY 
LTTEAQTLEK EVGLQPPTEI YREEKLAYDT FNPQDPVAYL ASQKQKYGR