Gene Synpcc7942_0934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_0934
Symbol
ID	3775211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	+
Start bp	940995
End bp	942056
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	59%
IMG OID	637799352
Product	hypothetical protein
Protein accession	YP_399951
Protein GI	81299743
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.464361
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGC GATTCCGAGA CCTAATCCGT AAGGTTGGCA GTGGACGCCA CACGAGCCAA 
GTTTTGACGC AGGCTGAGGC CGCCGAAGCC CTGCAGCTCA TGCTGTCAGC CACGGCGACC 
CCCGCCCAAA TTGGGGCTTT TTTAATTGCC CATCGCATTC GTCGCCCGAC GGGAACCGAA 
CTCGCTGGAT TTTTAGAGAC CTACGCCGAC TGGTTGCCTG CTGTCTTGGC TCCGAGTACA 
ACACGGCCGC CACTGGTCTT GGGCTATCCC TACGATGGCC GCGATCGCAC GGCTCCTTTG 
GGACCACTGC TGGCGCTGCT GCTCGCCGCT GTTGGTCAAC CCGTTGTGCT GCACGGCAGC 
GATCGCGTTG CAACAAAATA CGGTGTGCCT CTGGTTGAAC TCTGGGATGC GATCGGGGTG 
AACTGGCGAT CGCGTTCTGT TGCTGATCTC AACCGCTGTC TCGAACAAGC TGGTGTAGCC 
CAACTCCATC AACCCAGTCT TTGCCCGGCT GCTGAAGTGT TGAATGGCTA TCGCTCGGAA 
TTGGGCAAAC GACCGCCGCT TGCCACTGCC GAATTGATGC TCGTTCCTGT CCAAGGGGCA 
GCTTTGCCGG TTTGTGGCTT CGTCCATCCG CCGACGGAGT TGATGATCGA AGAAGCCCTG 
AGTCTGCGCG GGATCACGAC CTTCTTCACC ATCAAAGGCT TGGAGGGGAG TCCAGAGCTA 
CCGCGCGATC GCGCCGCAAT CGTGGGCCGC TGGCAGAATG GCCACTGCGA TCGTCTGATC 
TTGCATGCCC GCGACTGGGA TTTAGGCGAG GCAGAACTGC CTTGGATGGG GGAAGACGCT 
TGGGTGGAGG CTGCTCAAGC CCTACTGGAA GGTCAGCCTT CAGTGCTAGA ACCGCTGCTG 
CGCTGGAATG GCGCGGCCTA TCTCTGGTTT TTGGGCATGG CCTCATCAAT GACGGCAGGG 
TTGGTTCAGG TGGATCACCT GTTACAAACC AAGGCGCTGC TCCAACAACG CGATCGCTTG 
CAACAGATTC TTCAACTCGT ACCCGATTTC TCACTCTCTT GA

Protein sequence

MSERFRDLIR KVGSGRHTSQ VLTQAEAAEA LQLMLSATAT PAQIGAFLIA HRIRRPTGTE 
LAGFLETYAD WLPAVLAPST TRPPLVLGYP YDGRDRTAPL GPLLALLLAA VGQPVVLHGS 
DRVATKYGVP LVELWDAIGV NWRSRSVADL NRCLEQAGVA QLHQPSLCPA AEVLNGYRSE 
LGKRPPLATA ELMLVPVQGA ALPVCGFVHP PTELMIEEAL SLRGITTFFT IKGLEGSPEL 
PRDRAAIVGR WQNGHCDRLI LHARDWDLGE AELPWMGEDA WVEAAQALLE GQPSVLEPLL 
RWNGAAYLWF LGMASSMTAG LVQVDHLLQT KALLQQRDRL QQILQLVPDF SLS