Gene PCC8801_4028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4028
Symbol
ID	7103507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	4221007
End bp	4222305
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	48%
IMG OID	643477023
Product	threonine synthase
Protein accession	YP_002374123
Protein GI	218248752
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCAGG CAACTCAAAC CCAAACCAAA GCCGCCACCT TTACTCATCT TGTTTCTAAA 
GAAGGTGGCG TTAAATATCC CCTCAAAGCC CTTCACGTTT GCGAGGAAAC CTTCTCTCCC 
CTGGAAGTGG CCTATGATTA CGATGCCATC CGTGCCCAAG TGACCCGCGA AAGCATCCAA 
GCTGGACCCA ACTCCATTTG GCGTTACAAA GCGTTTTTGC CCGTAGAAAG CGAAAATCCC 
ATTGATGTTG GCACCGGGAT GACCCCCCTC GTTAAATCGC ACCGTTTAGC CCGTCGCCTG 
GGTCTAAAAA ATCTTTATAT CAAAAACGAT GCCGTCAATA TGCCCACCCT CAGCTTCAAA 
GATAGGGTGG TGTCCGTTGC TCTCACTAGA GCCAAAGAAC TGGGATTTAC CACCGTTTCC 
TGCGCCAGTA CGGGGAATTT AGCCAATTCT ACAGCAGCGA TCGCCGCCCA TGCAGGGTTA 
GACTGTTGCG TGTTCATTCC GGCAGATTTA GAAGCGGGTA AAGTCCTGGG TACTCTCATC 
TACAATCCGA CCGTGATGGC CGTCAAAGGG AACTACGACC AAGTGAACCG TCTCTGCTGC 
GAAGTGGGTA ACAGCTACGG ATGGGGCTTT GTTAACATCA ATTTACGTCC CTACTACTCG 
GAAGGGTCAA AAACGCTAGG ATTTGAAGTG GCCGAACAAT TAGGGTGGAA ACTCCCTGAT 
CACGTCGTTG CTCCCTTAGC GTCGGGTTCC CTCTACACCA AGATTTACAA AGGCTTCCAA 
GAGTTCATCA AAACCGGGTT AGTCGAAGAT AAAGCGGTTC GGTTCAGTGG AGCCCAAGCG 
GAAGGTTGTT CTCCCATTGC GGCTGCGTTT AAAGAAGGTC GGGACTTTGT AACCCCAGTT 
AAACCCAATA CTATTGCTAA ATCCATCGCT ATTGGTAATC CTGCTGATGG TTATTACGCC 
TTAGATATTG CGCGTAAAAC CAACGGGAAT ATTGAAAGCG TCACCGATGC AGAGATCGTC 
GAAGGGATTA AACTTTTAGC GGAAACTGAA GGCATTTTCA CGGAAACCGC AGGGGGAACT 
ACCATTGCGG TCCTCAAAAA ACTGGTAGAA GCGGGTAAAA TTGATCCTGA AGAAACTACC 
GTAGTTTATA TCACCGGAAA CGGATTAAAA ACCCAAGAAG CGGTGCAAGA GTACATCGGT 
CAACCCCTAA TTATCGAGCC TAAATTAGAC AGTTTTGAAC GAGCTCTGGA ACGTTCTCGG 
ACTCTAGAAC GTCTAGAATG GCAACAGGTT TTAGTTTAG

Protein sequence

MTQATQTQTK AATFTHLVSK EGGVKYPLKA LHVCEETFSP LEVAYDYDAI RAQVTRESIQ 
AGPNSIWRYK AFLPVESENP IDVGTGMTPL VKSHRLARRL GLKNLYIKND AVNMPTLSFK 
DRVVSVALTR AKELGFTTVS CASTGNLANS TAAIAAHAGL DCCVFIPADL EAGKVLGTLI 
YNPTVMAVKG NYDQVNRLCC EVGNSYGWGF VNINLRPYYS EGSKTLGFEV AEQLGWKLPD 
HVVAPLASGS LYTKIYKGFQ EFIKTGLVED KAVRFSGAQA EGCSPIAAAF KEGRDFVTPV 
KPNTIAKSIA IGNPADGYYA LDIARKTNGN IESVTDAEIV EGIKLLAETE GIFTETAGGT 
TIAVLKKLVE AGKIDPEETT VVYITGNGLK TQEAVQEYIG QPLIIEPKLD SFERALERSR 
TLERLEWQQV LV