Gene PCC8801_0377 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0377
Symbol
ID	7103340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	377601
End bp	379124
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	45%
IMG OID	643473487
Product	anthranilate synthase component I
Protein accession	YP_002370631
Protein GI	218245260
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTTTC CCGATTTCAA GCAATTTTGC GCTTTGGCAC AACAGGGGAA TTTTGTCCCC 
GTGTATCAAG AATGGGTTGC CGACCTAGAA ACCCCGGTTT CTTCTTGGTA TAAGGTCTGT 
GGTGATCAAC CCTACAGCTT TCTATTAGAG TCGGTGGAAG GGGGAGAAAA CCTCGGACGC 
TATAGCTTTT TGGGATGTGA CCCCGTTTGG GTATTAGAAA CCAAGGGAGA GACGACGACT 
CAAACCTATC GAGATGGTAG CATTAAGATA TTTCAGGGCA ATCCTTTGGA TATTTTGCCT 
CAATGCTTGG CAACAATTCA TCCAGTCATG TTACCTCAAC TTCCCTCAGG AATTGGGGGA 
TTATTTGGAT TTTGGGGCTA TGAGTTAATT CATTGGATTG AACCGCGAGT CCCCATCTAT 
CCGTGTACCC AAGAGGACTT ACCCGATGGA ATCTGGATGC AGGTAGATAA TTTAATTATT 
TTTGATCAGG TGAAGCGAAA AATTTGGGCG ATCGCCTATG CTGATTTACG AGGGGAAAAA 
GTTGACCTCA AACAAGCCTA TCAACAAGCT TGCGATCGCG TTACTAAGTT AGTGATCAAG 
CTACAACTTC CCTTACCAGT AGAAGCCAAA ACCCTAGAAT TAAACCCAAA ATCAGCCGAA 
TCTGACCCAT TAAATTATAA TAGCAATATA GAGCGATCGC GCTTTTGTGA AAATGTCCTC 
AAAGCCAAGG AATATATCCG TGCCGGGGAT ATCTTTCAAG TCGTGCTTTC TCAACGCCTG 
ACAGCCCATT ATAGCGATGA TCCCTTCAAT CTTTATCGTT CCCTGCGGTT GATTAATCCG 
TCTCCCTATA TGGCCTATTA CAATTTTGGA GACTGGCAAA TTATTGGGTC AAGTCCAGAA 
GTAATGGTTA AGGCTGAACG GATAGAAGAA AAGAAAATTA AAGCAACCCT AAGACCCATC 
GCGGGAACCC GAAAACGGGG TAAGACAGTG GCAGAAGATC AGGCATTAGC TCAGGATTTA 
CTGCAAGATC CCAAGGAAAT CGCCGAGCAC GTCATGTTAG TGGACTTGGG AAGAAATGAT 
TTAGGCCGGG TCTGCGTCGA AGGAACGGTT ACTATTGATG AGCTCATGGT GATTGAACGC 
TACTCCCATG TTATGCACAT CGTCAGCAAT GCGATCGGAG AATTGTCCCC TGATAAAACG 
GCCTGGGACT TATTAAAAGC CTGTTTTCCG GCAGGAACCG TCAGTGGTGC ACCCAAAATC 
CGTGCCATGG AAATTATCCA TGAATTGGAA CCCGAACGAC GAGGCCCCTA TTCGGGGGTT 
TACGGTTACT ACGATTTTGA GGGACAGCTA AATACAGCGA TCGCCATTCG GACTATGGTA 
GTTCGTCCGT TAGGGGGCAA TCAACATCGG GTTTCGGTAC AAGCCGGAGC CGGGTTAGTA 
GCAGATTCTG ACCCCGAAAA GGAATATGAA GAAACGTTAA ATAAAGCAAG GGGATTGTTA 
GAAGCCATTC GTTGTTTAAG TTAA

Protein sequence

MIFPDFKQFC ALAQQGNFVP VYQEWVADLE TPVSSWYKVC GDQPYSFLLE SVEGGENLGR 
YSFLGCDPVW VLETKGETTT QTYRDGSIKI FQGNPLDILP QCLATIHPVM LPQLPSGIGG 
LFGFWGYELI HWIEPRVPIY PCTQEDLPDG IWMQVDNLII FDQVKRKIWA IAYADLRGEK 
VDLKQAYQQA CDRVTKLVIK LQLPLPVEAK TLELNPKSAE SDPLNYNSNI ERSRFCENVL 
KAKEYIRAGD IFQVVLSQRL TAHYSDDPFN LYRSLRLINP SPYMAYYNFG DWQIIGSSPE 
VMVKAERIEE KKIKATLRPI AGTRKRGKTV AEDQALAQDL LQDPKEIAEH VMLVDLGRND 
LGRVCVEGTV TIDELMVIER YSHVMHIVSN AIGELSPDKT AWDLLKACFP AGTVSGAPKI 
RAMEIIHELE PERRGPYSGV YGYYDFEGQL NTAIAIRTMV VRPLGGNQHR VSVQAGAGLV 
ADSDPEKEYE ETLNKARGLL EAIRCLS