Gene PMN2A_1149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PMN2A_1149
Symbol
ID	3606539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL2A
Kingdom	Bacteria
Replicon accession	NC_007335
Strand	-
Start bp	1637078
End bp	1638598
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	38%
IMG OID	637688022
Product	anthranilate synthase, component I
Protein accession	YP_292342
Protein GI	72382987
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTAATT TAGATAAGGA AGAATTTATT TTGTCAGTGT CCAGCGGGGC TAATTATATT 
CCGTTGGCAA AAAGTTGGCC GGCAGATTTA GAAACTCCTC TTACAACCTG GCTTAAAGTT 
GGTAATGATG CTCCTTCAGG AGTATTGCTT GAATCAGTAG AGGGTGGAGA AACTATCGGT 
AGGTGGAGTG TGGTTGCATC AGATCCCCTT TGGAAAGTAG TAGTAAGGGG CGATGAATTA 
ACTAGATGCT GGAGGGATGG AAAACAAGAA AAGTTTCATG GAAATCCAGT GGAAATCCTC 
AGGAAAATGC TTGAGCCTTA TAAATCTGTT TCTTTGCCTG GCTTGCCACA ACTGGGACAA 
CTTTTTGGCA TGTGGGGATA TGAATTAATT CAATGGATAG AGCCCTCAGT GCCTACTTAT 
GAATTATCAG ATCAAGACTT ACCTGATGGT ATTTGGATGT TTATGGATAA AGTTCTGATT 
TTTGATCAAG TCAAACGCCT AATAACAGCT GTTGCATATG GGAATTTAAG TGATGGAGTT 
TCTTCTCAAA AAGCTTATGA AATTGCCTGT GAACAAATCA ATGAACTGCA AGATTTAATG 
GCTTCTCCTT TAAAGCCAAT AAAGTCTTTA AAGTGGAATC AAAGATCGAA TAGATCTATT 
GATATGGCTG CTAATACCTC AAAAAGTGAA TTTGAACATA GTGTTGAAGC GGCAAAAGAA 
TTTATTAAAC AAGGCGATAT TTTTCAGTTA GTTCTTAGTC AAAAATTGGA GTCGACTGTT 
ACGCAAAAAC CCTTTGAACT ATATCGAAGC CTGAGGATGG TAAATCCCTC TCCATTTATG 
GCGTTTTTTG ACTTTGGTGA CTGGCAACTT ATTGGTTCTA GCCCGGAGGT AATGGTTAAG 
GCCCAAAAAA CAGAAAAGGG TATTCAGACA AGTTTGAGAC CAATTGCAGG TACACGACCT 
AGAGGTAAAA ATGATTTGGA AGATGCAGCC TTAGAAAAAG ATCTTTTAAA AGATCCCAAA 
GAACGAGCAG AACATGTGAT GTTGGTAGAT TTGGGTCGAA ATGATTTAGG TCGAGTTTGT 
ACCCCAGGTA GTGTTGTTGT GAAAGAATTA ATGGTTATTG AAAAATATTC GCATGTAATG 
CATATCGTAA GTGAGGTTGA AGGCACTTTA AAAAAAGAAC AGGATGTTTG GGACTTATTA 
ATTGCTTCTT TCCCAGCTGG GACTGTAAGT GGAGCCCCAA AAATAAGAGC AATGCAACTA 
ATTAATCAAT TAGAAAATCA ACGTAGAGGG CCTTATTCAG GCGTTTATGG GTCTATAGAT 
TTAAATGGAG CATTAAATAC AGCTATTACT ATTAGAACGA TGATTGTACG TAAAAAAAAC 
AAAAATGGTT TTACTGTTGA AGTGCAAGCA GGGGCAGGGG TTGTTGCAGA TTCCATTCCT 
TCTAATGAGT ATCAAGAAAC TTTAAATAAA GCTAAAGGGA TGTTTACTGC TTTAGCTTGC 
TTAGACCCCC AAGATTTATG A

Protein sequence

MLNLDKEEFI LSVSSGANYI PLAKSWPADL ETPLTTWLKV GNDAPSGVLL ESVEGGETIG 
RWSVVASDPL WKVVVRGDEL TRCWRDGKQE KFHGNPVEIL RKMLEPYKSV SLPGLPQLGQ 
LFGMWGYELI QWIEPSVPTY ELSDQDLPDG IWMFMDKVLI FDQVKRLITA VAYGNLSDGV 
SSQKAYEIAC EQINELQDLM ASPLKPIKSL KWNQRSNRSI DMAANTSKSE FEHSVEAAKE 
FIKQGDIFQL VLSQKLESTV TQKPFELYRS LRMVNPSPFM AFFDFGDWQL IGSSPEVMVK 
AQKTEKGIQT SLRPIAGTRP RGKNDLEDAA LEKDLLKDPK ERAEHVMLVD LGRNDLGRVC 
TPGSVVVKEL MVIEKYSHVM HIVSEVEGTL KKEQDVWDLL IASFPAGTVS GAPKIRAMQL 
INQLENQRRG PYSGVYGSID LNGALNTAIT IRTMIVRKKN KNGFTVEVQA GAGVVADSIP 
SNEYQETLNK AKGMFTALAC LDPQDL