Gene P9301_04261 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_04261
Symbol
ID	4911436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	371813
End bp	372799
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	39%
IMG OID	640160004
Product	O-acetylserine (thiol)-lyase A
Protein accession	YP_001090650
Protein GI	126695764
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID	[TIGR01136] cysteine synthases [TIGR01139] cysteine synthase A

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAAAA TTTATGAGGA CAACAGTTTT GCTATTGGAA ACACTCCATT AGTAAAATTA 
AAATCAGTTA CTAAAAACGC GAAAGCTACA GTACTTGCAA AAATTGAAGG TAGAAACCCC 
GCTTATAGTG TCAAATGTAG GATCGGCGCA AACATGATCT GGGATGCCGA GAAAAGTGGG 
AAACTTACAA AAGACAAAAC TATTGTTGAG CCAACTTCTG GAAATACAGG CATAGCTCTA 
GCTTTTACTG CTTCAGCAAG AGGTTATAAA CTAATCCTTA CAATGCCAGA ATCCATGTCA 
ATTGAAAGAA GAAGGGTTAT GGCAGTGTTG GGTGCTGAAA TTGTTTTAAC AGAGGCATCT 
AAAGGTATGC CTGGAGCAAT AGCTAAGGCT AAAGAAATTG CAGAAAGTAA TCCTTCTCAA 
TATTTCATGC CAGGTCAATT TGATAATCCA GCAAACCCTG AAATTCATTT CAAAACTACT 
GGGCCAGAAA TCTGGGATGA TTGCGATGGT GAAATTGATG TCCTAGTTGC AGGGGTTGGA 
ACTGGCGGCA CAATTACAGG AGTTTCAAGA TACATTAAGC AAGAGAAGGG TAAGAATATT 
ACTTCTGTAG CAGTAGAACC ATCACACAGT CCTGTTATTA CACAGACAAT GAATGGAGAA 
GAGGTTAAAT CCGGACCACA TAAAATCCAA GGAATTGGAG CAGGATTTAT TCCTAAGAAC 
CTTGACTTAT CAATTGTTGA TAAGGTCGAA CAAGTAACAA ATGACGAATC AATTGAGATG 
GCTCTTAGGT TAGCTAAAGA GGAGGGTCTA TTAGTAGGAA TATCTTGTGG GGCTGCCGCT 
GCTGCCGCTG TTAGATTAGC TGAACAAGAT GAATATGCGG GGAAGACAAT TGTAGTTGTT 
CTACCTGATT TAGCAGAGAG GTATTTATCA TCAATTATGT TTACTGAAGT TCCAAGCGGA 
ATCATTCAAG AACCAGTCAA AGCCTAA

Protein sequence

MAKIYEDNSF AIGNTPLVKL KSVTKNAKAT VLAKIEGRNP AYSVKCRIGA NMIWDAEKSG 
KLTKDKTIVE PTSGNTGIAL AFTASARGYK LILTMPESMS IERRRVMAVL GAEIVLTEAS 
KGMPGAIAKA KEIAESNPSQ YFMPGQFDNP ANPEIHFKTT GPEIWDDCDG EIDVLVAGVG 
TGGTITGVSR YIKQEKGKNI TSVAVEPSHS PVITQTMNGE EVKSGPHKIQ GIGAGFIPKN 
LDLSIVDKVE QVTNDESIEM ALRLAKEEGL LVGISCGAAA AAAVRLAEQD EYAGKTIVVV 
LPDLAERYLS SIMFTEVPSG IIQEPVKA