Gene A9601_04651 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_04651
Symbol
ID	4717163
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	404775
End bp	405950
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	29%
IMG OID	640078177
Product	putative L-cysteine/cystine lyase
Protein accession	YP_001008860
Protein GI	123968002
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.283231
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAATA ATCTAAGAGA TCAAATACCC GCATTAAAAA ATAAGTATTA TTTCAACTAT 
GGCGGTCAAG GACCATTACC AAAATCTTCT CTAGAAGCAA TAGTTAAAAC TTGGGAGATT 
ATCCAAGATT TAGGACCATT TACCAATGAT ATGTGGCCTT TTATTTACAA AGAAATATTG 
ACCACAAAAA GAATCATTGC GCAAAAATTA GGTGTCAATT CAAAGAATGT AGCTTTTACC 
GAAAATATCT CTTCCGGTAT GATTTTGCCC TTTTGGGGAA TAAAAGTAAA AGAGGGAGAA 
GAGTTGTTAA TAAGTGACTG TGAACATCCT GGAGTAGTGG CTGCAAGTCG AGAATTTTGC 
AGAAGAAATA AATTAATATT CAAAATTTTG CCAATCCAAA AAATTAAAAA TCTAAACGAC 
GAAAATATAA TTTTAGAGAT TTTGAAAAAT CTAAATAGTA AGACTAAGAT CCTAATTATT 
TCTCATATCT TATGGAACTT TGGATATAAA ATTCCTTTAA AAGAAATTTC TATCGAATTA 
AAAAATAATC GAGAAAACTC TTATTTACTT GTTGATGGTG CTCAAACCTT TGGGCATATA 
AATATTGAAA AAGAAGTTTT TTATTCTGAT TTATATTCAA TAACTTCTCA CAAATGGGCA 
TGTGGACCAG AAGGACTTGG AGCCATTTAT GTCTCAGATA GATTTATTCG TGAAACAGAT 
CCAACAATAA TTGGTTGGAA ATCATTAAAA AAAGAACAAG GCATTTATGA GCCTTCAGAT 
AATCTTTTTC ATGATGATGC AAGGAAATTT GAAATAGCTA CCTCTTGTAT TCCTTTACTT 
GCTGGGCTAC GGAATTCTTT AGATCTTTTG GATAAAGACT GCCATGAAAA AGAAAAAAAC 
AAAAATATCA AAAAATTAAG TGGAAAACTT TGGGATGAAT TAAATCAATC AAAGGGTGTT 
GAATTAGTTT TAGAAAAAAA ATATTTAAAT GGGATTGTTA GTTTTAATAT CGAAAATATT 
AAAGATAAGG ATAAATATGT AAAGAAACTT GGAGAAAAGA AAATTTGGAT TAGAGTTTTA 
GAAGATCCAA AATGGTTTAG AGCATGCGTA CATCAAATGA CTACAGAAGC TGAGATTGAT 
TTACTTGCTA GAGAAATAAA AAAAATATTG ACTTAA

Protein sequence

MRNNLRDQIP ALKNKYYFNY GGQGPLPKSS LEAIVKTWEI IQDLGPFTND MWPFIYKEIL 
TTKRIIAQKL GVNSKNVAFT ENISSGMILP FWGIKVKEGE ELLISDCEHP GVVAASREFC 
RRNKLIFKIL PIQKIKNLND ENIILEILKN LNSKTKILII SHILWNFGYK IPLKEISIEL 
KNNRENSYLL VDGAQTFGHI NIEKEVFYSD LYSITSHKWA CGPEGLGAIY VSDRFIRETD 
PTIIGWKSLK KEQGIYEPSD NLFHDDARKF EIATSCIPLL AGLRNSLDLL DKDCHEKEKN 
KNIKKLSGKL WDELNQSKGV ELVLEKKYLN GIVSFNIENI KDKDKYVKKL GEKKIWIRVL 
EDPKWFRACV HQMTTEAEID LLAREIKKIL T