Gene P9211_00781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_00781
Symbol
ID	5731804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	83904
End bp	85163
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	34%
IMG OID	641284421
Product	putative cysteine desulfurase or selenocysteine lyase
Protein accession	YP_001549963
Protein GI	159902619
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.674845
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGACTA TTAATGAAAA AAATCTAGCT AAATTAACAA GAAAGGACTT TCCTCTTTTC 
TCTAGTGAAG ATCTCAAAAA TAACCCTTTG GTTTATTTAG ACCATGCCGC TACAAGTCAA 
AAGCCAAAGA AAGTTATTGA AGCTATCAGC CATTATTATA AATATGAAAA TGCAAATGTT 
CACCGGGGTG CCCATCAATT AAGTGCAAAA GCAACAGAGG CTTTTGAAAA AGCACGTACA 
ATAACATCCA AATTTATTAA TGCATCTTCT GAAAGAGAAA TTGTTTTTAC AAGAAATGCC 
ACTGAAGCTA TAAACTTAGT CGCTCATTCC TGGGGTGATT CAGAGCTAAA AGAGGGCGAT 
GAAATCTTAA TTAGCTTAAT GGAGCATCAT AGTAATATCG TACCTTGGCA ATTACTAGCT 
GAAAGAAAAA AATGCAATTT AAGATATATA GGAATCACTT CAAGTGGACA ATTAGATCTT 
GAAGATGCCT ATAGTAAATT AAATGAAAAA ACAAGGATAT TGAGTTTACA ACATATTAGT 
AATACATTGG GATGTTGTAA TCCTATTGCT GAAATTACTC AGAAGGCACA TAGTGCTGAT 
GCTTTAATTC TTGTCGATGC TTGTCAAAGT CTTGCTCATC AACCTATCGA TGTTAAAAAA 
TTAAATATTG ATTTTCTAGC AGGCTCTTCT CATAAATTAT GTGGACCAAC AGGATGTGGT 
TTTTTATGGG CAAAAGAAAA TCTATTGGAA AAAATGCCTC CTTTTTTAGG AGGAGGGGAA 
ATGATACAAG AAGTGTCTTT AAATAAAAGT AGCTGGGCAG ATTTGCCTCA CAAATTTGAA 
GCAGGTACTC CAGCTATAGG AGAGGCAATT GGAATGGGAG CCGCCTTAAC TTATCTCGAG 
TCCATAGGCC TAAATAATAT ACATGCTTAT GAAAAAAAAC TTACTAAATA TCTTTTCCAG 
CAATTAGAAA CTATTGAAGG TATTAATATT ATTGGTCCAA ATCCAAAAAT ACAAAGTAAT 
CGAGCTCCCC TCGCAACCTT TACAATAAAT AAATTGCATT CAAATGATAT TGCATCCCTT 
CTAGATACAA GCAATATATG CATTCGAAGT GGACATCATT GTTGCCAACC ACTGCACAAA 
CACTATGGAA TTAGTTCATC AGCTAGAGCA AGTCTTAGTT TTACATCAAC AATAGATGAA 
ATAGATACTT TTGTTTCTCA ACTAATATCC AGCATAAATT TCCTACAAGA AAATTCTTAG

Protein sequence

MMTINEKNLA KLTRKDFPLF SSEDLKNNPL VYLDHAATSQ KPKKVIEAIS HYYKYENANV 
HRGAHQLSAK ATEAFEKART ITSKFINASS EREIVFTRNA TEAINLVAHS WGDSELKEGD 
EILISLMEHH SNIVPWQLLA ERKKCNLRYI GITSSGQLDL EDAYSKLNEK TRILSLQHIS 
NTLGCCNPIA EITQKAHSAD ALILVDACQS LAHQPIDVKK LNIDFLAGSS HKLCGPTGCG 
FLWAKENLLE KMPPFLGGGE MIQEVSLNKS SWADLPHKFE AGTPAIGEAI GMGAALTYLE 
SIGLNNIHAY EKKLTKYLFQ QLETIEGINI IGPNPKIQSN RAPLATFTIN KLHSNDIASL 
LDTSNICIRS GHHCCQPLHK HYGISSSARA SLSFTSTIDE IDTFVSQLIS SINFLQENS