Gene P9301_01901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_01901
Symbol
ID	4912848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	+
Start bp	174686
End bp	175831
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	31%
IMG OID	640159756
Product	NifS-like aminotransferase class-V
Protein accession	YP_001090414
Protein GI	126695528
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTATCAA CTCCCATACT ACTAGACTAT CAATCTTCGA CTCCTTGCTC TAAAGATGTC 
GTTGATTCTA TGAAACCTTT TTGGAGTGAG ATATTTTCTA ACCCTGCAAA TAAATCTAAT 
TTGGCTGGGA TTAACGCAAG CGCTATATTG GAAGCCTCAA GAGAAAAAAT AGAACAAAGT 
TTATTTCTTA AGAATAAAAA AGTTATTTTT ACAAGTGGGG CAACTGAATC TAATAACTTA 
GCCTTATTAG GTTTTGCTAG AAATTTCTAT AAAAAAACAG GAAATTATGG ACATATTATT 
ACCTTAAAAA CAGAGCATAA AGCTGTTTTG GAGCCCCTTA ACCAACTTAA AAAAGAGGGA 
TTTATGGTTA CAGAAATTAA TCCTGAGAAA GATGGCTTAA TTTCAGAAGA ACAATTCAAA 
AAAAATATAA GAGAAGATAC ATTTCTGGTT AGTGTCATGT TGGCAAATAA CGAAATTGGA 
GTTATTCAGC CTCTAGAGAA TATTTCAAAG ATATGTAAAT CGAGGGGAAT AACTTTGCAC 
TCTGATTTCG CACAATGTTT AGGTTATATC GAGTTAGACA ATCTTTTATC AGACGTAAAT 
ATGATAACGA TTAGTTCTCA CAAAATATAT GGTCCTAAAG GGATAGGACT TCTTTTGATT 
GATGAAGAAA TTAATCTTGA GCCTTTAATT GTTGGAGGAG GTCAGGAATA TGGTCTTAGG 
TCTGGCACAT TACCTCTTCC TCTAGTAGTT GGCTTTGCTA AAGCAATAGA GATAGCAGTT 
CTTAATCAAA AAAATAATGC TGAGAAATTA CTTTTTTATA GAAATAATCT TTTAGAGGGG 
TTGTTAAAAA ATAATTCTGG TTTAATAATT AATGGCTCAA TAGAAAAAAG ATTACCTCAT 
AATTTAAATT TGACTGTATT GGATTTAAAC GGAGCAAAGT TTCATAAACT TTTAAAATCT 
AAAATAATTT GTTCTACTGG ATCTGCATGT AGTAGTGGTC AACCATCTCA TGTCTTACTA 
GCCTTAGGTA GATCTCTGAA AGAAGCAGAA TCTTCAATAA GGTTAAGTAT TGGATTAAGT 
ACTAATTCAA AAGATATAAA ACAAGCAATT CATATTCTTA CAAATACAAT CAGATCATTA 
CGATAG

Protein sequence

MLSTPILLDY QSSTPCSKDV VDSMKPFWSE IFSNPANKSN LAGINASAIL EASREKIEQS 
LFLKNKKVIF TSGATESNNL ALLGFARNFY KKTGNYGHII TLKTEHKAVL EPLNQLKKEG 
FMVTEINPEK DGLISEEQFK KNIREDTFLV SVMLANNEIG VIQPLENISK ICKSRGITLH 
SDFAQCLGYI ELDNLLSDVN MITISSHKIY GPKGIGLLLI DEEINLEPLI VGGGQEYGLR 
SGTLPLPLVV GFAKAIEIAV LNQKNNAEKL LFYRNNLLEG LLKNNSGLII NGSIEKRLPH 
NLNLTVLDLN GAKFHKLLKS KIICSTGSAC SSGQPSHVLL ALGRSLKEAE SSIRLSIGLS 
TNSKDIKQAI HILTNTIRSL R