Gene A9601_01881 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_01881
Symbol
ID	4716872
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	173705
End bp	174850
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	31%
IMG OID	640077887
Product	NifS-like aminotransferase class-V
Protein accession	YP_001008583
Protein GI	123967725
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTATCAA CTCCCATACT ACTAGACTAT CAATCTTCGA CTCCTTGCTC TAAAGATGTT 
GTTGATTCTA TGAAACCTTT TTGGAGTGAG ATATTTTCTA ATCCTGCAAG CAAATCTAAT 
TTGGCGGGAA TTAACGCAAG CGCTATATTG GAAGCCTCAA GAGAAAAAAT AGAACAAAAT 
TTATTTCTTA AGAATAAAAA AGTTATTTTT ACAAGCGGGG CAACTGAATC TAATAACTTA 
GCTTTATTAG GTTTTGCTAG AAATTTCTAT AAAAAAACAG GAAATTATGG ACATATTATT 
ACCTTAAAAA CGGAGCATAA AGCTGTTTTG GAGCCCCTAA ATCAACTAAA AAAAGAGGGA 
TTTATGGTTA CAGAAATTAA TCCTGATAAA GATGGCTTAA TTTCAGAAGA ACAATTCAAA 
AAAAATATAA AAGAAGATAC ATTTCTGGTT AGTGTAATGT TGGCAAATAA CGAAATAGGA 
GTTATTCAGC CCATAGAGAA TATTTCAAAG ATATGTAAAT CGAGAGGAAT AATTTTCCAC 
TCTGATTTTG CACAATGTTT AGGTTATATG GCGTTAGACA ATCTTTTATC AGATGTAAAC 
ATGATAACGA TGAGTTCGCA CAAAATATAT GGTCCAAAAG GGATAGGACT TCTTTTGATT 
GATGAAGAAA TTAATCTTGA GCCTTTAATT GTTGGAGGAG GTCAGGAATA TGGTCTTAGG 
TCTGGAACAT TACCTCTTCC TTTAGTAGTT GGCTTTGCTA AAGCAATAGA GATAGCAGTT 
TTTAATCAAA AAAATAATGC TGAGAAATTA CTTTTTTACA GAAATAACCT TTTAGAGGGG 
TTGTTAAAAA ATAATTCTGG TTTATTAATT AATGGCTCTA TAGAAAAAAG ATTACCTCAC 
AATTTAAATT TGACTGTATT GGATTTAAAC GGAGCAAAGT TTCATAAACT TTTAAAATCT 
AAAATAATTT GTTCTACTGG ATCTGCATGT AGTAGTGGTG AACCATCTCA TGTTTTACTA 
GCCTTAGGTA GATCTCTTAA AGAAGTAGAA TCTTCAATAA GGCTAAGTAT TGGATTAAGT 
ACTAATTCAA AAGATATAAA ACAAGCAATT CATATTCTTA CAAATACGAT CAGATCATTA 
CGATAG

Protein sequence

MLSTPILLDY QSSTPCSKDV VDSMKPFWSE IFSNPASKSN LAGINASAIL EASREKIEQN 
LFLKNKKVIF TSGATESNNL ALLGFARNFY KKTGNYGHII TLKTEHKAVL EPLNQLKKEG 
FMVTEINPDK DGLISEEQFK KNIKEDTFLV SVMLANNEIG VIQPIENISK ICKSRGIIFH 
SDFAQCLGYM ALDNLLSDVN MITMSSHKIY GPKGIGLLLI DEEINLEPLI VGGGQEYGLR 
SGTLPLPLVV GFAKAIEIAV FNQKNNAEKL LFYRNNLLEG LLKNNSGLLI NGSIEKRLPH 
NLNLTVLDLN GAKFHKLLKS KIICSTGSAC SSGEPSHVLL ALGRSLKEVE SSIRLSIGLS 
TNSKDIKQAI HILTNTIRSL R