Gene P9301_02181 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_02181
Symbol
ID	4911904
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	202752
End bp	203876
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	31%
IMG OID	640159784
Product	aminotransferases class-I
Protein accession	YP_001090442
Protein GI	126695556
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAAT CCGAAACTAA TGATTACTCA ACATTAGCCA TGCAAATATC AGACTTAAAG 
CATGGAGGAA ATGTATATGC AAATGCAAAA AAATTAAATT TATTACCCTC TGAAATCATT 
GACGCAAGTG CCTCGTTAGT ACCCTTTGAT CCACCTCAAA TACTAATAGA TTCATTAAAT 
GCGGGAATTA AGAATCTTGG ATTTAGATAT TACCCAGAGA GAAACTTGAG TGATCTGAAA 
GAAATAATCG GTAAATTTCA TGGGATAAAT CCAGATAATA TATTGCCTGG AAATGGAGCT 
TCTGAGCTAA TAACCTGGGC AGGTTATGAA GCATCCAAAT TTGGAATAAG TTGTATTCCT 
TCTCCATCAT TTGTTGATTA TGAAAGATCT TTAAATTGTT GGAATAGCAA TTTTGTACAT 
TGCGAATTAC CAAAAAACTG GAATGATATT TTTCCTCAAT CATTCCCGCT TCATCCAAAA 
GGTGATGTTA TTTGGATAAC AAATCCACAT AACCCTACCG GTCAATTATG GGAAAAGAAT 
TCATTGGAGG AACTTGTAAA AAAATATAAA TTAGTTATCT GTGATGAAGC TTTCTTATCG 
ATAACACCTA ATGGAGACAA AGAATCTTTA ATACCATTAA CCCAAAGATT TGATAATTTA 
TTAGTCTTGA GAAGCTTGAC TAAAATCTTC AATATTCCTG GTCTTAGATT AGGTTACGTT 
ATTGGTTCAT CGAAAAAACT TAAGCAATGG GAAATAAAAA GAGATCCTTG GCCTTTAAAT 
TCATTTGCTA TTAAAGCCGG AATTGATCTA CTAAGTAATA AGAAATTCTA TGAACAATGG 
ACAAAACAGA TTCACAGCTG GATAAATATT GAAAAAAAGA GAGTATTTGA AAAATTATCA 
AAAATAGAGA GTCTTAAAGT TCATAACTCT TCAACCAACT TTTTTTTAGT AGAAAGTAAA 
ACATCCTTGT CGCCAAATAT CAAATACTTA GAAAATAAGG GAATATTGCT TAGAGAATGC 
ACTTCATTTA GATTTCTTGA CGAAAAGTGG GCAAGAATAA GTTTGCAGAA CAGCAAAAAT 
AACACTCTTT TATGTGAAGA AATTCAGAAT TCCTTCAAAA AATAA

Protein sequence

MNKSETNDYS TLAMQISDLK HGGNVYANAK KLNLLPSEII DASASLVPFD PPQILIDSLN 
AGIKNLGFRY YPERNLSDLK EIIGKFHGIN PDNILPGNGA SELITWAGYE ASKFGISCIP 
SPSFVDYERS LNCWNSNFVH CELPKNWNDI FPQSFPLHPK GDVIWITNPH NPTGQLWEKN 
SLEELVKKYK LVICDEAFLS ITPNGDKESL IPLTQRFDNL LVLRSLTKIF NIPGLRLGYV 
IGSSKKLKQW EIKRDPWPLN SFAIKAGIDL LSNKKFYEQW TKQIHSWINI EKKRVFEKLS 
KIESLKVHNS STNFFLVESK TSLSPNIKYL ENKGILLREC TSFRFLDEKW ARISLQNSKN 
NTLLCEEIQN SFKK