Gene A9601_02041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_02041
Symbol
ID	4716888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	186926
End bp	188035
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	27%
IMG OID	640077903
Product	aminotransferases class-I
Protein accession	YP_001008599
Protein GI	123967741
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0980416
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGATT TTGATCCATT AAATAATCTT TTCCCAAAAC CAAGAGAAGA AATAATAAAT 
ATGCAGTCTT ACTCTGCACC TTTAGAAAAT AGAAGAAATT TACTCCGCTT AGACTTTAAT 
GAAAATACTT TAGGTCCAAG TCCTAAGGTT CTAGAGGCAT TAAAAGCGAT AAAATTAGAT 
GAGATTTCAA TTTATCCAGA ATATAATTTT TTAAAAAAAT ATTTATGTGA TAAATATCTT 
GATTCAAGAA AATTTGGTAA TGATGAAATC GGAATTTTCA ATGGAGCAGA TGCAGCAATA 
AATGCAATTT TCAATTGCTT TGGAGAAAAA GATCAAATAT TTCTAACCAC AAATCCAACT 
TTTGGTTACT ATTCTCCTTG TGCAGAAATC CGAGGAATGA AAAAAATAAG TTGTTCTTAC 
ATTGGAGAAA ATTTTCTATT CCCCATCGAA GAATTTAGGG AAAAAATAAT AAAGCATAAT 
CCAAAGTTAA TATTTATTTG CAATCCAAAT AATCCAACAG GAACTGTTCT AAGCTCTCAT 
GAAATAATTA ATTTAGCCAA TATCAATAAA GATTCATTAA TAGTTGTTGA TGAACTATAT 
GAAAAATTTA ATGGAGATAG TCTTCTTAAA TCGATAGATT TTGAAAAAAA TAAAAATATA 
CTAATAATAC AATCTCTTTC AAAAACTGCA GGTCTAGCTG GTTTAAGAAT AGGTTTTACT 
TTTGGCAATA AAAGTTTAAT TCAGTACATT AATAAAGTTA CAGGACCATA TGATGTAAAC 
AGCTTTGCTA TAACAGCTGC ATTAGCAGCA CTTAAAGACA AATCATATAT TGATAATTAT 
GTTTTAGAAG TAAAAAAGGC GAGGGAATGG ATTTTAAATA AATTTAAATC AACAAAAATC 
AGAACTCACT TTAGTGGAGG TAATTATTTC TTAATTTGGC CAAAAAAAGA TCCTAAAATC 
TTAATACAAC AGATGAGAGC AAAAGGTATT CTTATTAGAA GTATGGAAAA CAAAAAAGAT 
ATCAGTAATT CTATAAGGGT TAGTATTGGA ACTAAAGAAC AAATGATTTT TTTCTGGGAC 
AATTACAAGA TATTAGATTT AAAAAATTAA

Protein sequence

MNDFDPLNNL FPKPREEIIN MQSYSAPLEN RRNLLRLDFN ENTLGPSPKV LEALKAIKLD 
EISIYPEYNF LKKYLCDKYL DSRKFGNDEI GIFNGADAAI NAIFNCFGEK DQIFLTTNPT 
FGYYSPCAEI RGMKKISCSY IGENFLFPIE EFREKIIKHN PKLIFICNPN NPTGTVLSSH 
EIINLANINK DSLIVVDELY EKFNGDSLLK SIDFEKNKNI LIIQSLSKTA GLAGLRIGFT 
FGNKSLIQYI NKVTGPYDVN SFAITAALAA LKDKSYIDNY VLEVKKAREW ILNKFKSTKI 
RTHFSGGNYF LIWPKKDPKI LIQQMRAKGI LIRSMENKKD ISNSIRVSIG TKEQMIFFWD 
NYKILDLKN