Gene A9601_17031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_17031
Symbol
ID	4718434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1446564
End bp	1447790
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	34%
IMG OID	640079430
Product	L,L-diaminopimelate aminotransferase
Protein accession	YP_001010093
Protein GI	123969235
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID	[TIGR03542] LL-diaminopimelate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.118927
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTTCAAG TAAACGAAAA TTATTTAAAA CTCAAAGCAG GCTATTTATT CCCTGAAATT 
GCTAAAAGGG TAAAGCTATA TTCTCAATCA AATAAGAATG CTGAAATTAT CAAGCTTGGA 
ATAGGAGATG TTACAGAACC ATTACCAAGA GCATGCATTG AGGCTATGGG TAAAGCTTTA 
GATGATATGG GCACAACAGA TGGTTTTAGA GGTTATGGAC CAGAACAAGG TTATGCTTGG 
CTCAGAGAAA AAATATCTGA GCATGATTTT ATTTCGAGGG GCTGTCAAAT TTCACCTGAA 
GAAATCTTTG TTTCAGACGG ATCAAAATGC GATAGTAGCA ATATTTTAGA TATTCTTGGC 
AAGGATAATT CAATTGCTGT AACAGATCCT GTTTACCCTG TTTATGTAGA TAGTAACGTG 
ATGACAGGTA GAACTGGAGA TGCTCTTGAA AATGGTACTT ATCAAGGATT GACATATCTT 
GCAATAAATG AAGCGAATAA CTTTTTGCCA GAACTACCTG AAAAAAAAGT TGATATTTTA 
TATCTTTGTT TTCCTAATAA TCCAACTGGA GCAACGATTA ATAAAGAAGA ATTGAAAAAA 
TGGGTTGACT ATGCACTTCA AAACAAATCC TTAATACTTT TTGACGCAGC TTATGAAGCA 
TTTATTCAAG ATAATGATAT TCCACATTCA ATATATGAGA TTGAGGGAGC AAAGGATTGT 
GCTATTGAAT TTAGATCTTT TTCAAAAAAT GCAGGATTCA CTGGAGTTAG ATGTGCTTTT 
ACAGTAATAC CTAAAAATCT CAAAGGTTTG AGCTCAACAA ATGAGGAAAT AGAGTTATGG 
CCTCTTTGGA ATAGGCGACA ATCTACAAAA TTCAATGGAG TAAGTTATGT TGTTCAGAAA 
GGAGCAGAGG CTGTTTATTC TCTTGAAGGG AAGAAACAGG TGAGAGGTTT AATTGATTTT 
TATATGGAAA ATGCAAAAAT AATGAAAAAT AAACTTCAGA ATTCTGGATA TAAAGTTTAT 
GGTGGGGACA ATGCTCCTTA TATCTGGATT AAGGTTCCAG ATCAAATGAC ATCTTGGGAC 
TTTTTTGATT TCCTTCTACA AAAAGTTAGT GTAGTGGGAA CACCTGGGAG CGGATTTGGA 
TTGGCAGGAG AGGGTTATTT TCGCTTGTCA GCATTTAACT CACGATCAAA CGTCATTGAT 
GCAATGGAAA GGATTATTAA TATATAA

Protein sequence

MVQVNENYLK LKAGYLFPEI AKRVKLYSQS NKNAEIIKLG IGDVTEPLPR ACIEAMGKAL 
DDMGTTDGFR GYGPEQGYAW LREKISEHDF ISRGCQISPE EIFVSDGSKC DSSNILDILG 
KDNSIAVTDP VYPVYVDSNV MTGRTGDALE NGTYQGLTYL AINEANNFLP ELPEKKVDIL 
YLCFPNNPTG ATINKEELKK WVDYALQNKS LILFDAAYEA FIQDNDIPHS IYEIEGAKDC 
AIEFRSFSKN AGFTGVRCAF TVIPKNLKGL SSTNEEIELW PLWNRRQSTK FNGVSYVVQK 
GAEAVYSLEG KKQVRGLIDF YMENAKIMKN KLQNSGYKVY GGDNAPYIWI KVPDQMTSWD 
FFDFLLQKVS VVGTPGSGFG LAGEGYFRLS AFNSRSNVID AMERIINI