Gene P9303_14321 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_14321
Symbol	aspC
ID	4778705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	1226544
End bp	1227722
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	52%
IMG OID	640086941
Product	aminotransferases class-I
Protein accession	YP_001017443
Protein GI	124023136
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACTCC CGCCTCATCT TTCCGACCGA GTCGTTGCCC TTCAGCCCTC ACTCACACTG 
GCAATCAGTG CTCGAGCAAA GGCTCTTCAG CAAGAAGGCC GCGACATTTG CAGCATGAGT 
GCTGGTGAGC CGGATTTCAA TACCCCTGAA TTCATCATTG ATGCCACGGT GAAGGCACTC 
CGTGATGGCA TCACCCGTTA TGGCCCTGCC GCTGGAGACC CTGAACTGCG TGAGGCAATA 
GCCACCAAGC TCAGCAAAGA AAACACTGTG CCAACCAATG CAGAGCAAGT GTTGGTGACC 
AATGGAGGCA AGCAAGCAAT CTTTAACTTG TTTCAGGTGA TCCTCAATCC AGGCGATGAG 
GTTTTAATCC CTGCTCCTTA TTGGCTGAGT TATCCAGAAA TGGCCCGCTT AGCCGGTGCA 
AAGGTGACAA CACTTCCCTC CACTCCAGAA AACGGTTTCT GTCTAGATCT CAACAACCTA 
GAAGCTTCCA TCGGCTCAAA AACCCGTCTG TTAATACTTA ATTCCCCGGG CAACCCAACC 
GGTCGTGTGA TGGCACGCAA GGAGCTGGAA GCTTTGGCTG ATCTGCTAAG AAATTATCCC 
CAGATCCTTG TCATGAGTGA TGAGATCTAC GAGTTCATTC TTGAAGACGG GCAACAGCAT 
CACAGCTTCT CTGCTATAGC ACCAGATCTT TCAGACAGAA CCTTCATCGT TAACGGCTTT 
GCCAAGGGCT GGGCAATGAC TGGTTGGCGG TTGGGTTATC TAGCCGGCCC CGCTCATGCA 
GTGAAAGCGG CCACTGCCCT CCAAAGCCAG AGCACGAGCA ATGTCTGCAG TTTCGCTCAG 
CGTGGAGCCT TGGCCGCGCT GCAAGGCTCA AGGGAGTGTG TGAAGAAGAT GGTTAATAGC 
TACAACACCC GACGCGAACT CCTCGCCTCT GGCTTGCTTG GCCTTGAAGG GATCAGCCTG 
ATCTCTCCAA AAGGTGCGTT TTATGCCTTC CCAAAACTAC CTGAAGGAAG CCTCGACTCA 
GTAAGTTTCT GTCAGCAAGC TCTTGAAAAC TATGGGCTTG CCATGGTTCC AGGTGCCGCA 
TTCGGAGACG ACAGTTGCAT ACGCCTCACT TGTGCTGTGT CACATAAGAC GATTTGCGAT 
GGACTAGAAC GTCTCCGCAA AGCTCTAAAA CAGAGCTAA

Protein sequence

MPLPPHLSDR VVALQPSLTL AISARAKALQ QEGRDICSMS AGEPDFNTPE FIIDATVKAL 
RDGITRYGPA AGDPELREAI ATKLSKENTV PTNAEQVLVT NGGKQAIFNL FQVILNPGDE 
VLIPAPYWLS YPEMARLAGA KVTTLPSTPE NGFCLDLNNL EASIGSKTRL LILNSPGNPT 
GRVMARKELE ALADLLRNYP QILVMSDEIY EFILEDGQQH HSFSAIAPDL SDRTFIVNGF 
AKGWAMTGWR LGYLAGPAHA VKAATALQSQ STSNVCSFAQ RGALAALQGS RECVKKMVNS 
YNTRRELLAS GLLGLEGISL ISPKGAFYAF PKLPEGSLDS VSFCQQALEN YGLAMVPGAA 
FGDDSCIRLT CAVSHKTICD GLERLRKALK QS