Gene NATL1_21621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_21621
Symbol	aspS
ID	4780569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1818274
End bp	1820112
Gene Length	1839 bp
Protein Length	612 aa
Translation table	11
GC content	37%
IMG OID	640085460
Product	aspartyl-tRNA synthetase
Protein accession	YP_001015982
Protein GI	124026867
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0173] Aspartyl-tRNA synthetase
TIGRFAM ID	[TIGR00459] aspartyl-tRNA synthetase, bacterial type

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.403344
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGATTG AGAATTTTAT GCGCAATAAG ACTTGTGGAG AACTACGTGC TTCCGCAATT 
AGCGCAAATG TTCAACTATG TGGTTGGGTT GATCGCAGAA GGGATCATGG CGGAGTAATT 
TTTATTGATC TAAGAGACCG TTCTGGAACA ATTCAAATCA CAGTTGATCC AGATCAAGGT 
CAGGATCTTT TTAGCATCGC TGAGAGTCTT AGAAATGAGA CTGTTCTTCA GATCAATGGA 
TTAGTAAGAG CAAGACCTGA CGAAGCTATT AATACAAAAA TCCCAACCGG TGAAGTAGAA 
GTCTTAGCTA AAAATATAAA AATTCTCAAT ACTGTCACTA GTACACTTCC TTTCTCAGTG 
TCAATTCATG ATGAGGAGAG TGTTAAAGAA GAAATCAGAC TAAGGCATAG ATATTTAGAT 
CTCAGAAGAG AGAGAATGAA TAATAATCTT CGATTGAGAC ATAACACGGT CAAAGCGGCT 
AGAAGTTTTC TTGAAAACGA AGGATTTATA GAAGTTGAAA CACCAATTTT GACTCGCTCA 
ACTCCTGAAG GAGCCAGAGA TTACTTAGTA CCCTCACGTG TATGTGGTGG CGAGTTTTTT 
GCTTTACCGC AATCCCCACA ATTATTCAAA CAATTGTTGA TGGTTGGTGG AGTTGAACGT 
TATTACCAAG TCGCTCGTTG TTTTCGTGAT GAAGATTTAC GCGCAGACAG GCAACCAGAA 
TTTACTCAAT TAGATATTGA AATGAGTTTT ATGGAGGAAA AAGAGATCAT CGAATTAAAT 
GAAAAATTAA TTGTAAGTAT ATGGAAAAAA ATTAAAGGGA TTGATCTCCA AACTCCATTT 
CCGAGAATGA CTTGGCAAGA ATCTATGGAT CGTTTTGGAA CTGACAGACC TGATACTCGA 
TATGGAATGG AACTTGTCAA CACAAGTGAT TTATTTTCCA AAAGTGGATT TAAAGTTTTT 
TCAAATGCTA TTTCTTCTGG TGGATGCGTT AAGTGCATCA CCATTGAGGA TGGAAATAAT 
TTGATTAGTA ATGTAAGAAT AAAACCGGGT GGAGATATTT TTAGCGAAGC CCAAAAGGCT 
GGTGCTGGTG GACTAGCATT TATCAGGGTT CGAGATGATC AAGAAGTCGA TACAATTGGA 
GCCATAAAAG ATAATTTAAC TACCTCGCAA ATAAAAGAAC TCCTATTAAA AACCCAAGCT 
AAACCTGGTG ATCTAATACT TTTTGGTGCT GGGCCCACAA ACATTGTTAA TAGAACCTTA 
GATAGAGTTC GTCAATTTAT TGCGAAAGAT CTAAAGATAA TCTCAGACAA CGAATTAAAA 
ACTCAGTGGA ATTTTCTTTG GGTCACTGAT TTTCCTATGT TTGAATTCAA TTCTGATGAA 
AATCGTCTTG AAGCAATTCA TCATCCTTTC TGTGCTCCTA AGCCTGAAGA TATTGGTGAA 
TCAGAAAGCC TATGGAAAGA CAAATTACCC AATTCAAATG CTCAAGCGTA TGATCTAGTT 
CTTAATGGAT TAGAAATTGG CGGGGGATCT TTAAGAATTC ACAACTCAGA ACTTCAAAAA 
ACCGTACTAG AAGTAATTGG TCTATCAAAA AATGAAGCAG AAGAGCAGTT TGGTTTTTTA 
ATTGATGCCC TTGCCATGGG TGCTCCACCA CATGGTGGGA TTGCATTTGG ACTGGACAGA 
ATAGTTATGC TCTTAGCCAA TGAAGATTCA ATTAGAGATA CTATTGCTTT TCCAAAAACA 
CAACAAGCTC GTTGTTCTAT GGCTAAAGCG CCTGCAAACG TGGAAAACAA ACAATTAGAA 
GACCTCCACA TAGCTTCTAC TTGGATAGAT CCTGATTGA

Protein sequence

MMIENFMRNK TCGELRASAI SANVQLCGWV DRRRDHGGVI FIDLRDRSGT IQITVDPDQG 
QDLFSIAESL RNETVLQING LVRARPDEAI NTKIPTGEVE VLAKNIKILN TVTSTLPFSV 
SIHDEESVKE EIRLRHRYLD LRRERMNNNL RLRHNTVKAA RSFLENEGFI EVETPILTRS 
TPEGARDYLV PSRVCGGEFF ALPQSPQLFK QLLMVGGVER YYQVARCFRD EDLRADRQPE 
FTQLDIEMSF MEEKEIIELN EKLIVSIWKK IKGIDLQTPF PRMTWQESMD RFGTDRPDTR 
YGMELVNTSD LFSKSGFKVF SNAISSGGCV KCITIEDGNN LISNVRIKPG GDIFSEAQKA 
GAGGLAFIRV RDDQEVDTIG AIKDNLTTSQ IKELLLKTQA KPGDLILFGA GPTNIVNRTL 
DRVRQFIAKD LKIISDNELK TQWNFLWVTD FPMFEFNSDE NRLEAIHHPF CAPKPEDIGE 
SESLWKDKLP NSNAQAYDLV LNGLEIGGGS LRIHNSELQK TVLEVIGLSK NEAEEQFGFL 
IDALAMGAPP HGGIAFGLDR IVMLLANEDS IRDTIAFPKT QQARCSMAKA PANVENKQLE 
DLHIASTWID PD