Gene NATL1_00111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_00111
Symbol	argH
ID	4781267
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	14783
End bp	16174
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	35%
IMG OID	640083274
Product	argininosuccinate lyase
Protein accession	YP_001013840
Protein GI	124024724
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.642056
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAAAAG CATTGAGCAA AACTTGGAGT GACAGATTTG ATAAAGGACT TAATCCTTTT 
ATAGAAAAAT TTAATGCTTC AATCGAGTTT GATATTTGTT TATTAGAGGA AGATTTGGAT 
GGATCAATTG CCCATGCACG TATGCTTGGA ATTCAAGGGA TTATTACCAA GGAAGAGGCG 
CTTAGATTAG AGAATGGTCT TCAACAGATT CGAAAAGAGG CTTCTGATGG CTTATTTCAG 
CCTGTCATTG CAGATGAAGA TGTGCATTTT GCAGTAGAAA AAAAATTAAT AGACTTGATA 
GGCCCAGTAG GGAAAAAACT ACATACTGGT CGTAGTCGTA ATGATCAAGT TGGAACAGAT 
CTGAGATTAT GGCTAAGAAA ACGTATTGAT GAAATTGATA TGGATTTGGT ACGTCTTCAG 
AAATCTCTTT TTTTATTAGC AGAGGAAAAT CTGTATACGC TTATTCCTGG TTATACGCAT 
TTACAAAGAG CCCAACCTTT GTCTCTGGCG CATCACTTGT TGGCATATAT TGAGATGGCA 
CAAAGAGATA GAAATAGATT AAAAGATGTA AGAAAACGAG TGAATATTTC TCCACTAGGA 
GCAGCTGCTT TAGCTGGCAC ATCGATTTCT ATAAGCAGAA AGATTACTTC TTCAGAATTA 
CACTTTCAAG GTATTTATTC TAATAGTTTA GATGCTGTAA GTGATAGAGA CTTTGTCGTA 
GAATTTTTAG GAGCTTCATC GTTAATTATG GCTCATTTAA GTAGATTATC TGAAGAAGTA 
ATTTTGTGGG CATCTGAAGA ATTTGCCTTT ATTCAATTAA CCGACCGATG TGCTACTGGA 
AGTAGTCTTA TGCCTCAAAA AAAGAATCCT GATGTACCTG AACTTGTTCG AGGCAAGTCA 
GGAAGAGTAT TTGGACATTT ACAAGCTATG CTGACTATGA TTAAGGGATT ACCTTTAGCT 
TACAACAAAG ATTTTCAAGA AGACAAAGAA GCTATCTTTG ATAGTGTTAA AACAGTTAAG 
AATTCTTTGA TTGCCATATC AATTTTGTTT GAAGAGGGTT TAATTTTTAG AAAAGAAAGA 
CTTAATCAAG CTGTTTCCTC AGATTTTTCA AATGCGACTG ATGTCGCTGA TTATTTAGTG 
GCTAAGGACA TACCTTTCCG AGAGGCTTAT CAATTAGTTG GGCGAATTGT AAAAACTTCC 
TTGGAGGAGG GGATTTTATT AAAAGATTTT CCTTTAGAAA GATGGAAAAC ATTTCATAAA 
TTTTTTGAAA AAGATATTTA TGAAAAGCTT TTGCCTTCGA GTGTAGTTGA GTCTCGTTTG 
AGTGCTGGTG GAACTGGATT TGAGAGAGTT CAAGAACAGC TTCTTTCTTG GCGAGAAAAA 
TTATTTAATT AA

Protein sequence

MEKALSKTWS DRFDKGLNPF IEKFNASIEF DICLLEEDLD GSIAHARMLG IQGIITKEEA 
LRLENGLQQI RKEASDGLFQ PVIADEDVHF AVEKKLIDLI GPVGKKLHTG RSRNDQVGTD 
LRLWLRKRID EIDMDLVRLQ KSLFLLAEEN LYTLIPGYTH LQRAQPLSLA HHLLAYIEMA 
QRDRNRLKDV RKRVNISPLG AAALAGTSIS ISRKITSSEL HFQGIYSNSL DAVSDRDFVV 
EFLGASSLIM AHLSRLSEEV ILWASEEFAF IQLTDRCATG SSLMPQKKNP DVPELVRGKS 
GRVFGHLQAM LTMIKGLPLA YNKDFQEDKE AIFDSVKTVK NSLIAISILF EEGLIFRKER 
LNQAVSSDFS NATDVADYLV AKDIPFREAY QLVGRIVKTS LEEGILLKDF PLERWKTFHK 
FFEKDIYEKL LPSSVVESRL SAGGTGFERV QEQLLSWREK LFN