Gene P9211_00121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_00121
Symbol	argH
ID	5731751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	14906
End bp	16294
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	37%
IMG OID	641284354
Product	argininosuccinate lyase
Protein accession	YP_001549897
Protein GI	159902553
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.669318
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00196346
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGGGAAAAC CTTGGAGCGA TCGATTCGAA GTAGGCCTTC ATCCTTTTAT AGAGAGTTTT 
AATGCTTCTA TAAAGTTTGA TTTTCTTCTT TTGCAAGAAG ATCTTGATGG ATCAATAGCT 
CATGCAAGGA TGCTAGGCAA AACAGGCATA ATTAATGCTG ATGAAGCATC TCAACTTGAA 
AAAGGCTTAA ACCAGATTCG TTTAGAAGCA TCCCAAGGTG TTTTTAATGC TGATCAACCT 
GCTGAGGATG TTCATTTCGC TGTTGAGAAC AGATTAATAG AACTTTTAGG ACCGCTTGGA 
AAGAAACTGC ATACTGGTAG AAGTAGAAAT GATCAAATAG CTACAGATAT AAGATTATGG 
TTGCGACGAA AAATTGATGA AATCAATTTT GATTTAGAAA ATATTCAAAA GATTTTGTTG 
GGCCATGCAG AAAAGAATTT GTATACACTT ATTCCTGGAT ATACGCATTT GCAAAGAGCT 
CAACCTGTTT CATTAGCTCA TCATTTACTT GCATATCTTG AAATGTTTCA GAGAGATAGA 
GATCGTTTGG TCGAAGTCAA AAGTCGAGTT AATACCTCTC CTTTGGGAGC AGCTGCCTTA 
GCAGGAACTT CTTTACCAAT TGACAGGCTA TATACAGCAG ATCAATTAAA TTTTACTAGT 
ATTTATTCCA ATAGTTTAGA TGCAGTAAGT GATCGTGATT TTGCAGTTGA ATTTATTGCT 
GCATCTTCAT TAATTATGGT TCACTTAAGC CGATTATCAG AAGAAATAAT TTTTTGGTCT 
AGCGAAGAAT TTTCGTTTGT AAAATTAACC GATCGATGCG CAACTGGTAG CAGCATAATG 
CCTCAAAAAA AGAATCCTGA TGTACCTGAA CTTGTTAGAG GAAAGTCAGG AAGAGTCTTT 
GGCCATCTCC AAGCTTTGTT GGTCATGCTC AAAGGTCTGC CTCTTGCATA TAACAAAGAT 
TTTCAGGAAG ATAAAGAGGC TCTTTTTGAC ACAGTAGTGA CTGTTAGAAA TTCTCTTCAA 
GCAATGTCTA TTCTCTTAGA AGAGGGTTTG GAGTTTTCTT TAGATCGCCT GGGATCAGCC 
GTGGAATCGG ATTTTTCTAA TGCAACTGAT GTGGCAGATT ATTTAGTTTC TAAAGAAGTC 
CCTTTTAGAG AGGCTTATCA GATTGTTGGA CGTTTAGTAA AGCTTTGTAT GAAAGAAGGT 
ATTTTGCTTA AGGATCTTTC TTTTGATCAA TGGCAGGATA TGCACCCTGC TTTTGATCAG 
GATATATATA AAAGGTTAAC TCCAGAACAT GTAGTCGCCT CGAGGATTAG TCAAGGCGGA 
ACAGGCTTTG CTCAAGTGTC TGCACAGTTG GAAAATTGGC AAAATCAGTT TTCTTCTTTG 
AAAGAATGA

Protein sequence

MGKPWSDRFE VGLHPFIESF NASIKFDFLL LQEDLDGSIA HARMLGKTGI INADEASQLE 
KGLNQIRLEA SQGVFNADQP AEDVHFAVEN RLIELLGPLG KKLHTGRSRN DQIATDIRLW 
LRRKIDEINF DLENIQKILL GHAEKNLYTL IPGYTHLQRA QPVSLAHHLL AYLEMFQRDR 
DRLVEVKSRV NTSPLGAAAL AGTSLPIDRL YTADQLNFTS IYSNSLDAVS DRDFAVEFIA 
ASSLIMVHLS RLSEEIIFWS SEEFSFVKLT DRCATGSSIM PQKKNPDVPE LVRGKSGRVF 
GHLQALLVML KGLPLAYNKD FQEDKEALFD TVVTVRNSLQ AMSILLEEGL EFSLDRLGSA 
VESDFSNATD VADYLVSKEV PFREAYQIVG RLVKLCMKEG ILLKDLSFDQ WQDMHPAFDQ 
DIYKRLTPEH VVASRISQGG TGFAQVSAQL ENWQNQFSSL KE