Gene A9601_18891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_18891
Symbol
ID	4718627
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	1623866
End bp	1625179
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	34%
IMG OID	640079623
Product	ATP-dependent DNA ligase
Protein accession	YP_001010279
Protein GI	123969421
COG category	[L] Replication, recombination and repair
COG ID	[COG1793] ATP-dependent DNA ligase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.986725
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTTTAAAC AAGAAATAAT ACATCAATTA GAATTACACC CCAGTAGATT AGATAAAGAA 
AAAATCATTT TAGAAGCAAT GGAAGAAGGT CTAGATGATT TTTTTGAAGG TATACGTATG 
GCACTTGATC CATTGGTAAC TTTTGGTGTA AAAATTGTCC CTGAGAAAGA GACTGAAAAA 
AGTAAAAATT TTTTATGGGA AGATTTTAGA AAATTAGCCA ATAAGCTTAT TCAAAGAGAA 
CTTACTGGTC ATGCTGCTCG TGATGCAATT CTTAAGGCTA TGGAATCTGC AACAAAAGAA 
GAGTGGAATG GATTTTATAG ACGAGTTTTA ATTAAAGATC TTAGATGTGG TGTATCTGAA 
AAAACAATCA ACAAGATAGC AAAGAAATTT CCCAAATATG CTATTCCTAT TTTTTCTTGT 
CCTTTAGCTC ATGACAGTGC AAATCATGAA AAAAAAATGA TAGGAAAAAA GCAAATTGAA 
ATCAAATTAG ATGGTGTACG CGTCTTAACT ATAATTAGAC AAAATAAAGT AGAAATGTTT 
TCTCGTAATG GGAAACAATT CCACAATTTT GGTCATATTA TCTCGGAACT AGAAAACGCC 
TTAAAAGAAG ACCCAGCACC TTATGACTTA GTACTCGATG GTGAAGTGAT GAGCTCTAAC 
TTTCAAGATT TAATGAAACA GGTACATAGA AAAGATGGCA AACAAACCAA AGACGCAGTT 
CTCCACTTAT TTGACTTATG TCCCCTGGAA AACTTTCAAA AAGGGAGATG GAATACTAGT 
CAAACAAAAA GAAGTTTATT AGTAAAAGAA TGGGTAGCAA AACATTCTAT GCTTCTAAAA 
CATATACAAA CACTTGAATG GGAAAATGTA GATCTCGACA CTATTGAAGG ACAAAAAAGA 
TTTGTAGAGC TGAATAAATC TGCTGTAGAA GGTGGGTATG AAGGAGTAAT GATTAAAGAT 
CCTGATGCTA TGTATGAATG TAAAAGAACA CACAGTTGGT TAAAAGCAAA ACCTTTTATT 
GAAGTTACTT TAAAAGTTAT ATCGGTTGAG GAAGGTACAG GTCGCAACAA AGGAAGACTG 
GGAGCAATCC TGGTAGAAGG AGAAGATGAT GGGTATGAAT ACAGTCTTAG TTGCGGAAGC 
GGATTTAGTG ATATCCAACG TGAAGAATAT TGGTCAAAAC GTAATCATCT CGTTGGTCAA 
CTTGTAGAAA TCAGAGCTGA TGCAAAAACC AAGTCAAAGG ATGCAGTTAC CTTTAGTCTT 
AGATTTCCTA GATTTAAATG CTTTAGAGGA TTTAAAGAAG GAGAAAAAGT TTAA

Protein sequence

MFKQEIIHQL ELHPSRLDKE KIILEAMEEG LDDFFEGIRM ALDPLVTFGV KIVPEKETEK 
SKNFLWEDFR KLANKLIQRE LTGHAARDAI LKAMESATKE EWNGFYRRVL IKDLRCGVSE 
KTINKIAKKF PKYAIPIFSC PLAHDSANHE KKMIGKKQIE IKLDGVRVLT IIRQNKVEMF 
SRNGKQFHNF GHIISELENA LKEDPAPYDL VLDGEVMSSN FQDLMKQVHR KDGKQTKDAV 
LHLFDLCPLE NFQKGRWNTS QTKRSLLVKE WVAKHSMLLK HIQTLEWENV DLDTIEGQKR 
FVELNKSAVE GGYEGVMIKD PDAMYECKRT HSWLKAKPFI EVTLKVISVE EGTGRNKGRL 
GAILVEGEDD GYEYSLSCGS GFSDIQREEY WSKRNHLVGQ LVEIRADAKT KSKDAVTFSL 
RFPRFKCFRG FKEGEKV