Gene A9601_05801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_05801
Symbol
ID	4717279
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	505073
End bp	506242
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	31%
IMG OID	640078292
Product	phage integrase family protein
Protein accession	YP_001008973
Protein GI	123968115
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0844338
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTTAA TTCAGGAAAT TAATAATGTC AATGATAAAT TTGCTACTCA AGGAAGCAAG 
CTTAAAATTG AGAAGAGAGG AGAGAAATTA AATATTCGTG GTTCACTACC CTCCAAAGAA 
GATAACAATA ACTTTAAAAT TCAAAGAATA TCTCTTGGTT TAAACGCTGA TATTTCTGGA 
TTAGAGGAGG CCAAAAAAAA ATTACAATTA ATCAATTTGC AATTGGAATT GAATCAATTT 
GATTGGATTA ACTGGATTGG CAACCCTTAT AAAAAGCAAA TAAAAGATGG TTCTGAATTC 
CCAAATAGAT TAAATCAATT TGAAGAATTT TTTTTTAAAG AAAACAAAAG TGATTTTCGA 
ACCAGCACTA GAAAAACTAC TTGGAAAAGT TCTTACAAAC CATATATGAA AAGAATCCTA 
AATATTTACA ATGATTATGA AAATGAATCT TTAGAAAGAA TATTTCAAAA AACACTTGAA 
AGTTACAAGG AAGGTAGCAG AAGTAGGAAA CAATGCGCTA CTTCTCTTAG TGTTTTGGCT 
AAGTTTTTGG AAATTAAACT ACCAGAGGAT TGGAAATTAA ATTCTAGAGG ATATGGTCTG 
AACAAAGCAG GATTTAGGGA TCTGCCTAAA GACGAGTTAA TTGTGAAACT TTGGGAGACA 
ATCCCAAACA AATCTTGGAA ATTTGTTTTT GGTTTGATGG CTACATACGG ATTAAGGAAT 
CATGAAGTAT TTTTTTGTGA TTTAAGTTCT CTAACTAATT TTGGGGACAA AATTATTAGA 
GTTTTACCTA CTACTAAAAC TGGGGAGCAT CAAGTTTGGC CATTTCATCC TGAATGGGTT 
GAAAAGTTCG AATTATCAAA ACTTGGTGAA AATCCAGAAC TACTACCAAA TATTAATACA 
GACCTTAAAA TTACAACTTT ACAAAATATT GGAAAAAAAA TTACAGATCA GTTTAAGCGT 
TACTCTTTAC AAATAAAACC TTATGATCTA AGGCATGCAT GGGCAGTAAG AACAATTTTT 
TATGATTTGC CTGATACTGT TGCTGCCAGA ATGATGGGAC ATTCGGTTAG TTTACATACT 
CAAACTTATC ATCACTGGAT TACTAAAAGA GATCAACAAC AGGCAGTAAA TAATGCACTT 
TTAAAAGTTA AAAGAGCTAA AAATATTTAA

Protein sequence

MNLIQEINNV NDKFATQGSK LKIEKRGEKL NIRGSLPSKE DNNNFKIQRI SLGLNADISG 
LEEAKKKLQL INLQLELNQF DWINWIGNPY KKQIKDGSEF PNRLNQFEEF FFKENKSDFR 
TSTRKTTWKS SYKPYMKRIL NIYNDYENES LERIFQKTLE SYKEGSRSRK QCATSLSVLA 
KFLEIKLPED WKLNSRGYGL NKAGFRDLPK DELIVKLWET IPNKSWKFVF GLMATYGLRN 
HEVFFCDLSS LTNFGDKIIR VLPTTKTGEH QVWPFHPEWV EKFELSKLGE NPELLPNINT 
DLKITTLQNI GKKITDQFKR YSLQIKPYDL RHAWAVRTIF YDLPDTVAAR MMGHSVSLHT 
QTYHHWITKR DQQQAVNNAL LKVKRAKNI