Gene NATL1_05811 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_05811
Symbol
ID	4780009
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	526414
End bp	527574
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	34%
IMG OID	640083858
Product	phage integrase family protein
Protein accession	YP_001014408
Protein GI	124025292
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAGA ATCAAAAGTT ACTAGATATC AACCAAGACC TTGAATCAAA GGGAATCAAT 
CTAAGAATTG AGAAAAGGGG TAAAGTTTTA AACATTCGTG GTTCTTTGCC AGATAAGAAA 
TCTCATGATC TTTCTAAAGT TCAAAGAATA AGTCTGAAAC TTCCACACGA CATTAACGGT 
CTAGAAGAAG CTAGAAAAGC TATAGAATTG ATAGATTTTC AACTTAAAAA AAATCAATTT 
TGTTGGTCTA ATTGGATTAA AGAGAAAGCT CTCTCATCAA CAAAGACTAA TAAAACTGTA 
ATAAGCAATG AAATAGAAAG CTTTAAAAGA CAATTTTTTT CTGATACATC CAGGAGCAAA 
TCATCAGCCG GAATGATCAG CACTTGGCAG TCTGCTTACA AACCATATTT GAACAGATTA 
ATTGGAGTAA GTCATAAATC TACTCTCAAA TTAAGCGAGG AGCTCCTAGT GAAAATCCTT 
TTAAGTTACA AAGAAAATTC AAGGAGCAGA CAACAATGTG GAATTGCTTT AAGTGCTTTA 
GCTAGACACC TTAAAGTAGA GCTACCCAAG AACTGGAAAC AACTTCAAAG TGGTTATGGA 
ATACACGAAT CAAATTTCAG AGAGTTACCT AGTGATAAAG AAATTATTAA TAGCTTTCAA 
TTAATACCAA ATCCAAAATG GAGATTTGTT TTTGCGTTAA TGGCAATTTA TGGGCTTAGA 
AATCATGAAG TCTTTTTTAG TGACTTATCT TGTTTAAAAA AAGGTGGGGA TAAAATACTC 
CGGGTTTTCC CAAATACGAA AACAGGAGAA CATCAAGTTT GGCCATTTCA TCCTGAATGG 
GTTGGTTTAT TTGAGCTAGG GAACATAACT GATACTTCAG ATTTACTCCC AGATATTAAA 
ACAGATCTAA AAGAGACAAC TCTTCAACAT ATAGGAAGAA GAGTATCTGA GCAATTTAGA 
AGATATGAAA TATCTTTTAC CCCCTATGAT TTAAGGCATG CATGGGCAGT TAGGACCATC 
TTAATAGGCC TACCAAATAC TGTAGCTGCA AAAATGATGG GACACTCAGT GTCAATACAT 
ACAAAAACCT ATCATCATTG GATAACAAGA AGAGATCAGC AAATTGCAGT CGATAGTGCT 
CTATCTAGAG TCAAATATTA A

Protein sequence

MDENQKLLDI NQDLESKGIN LRIEKRGKVL NIRGSLPDKK SHDLSKVQRI SLKLPHDING 
LEEARKAIEL IDFQLKKNQF CWSNWIKEKA LSSTKTNKTV ISNEIESFKR QFFSDTSRSK 
SSAGMISTWQ SAYKPYLNRL IGVSHKSTLK LSEELLVKIL LSYKENSRSR QQCGIALSAL 
ARHLKVELPK NWKQLQSGYG IHESNFRELP SDKEIINSFQ LIPNPKWRFV FALMAIYGLR 
NHEVFFSDLS CLKKGGDKIL RVFPNTKTGE HQVWPFHPEW VGLFELGNIT DTSDLLPDIK 
TDLKETTLQH IGRRVSEQFR RYEISFTPYD LRHAWAVRTI LIGLPNTVAA KMMGHSVSIH 
TKTYHHWITR RDQQIAVDSA LSRVKY