Gene A9601_13891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_13891
Symbol
ID	4718110
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	1156152
End bp	1157402
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	28%
IMG OID	640079110
Product	hypothetical protein
Protein accession	YP_001009780
Protein GI	123968922
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATAG AAAAGCCTCT TTTTAAATTT TTTTATATTG GCATTTTTTT ATTACCTTCA 
GCTCCTAGCA TTGGATCTAT TTTTCTTTTT TTATGTCTCA TTTGCTCATT AATAAATAAC 
TTTTTAGAAT TAATCAAAGA TAGATGGAAT ATTACTTTTT TTATATCTAT TTTTTTGTTT 
CCAATAATTT GCTTAATACA GAGTAGTAGA TTTTTCTACA AATTTAATAA TTTTGATAAG 
TCACTTACAT GGATTGGTTT AAATAATTGG ATTCCTTTAA TTTTATGTTT CATCGCCTTT 
CAAAAATTTG TTAATAGCAA ATCAGATAGG GAAATTATTG GAAAGCTTTT AATAGCTGGT 
AGTTTTCCCC TCATAATTTC AGGAATTGGT CAATATTGGT TTAATTGGTA TGGACCATTC 
GAATTTTTAA ATGGATTTAT TATTTGGTTT CAAAGACCTA TGCAAACCGA AACTGGATTA 
ACTAGTTTAT TTAGCAACCA AAATTATGCG GGATCTTGGT TTTGTATAGT TTGGCCATTT 
TGTCTATCCT TTTTTATTCA ATCATTCAGA AATAATTTAC ATAGATTTAT ATCACTAGGA 
TTTTTGATTT CCATTTCAAC ATGTCTGATA TTAACAACTT CCAGAAATGC ATGGGGAGGA 
TTATTGTTAT TGATTACTTT ATTAAGAGGA GCCTCCCTTT TTTGGCCAAT ATTTATAGGT 
ATAACTATTA CAATAATTAG TGTTTTTCTA CTAAATATTC TAATCCCACT AGATATACAA 
ACGACTATAA GTAACCTATT TCCTTCTTGG ATTAATCAAG AATTCACTTC AACTCATTTT 
CAATTTAGAG AGTCAAGGCC TGAAATATGG TGGGAAGCCA TAAAACTAAT ATTCAAAAAT 
CCCCTATTAG GTTTGGGAGC TGGTGCATTT CCTATTATCT ATCAATCCTT AAAGAATGCT 
TATGCAGGAC ATACACATAA TTTAGTATTC GAATTAGCTT TAAGTTATGG TATCCCAATC 
ACATTAATAG TTTTTGTACC AATATTTCTA ATTTGTTTTT TTTCCTTTAA AGAAATTTAT 
ATCAAGAAAA CAAATAATAT TGATATAAAT GAAAGAGCAT GGTTCGCTTC ATTTTTTACA 
CTATTATGCA CTCAACAAGT TGATGTACAG TACTTTGATC TAAGAATAAG TATAATTTTC 
TGGGTTTTAC TAGCAGGGCT TAAAACACGT ATAAGCCCCC AAATAATTTA A

Protein sequence

MKIEKPLFKF FYIGIFLLPS APSIGSIFLF LCLICSLINN FLELIKDRWN ITFFISIFLF 
PIICLIQSSR FFYKFNNFDK SLTWIGLNNW IPLILCFIAF QKFVNSKSDR EIIGKLLIAG 
SFPLIISGIG QYWFNWYGPF EFLNGFIIWF QRPMQTETGL TSLFSNQNYA GSWFCIVWPF 
CLSFFIQSFR NNLHRFISLG FLISISTCLI LTTSRNAWGG LLLLITLLRG ASLFWPIFIG 
ITITIISVFL LNILIPLDIQ TTISNLFPSW INQEFTSTHF QFRESRPEIW WEAIKLIFKN 
PLLGLGAGAF PIIYQSLKNA YAGHTHNLVF ELALSYGIPI TLIVFVPIFL ICFFSFKEIY 
IKKTNNIDIN ERAWFASFFT LLCTQQVDVQ YFDLRISIIF WVLLAGLKTR ISPQII