Gene A9601_11421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_11421
Symbol
ID	4717855
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	959398
End bp	960840
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	33%
IMG OID	640078857
Product	hypothetical protein
Protein accession	YP_001009533
Protein GI	123968675
COG category	[S] Function unknown
COG ID	[COG2308] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATATA TGTTTTCAAG TTATCAGCCT AAAAATAGTT TTGATGAATA CTTTAAGGAC 
AATGTAAACT CTGCTAGAGA AATATTGATT CCACTTCTTT CATCTTTAGA TAATATGGGA 
CTTGAAGAAT TAAACAGGAA TCACTCTGCC GCAAAAAAAT TATTACTAAG ACATGGTGCA 
ACTTTTAGAT TAAACGATAC TGGTTTAAAA GGTACTGAGA GAATATTACC TTTTGATCCA 
CTTCCCAGAA TAATTAGTAA AGATGATTGG GTAACGTTAG AAAAAGGCCT AAAACAAAGG 
CTTGAGGCAA TAGATTTATT CCTAGATGAT ATTTATAATT CTCAAAAAAT AATAAATGAT 
GGAATAATTC CAAGAGAATT AATAGAGAGT TCAGAAGGTT GGAGACCTCA GATGATAGGT 
TTCAAACCTC CACTAAATAA ATGGTGTCAA ATTTCGGGAC TTGATTTAAT AAGGGATAGA 
AAAGGAGATT GGCATGTTTT AGAAGATAAT TTAAGGTGCC CTTCTGGGGT TGCTTATTTT 
TTAGAAAATA GATTAGTTAT GAAAAATATT TTTCCTAATC TTTTCTCAGG AAGAATAGTA 
AAACCAATTG ATGAATATCC ATCATATCTT TTAAAAACGC TTCAAGAACT TGCTGTTTGG 
ACTGACACTC CCAAGATAGT TCTACTAACT CCAGGAATTT TTAATAGTGC TTATTTTGAA 
CATAGTTATC TAGCGCAAGA AATGGGCATC CAACTAGTTC AAGGTCATGA CTTAGTTTGT 
AATGATGATT ATGTATATTT AAAAACTACC TCTGGATTAA AAAGAGTAGA TGTCATTTAC 
AGGCGAATTG ATGATGATTT CTTAGATCCT CTTAATTTCA GAAAAGATTC CTGCCTTGGT 
GTCAGCGGAT TACTTGATGT TTTTAAGGCA GGTCATGTTG CTTTAGCAAA TGCACCTGGT 
ACTGGAATAG CAGATGACAA AATGATTTAT TCATTTGTTC CAAAAATGAT TAAATATTAT 
CTTGATGAAG AAATTATTAT TAAAAATGTA GAAACGTATA TTTGTCATTA CCAAAAGGAT 
CGAGAATATG TTCTAGAAAA TTTATCAAAA CTTGTTGTTA AGTCTGTAGC AGAAGCCGGT 
GGTTATGGAA TGTTAATTGG ACCTCACTCA ACAACCAGTG AAATAGAAGA ATTCGCTAAT 
AAAATTAAAA ATAATCCTAG AAATTTCATA GCACAACCAA CGTTAGAATT ATCTACTGTG 
CCATCGTTAT GTGATGGAGA ACTATATCCA TGTCATGTTG ATTTAAGGCC ATACATCTTA 
AGAGGAAAAG ATTCATGGGT TAGCCCAGGC GGGCTAACGA GGGTAGCATT AAAAAAAGGA 
TCATTAGTCG TCAATTCTTC TCAAGGTGGA GGATGCAAAG ATACATGGGT TGTAGGTAAA 
TAA

Protein sequence

MKYMFSSYQP KNSFDEYFKD NVNSAREILI PLLSSLDNMG LEELNRNHSA AKKLLLRHGA 
TFRLNDTGLK GTERILPFDP LPRIISKDDW VTLEKGLKQR LEAIDLFLDD IYNSQKIIND 
GIIPRELIES SEGWRPQMIG FKPPLNKWCQ ISGLDLIRDR KGDWHVLEDN LRCPSGVAYF 
LENRLVMKNI FPNLFSGRIV KPIDEYPSYL LKTLQELAVW TDTPKIVLLT PGIFNSAYFE 
HSYLAQEMGI QLVQGHDLVC NDDYVYLKTT SGLKRVDVIY RRIDDDFLDP LNFRKDSCLG 
VSGLLDVFKA GHVALANAPG TGIADDKMIY SFVPKMIKYY LDEEIIIKNV ETYICHYQKD 
REYVLENLSK LVVKSVAEAG GYGMLIGPHS TTSEIEEFAN KIKNNPRNFI AQPTLELSTV 
PSLCDGELYP CHVDLRPYIL RGKDSWVSPG GLTRVALKKG SLVVNSSQGG GCKDTWVVGK