Gene A9601_07361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_07361
Symbol
ID	4717441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	655068
End bp	656258
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	31%
IMG OID	640078450
Product	hypothetical protein
Protein accession	YP_001009129
Protein GI	123968271
COG category	[S] Function unknown
COG ID	[COG1565] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAGCT TACCCGCGAA TAATCCAGAT TGGTTAGTAA AAAAAATAAT AAAAATGGGT 
GGGACTATAA GTTTTTATGA CTTTATGAAT TTTGCATTAA ATGATCCTAT TAATGGTTAT 
TACGGCAGCG GAAAAGCTGA GTTAGGCGTT CGAGGAGATT TTGTCACATC ACCATCTTTA 
TCTGATGACT TTGCTTTTTT AGTTGGTAAA CAAATAGAAG ATTGGTTGAT TCAGTTCAAA 
AGTAGTTTTT TATCTAATGA GACATTATCT GTAACTGAAT TTGGAGCTGG AGATGGAAGC 
TTTATGAGTG GATTAATTAA ATACTTTTTA GAAAACAGCA AGAATTTTTT AGAAGGTATT 
TCTTTTGTAA TTATTGAACC TAATGAAGGG ATGGTAGAAA AACAAAAAAA TAAATTGGAG 
GAATTTTTGA ACTTAGGTAT TGATATTTTA TGGAAAGGTT TGGATGAAGT AGAGGAAAAT 
AATATAAATG GAATAGTTCT AGCAAATGAA GTTTTGGATG CTTTGCCAGT AGAAAGAATA 
ACCTTCTCAA AGGGAAAACT AATTCGACAA GCAGTTTCTA TAGACAAAAA ATCTCATAAA 
TTATTTTTTG ATAAAATGCC AATTACACGT GAATTGGAAA AAAGTTTTGA ACTTGCTAAA 
AGTGAGTTGG GAATAACTAT TCCGCCTGAA GATGCTCTTG AAGGATGGAC GACAGAATGG 
CATGTAGATA ACTCAAAATG GTTAGAAGCT ATTTATGGGA AAATCAATAA TGGTATTTTA 
TTGATAATTG ATTACGCTAA AGAAGCTAAA AAATACTATA ACTCTAAGAA TTCTGATGGG 
ACTATAGTTT CATATGAAAA TCAAAAAATG AGGAATAATG TCCTAGATTC TCCTGGAAAT 
TGCGATTTAA CATCTCATGT ATGCATAGAA ACTTTAATTA ATGATGCTGA GACTCTTGGA 
TTTGATACTG TTGGAATAAC AAAACAAGGA GAGGCTTTAT TGGCGCTTGG ATTGGCTGAG 
AGACTTTATG GGATTCAGAA AGAATTTAAG GAGAATTTAT CAAATGCTCT TTTAAGAAGA 
GAGGCATTAC TTAGACTAGT AGATCCTGTT TGTTTAGGTG ATTTTAAGTG GTTTGTTTTT 
AAAAAGTTTA ATGAGAAGAA AATAAATATA AATTCAACCT GTTTGCGTTA A

Protein sequence

MNSLPANNPD WLVKKIIKMG GTISFYDFMN FALNDPINGY YGSGKAELGV RGDFVTSPSL 
SDDFAFLVGK QIEDWLIQFK SSFLSNETLS VTEFGAGDGS FMSGLIKYFL ENSKNFLEGI 
SFVIIEPNEG MVEKQKNKLE EFLNLGIDIL WKGLDEVEEN NINGIVLANE VLDALPVERI 
TFSKGKLIRQ AVSIDKKSHK LFFDKMPITR ELEKSFELAK SELGITIPPE DALEGWTTEW 
HVDNSKWLEA IYGKINNGIL LIIDYAKEAK KYYNSKNSDG TIVSYENQKM RNNVLDSPGN 
CDLTSHVCIE TLINDAETLG FDTVGITKQG EALLALGLAE RLYGIQKEFK ENLSNALLRR 
EALLRLVDPV CLGDFKWFVF KKFNEKKINI NSTCLR