Gene A9601_13451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_13451
Symbol
ID	4718064
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	1120077
End bp	1121381
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	28%
IMG OID	640079064
Product	hypothetical protein
Protein accession	YP_001009736
Protein GI	123968878
COG category	[R] General function prediction only
COG ID	[COG4310] Uncharacterized protein conserved in bacteria with an aminopeptidase-like domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGATA TTTACAATGA TTTATCTTTT TTATTCAATA ATAATAGAGG TATAGTTAGT 
GACTTAAATA ATGATTTAAA CAAAAGATTA TGTGAATTAA TTCCATTTAA AAAAATAAAA 
TATAAATCTG GAGAAAAAAT TGACAATTGG AAAGTTCCTT TATCTTGGGA ATTAATTAGA 
GTAGAAGTTA AAATTAATTC CTTATCAATA AATCAAAAAG ATATACCTTT GATTGTGCCT 
TTTGGAACCG CATCATTTAG AGTTTCAGGA AATTATATTG ATCTTAAAAA ATTTATTTAT 
ACTTTAGAGG ATAAACCTTT AGCTACTCCT TATAGAACAA ATTACTATTC GCCCAAAAAT 
TATAAGATCT GTTTACCCTT TAAATATTTA TCCTGTCTAA ATGATGAAGA CCAAATATCA 
ATAAATGTAG AGTCAAGAAC CAAGCCATCG AATTTAGAAG TTCTTGAAAT AACCTTAGAA 
GGTAATTCAA AGCATGAAAT TCTTTTTACA ACTTATAACT GTCATCCTGG ATTAGGTAAT 
GATAATTTTT CCGGTTTAAT TGGATTGTGC AAATTATACA GACAACTTTC AAATCTTAAT 
AACCTTCACT TTACTTATCG TTTTGCCGTT TTCCCAGAGA CAATAGGTGC TATTTTTTAT 
ATAAACTATC TTCAAAAAAA TGATGAATTA CAAAATATTC TTTTTAGCTC AGTTTTAACA 
TGCCTAGGAG GTAAATTAAA AAATTATAGT TTCAAAGAAT CCCCAGTAAA ATCATCTTAT 
TCCGAAGCGT ATAAAAACGA ATTAAAAAAA GAAATCCCTA ATATAAAAAT AATGCCATTT 
ACTCCTGATG GCAGTGATGA GAGACAATTC TCTTCCCCAA ATGTTGGAAT TGCGAGTTCA 
AGCCTATGCA GAAACAGATA CTACGAATAT GAAGAATATC ATACATCTCT TGATACACTT 
GAATATATGG ATATTTGTGC AGTAAACGAA AGCACAAATT TTATATTTAA TGCAATTAAA 
AGTCTTGATA AAAATCTCAG GATTCCAAAG TCTCATGCCA GATTTGGAGA ACCTTGCTTA 
AGTGCTTATG ATTTGTTTTT ACATGATGGG GGCTCATATA CATCGAAAAA AACCAATTCT 
AATATAAATC AAAAAAAAAT ATTATTTACA CTTTTATCAA TTATTGATGG TAAACTCTCT 
TTCGAAGAGA TAGTTAAACT TACTATGAGT AAAATAGATT CCGAGAGATC AGATGTTGAG 
AAAGTTCTTC AAAAAGTAAT AGATTTAAAT ATAGTTTATG ATTAA

Protein sequence

MKDIYNDLSF LFNNNRGIVS DLNNDLNKRL CELIPFKKIK YKSGEKIDNW KVPLSWELIR 
VEVKINSLSI NQKDIPLIVP FGTASFRVSG NYIDLKKFIY TLEDKPLATP YRTNYYSPKN 
YKICLPFKYL SCLNDEDQIS INVESRTKPS NLEVLEITLE GNSKHEILFT TYNCHPGLGN 
DNFSGLIGLC KLYRQLSNLN NLHFTYRFAV FPETIGAIFY INYLQKNDEL QNILFSSVLT 
CLGGKLKNYS FKESPVKSSY SEAYKNELKK EIPNIKIMPF TPDGSDERQF SSPNVGIASS 
SLCRNRYYEY EEYHTSLDTL EYMDICAVNE STNFIFNAIK SLDKNLRIPK SHARFGEPCL 
SAYDLFLHDG GSYTSKKTNS NINQKKILFT LLSIIDGKLS FEEIVKLTMS KIDSERSDVE 
KVLQKVIDLN IVYD