Gene A9601_01211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_01211
Symbol
ID	4716804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	119093
End bp	120247
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	28%
IMG OID	640077819
Product	hypothetical protein
Protein accession	YP_001008516
Protein GI	123967658
COG category	[S] Function unknown
COG ID	[COG3146] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCAAA AAATACATAA AGTTGAAGTC AAATTATCAA TTAAAGAAAT CTCCAAGGAG 
ATATGGAATG AATTAGCAAA TGAAATCAAT AATCCATTTT ATGAATGGAC TTGGCTTAAA 
AACCTTGAAA TATCAAAAAG TGTTTCAAGA GAAACTGGTT GGCAGCCTCT ATATTTTGTT 
GCTTATAAGA ATGAAGAAAT ATTAGGTATC GCTCCACTTT TCTTAAAAAG TCATAGCTAT 
GGAGAATTCA TTTTTGATCA ATCATTTGCA CGATTGGCTC AAGAGCTTAA TTTAAATTAT 
TACCCTAAAT TAATTGGAAT GAGCCCTTAT AGTCCTGTAA ATGGATATCA ATTTCTTTAT 
AAAAAAAATA AAGATAAGAA AGAAATTACA AATTTACTTA TAAAAAATAT AGAAAGCTTT 
GCGATTACAA ACAAAATTTT AAGTTGTAAT TTTTTATATA TTGATGAAAG CTGGGGCAAC 
CATCTTAAAT CTTTGGGATA CTATGAATGG ATAAATTCCA GCAGTGAATG GAGAAGTAAT 
GGAGAAAAAA CGTTTGATGA TTTTCTTTCT AGATTTAATT CTAATCAGAG AAAAAATATC 
AAAAAAGAGA GGAAATCAAT TACTAAACAA GATATTAAAA TAAAAATTTT TAATAAAGAT 
GATATCAACC AAGAAATCCT CAAAAAAATG CATAATTTTT ATGAACAGCA TTGCTCGAGG 
TGGGGAGTTT GGGGAAGTAA ATATCTAACA TCTACATTTT TCGAAAAAAT TGTTGATAAT 
AAAAAAAATC TTTTACTTTT TAGCGCATCA AAAAATAATT CAAATGATAT TTTTGCTATG 
TCGATGTGCG TTAAAAATAA AAACAACTTA TGGGGTAGAT ATTGGGGTAG TGAAGAAGAC 
ATATCTAATT TACATTTTGA ATTATGTTAC TACCAGCCAA TTGAATGGGC AATAAAAAAT 
AGTATCTATT TTTTTGATCC TGGGGCAGGT GGTAAACATA AAAGGCGGAG GGGGTTTTTT 
GCAAAAAGCA CCATTAGCTT GCATAAGTGG TTTGACAAAA ATATGGAAAA TATAATTTAT 
CCTTGGCTAA ATGAAGTTAA TAAACAAACC GAGACCGAAA TTGAATTTGA GAATGATTCT 
ATACCCTTTA AATAA

Protein sequence

MNQKIHKVEV KLSIKEISKE IWNELANEIN NPFYEWTWLK NLEISKSVSR ETGWQPLYFV 
AYKNEEILGI APLFLKSHSY GEFIFDQSFA RLAQELNLNY YPKLIGMSPY SPVNGYQFLY 
KKNKDKKEIT NLLIKNIESF AITNKILSCN FLYIDESWGN HLKSLGYYEW INSSSEWRSN 
GEKTFDDFLS RFNSNQRKNI KKERKSITKQ DIKIKIFNKD DINQEILKKM HNFYEQHCSR 
WGVWGSKYLT STFFEKIVDN KKNLLLFSAS KNNSNDIFAM SMCVKNKNNL WGRYWGSEED 
ISNLHFELCY YQPIEWAIKN SIYFFDPGAG GKHKRRRGFF AKSTISLHKW FDKNMENIIY 
PWLNEVNKQT ETEIEFENDS IPFK