Gene A9601_00601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_00601
Symbol
ID	4716742
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	63742
End bp	65064
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	35%
IMG OID	640077757
Product	hypothetical protein
Protein accession	YP_001008455
Protein GI	123967597
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT TATTGGCATT TTCATTAATT AGTTCCTCGA TATTTCTAGG AATCAATACA 
CTAAATGCAG AAGAATATGA GGCCTTCGGA ATAGATTATT CAGGAGATGC ATCTATTGGA 
AATAGAGTAT GGGGTGTTTT GGATGGTCAA AAAACACTAC TTAGTACAAA AGTGTTTGAT 
AATAATGGTT GGACACCAGC AGAATCATAT ATAAACGCAA AAACTGGCGA GATAATGGTT 
AGAGGAGCAG GGACTAAATT TCATGCTTAC AATTGGAAAA CAGATACTTG GCGAGATATC 
TCAGATAATG GTAATTTTCA AAAGTATTTT GTAAAACCGA TGTCAGTTGG AACAACTGCC 
GATAGTTCAA TACAAATTGG AGCAGATGCT AATGATATTG ATGTTGTTGA AGATGGTTTG 
AATATTGATG GTGCTGCTGT TATTACTAAA AATACTGACG GATCAATTCA ACTTGGAGCA 
GATGGTAATG ATATAGATGT TGTTGAAGAT GGTTTGAATA TTGATGGTGC TGCTGTTATT 
ACTAAAAATA CTGACGGATC AATTCAACTT GGAGCAGATG GTAATGATAT AGATGTCGTA 
GCAGATGGTT TGAACATTGA TGGAACTGCT GTTATTACAA AAAATGCTGA TGGCACAATC 
CAAATCGGAA CAGATGAAAA CGATATTGAT ATAACTTCAG AGGGACTTGC AATTGATGGA 
GAACCATTAA TTACCAAGAA AGCAAATGGA GAATTACATA TTGGTAAGAA CTCATGGATA 
ACAAAAGAAG AAAATGGAAG ACAAAAAGTT TATGCGAAAG ATGCCAATGG AAATCCAATT 
CCTATCGATT ACACAAATGG GACCAAGTTA CTTATTAATG GAAGAGATGT AGAACAGTCA 
ATCAATAATG TTGGTGCTTT AAGTGCCGCC CTAACAGGAT TGCCCACAGT TCCTACAGAT 
ACAACCCTTG CTTGCGGATT AGGAACTGGA ACTCATGGAG GTGATTTTGC TTTTTCTGGT 
GGCTGTGCTT CTAAAGTTAA TGACAAATTA TCAATTAACT ATGCGGCGTC AATGACAATG 
CCAGGTCAAG ATTATGCCGG TGATTTTGAA GATACTTTTT CCGCTAGAGC AGGATTTGTT 
TGGAAATTAG GTAAGGCCAC AAAACCTATT CAAATTAGTA TGAATGAAAA AGAGAATTTC 
GAAACAAAAA TCAAAACTCT AGAAGAAAAA AATAAACAAC TCTTAGCAAG GCTAGAAAGA 
TTAGAAAAAG TCGCACTTGG AGATCTTAAA TCAAAAGATT TAGCAGTTTA TAAACTCAAA 
TAA

Protein sequence

MKKLLAFSLI SSSIFLGINT LNAEEYEAFG IDYSGDASIG NRVWGVLDGQ KTLLSTKVFD 
NNGWTPAESY INAKTGEIMV RGAGTKFHAY NWKTDTWRDI SDNGNFQKYF VKPMSVGTTA 
DSSIQIGADA NDIDVVEDGL NIDGAAVITK NTDGSIQLGA DGNDIDVVED GLNIDGAAVI 
TKNTDGSIQL GADGNDIDVV ADGLNIDGTA VITKNADGTI QIGTDENDID ITSEGLAIDG 
EPLITKKANG ELHIGKNSWI TKEENGRQKV YAKDANGNPI PIDYTNGTKL LINGRDVEQS 
INNVGALSAA LTGLPTVPTD TTLACGLGTG THGGDFAFSG GCASKVNDKL SINYAASMTM 
PGQDYAGDFE DTFSARAGFV WKLGKATKPI QISMNEKENF ETKIKTLEEK NKQLLARLER 
LEKVALGDLK SKDLAVYKLK