Gene P9301_04471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_04471
Symbol
ID	4911293
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	+
Start bp	388504
End bp	389994
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	28%
IMG OID	640160025
Product	hypothetical protein
Protein accession	YP_001090671
Protein GI	126695785
COG category	[R] General function prediction only
COG ID	[COG3046] Uncharacterized protein related to deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.77539
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAAG TATCAATTAT TTTCCCGAAT CAACTTTTTA GAGAAAGCCC AATCTTAAAA 
ATAAATTGTG AAGTTTTGAT TTTGGAAGAC TCATTATTTT TTGGAAATGA TAAATTTCAT 
AAATTAATTA ATCATAAAAA TAAGTTGGTT TTTCATAGAG CATCTATGCT CGCTTATAAA 
AATTATTTAG AAATATCTGG CTTTAAAGTT TTATATATCG AAAACAAGAA TAATGTTTCT 
ACAGTTGATT ACTTATCGGA ATTTATTAAA AATAAATATC AGAAAATAAA TCTCATTGAC 
CCTCATGATT TTTTAATATT GAAGAGGATT AATAATTTTG TCGAAAGTAA TAATTTAGAT 
TTAAATATTT TACCTTCTCC TATGTTTATG AGCCGTGAAG ATTTAAAAGA TTTATTTGTA 
TCAAATGCAA AAAAACCTCT TATGGGGAGA TTTTATGAGA ATCAAAGAAA GAGCCAAAAG 
ATATTAGTTA ATCCTGATGA TACACCTGAA GGTGGTAAAT GGAGTTTCGA TGAAATGAAC 
AGAAAAAAAT TACCAAAAAA AATAAATATA CCCGATACAC CTAAATTACA AAAAAATAAA 
TTTGTAGTTA ATGCAGAAAG GTCATTAGCC AATTTTGATA TTGAGTTTAT TGGTGAAAGC 
AATAACTTTT TATATCCAAC TAATTTTGAA GAGGCAGATG AATGGTTAAA TGATTTTTTT 
AAACATAGAT TTTTTTTATT TGGAGATTAT GAGGATGCTA TTTCTAAGGA AAATTCTTTT 
TTATGGCACA GTTTACTTTC TCCTCTTTTA AATAGCGGCT TATTAACACC AGATGTAGTA 
GTAAATAAAG CATTACTTTT TGCAAAAAAT AATAATGTTC CTATCAACTC TTTAGAGGGT 
TTTATTCGTC AAATTATTGG ATGGAGAGAA TTTATTTGCC TCGTCTATAA AAAGTACGGA 
ACAAAGATGC GAAACAGTAA TTTTTGGAAT TTTGAAGAGA AGCCAATTCC AAAATCTTTT 
TATCAAGGAA ATACAGGAAT TGAACCTGTA GACGTTGTTA TAAAAAATAT TATTAAATTT 
GGTTATTGTC ATCATATTGA GCGGCTAATG ATTGTTGGCA ACTTTATGCT TTTATGTAGA 
ATTCACCCCA ACCAAGTTTA TAAATGGTTT ATGGAAATGT TTATTGATTC GTATGATTGG 
GTTATGGTCC CAAATGTTTA CGGAATGAGT CAGTTTAGTG ATGGTGGAAT CTTTTCAACA 
AAGCCATATA TATCAAGCTC TAATTATGTA AAAAAAATGT CTAATTTTAA AAGCGGCCCA 
TGGTGTGAAA TATGGGATGG CTTATTTTGG AAATTCATTA AAGATAATGA AAGCTTTTTT 
AGAAAGCAAT ATCGTCTGGC AATGTTAACT AGAAATCTCG ATAAAATGTC AGAGGAAAAA 
TTAAATAATC ACCTAAAAAC GGCCGATAAA TTTTTAAGAG ATATTCAATA A

Protein sequence

MKQVSIIFPN QLFRESPILK INCEVLILED SLFFGNDKFH KLINHKNKLV FHRASMLAYK 
NYLEISGFKV LYIENKNNVS TVDYLSEFIK NKYQKINLID PHDFLILKRI NNFVESNNLD 
LNILPSPMFM SREDLKDLFV SNAKKPLMGR FYENQRKSQK ILVNPDDTPE GGKWSFDEMN 
RKKLPKKINI PDTPKLQKNK FVVNAERSLA NFDIEFIGES NNFLYPTNFE EADEWLNDFF 
KHRFFLFGDY EDAISKENSF LWHSLLSPLL NSGLLTPDVV VNKALLFAKN NNVPINSLEG 
FIRQIIGWRE FICLVYKKYG TKMRNSNFWN FEEKPIPKSF YQGNTGIEPV DVVIKNIIKF 
GYCHHIERLM IVGNFMLLCR IHPNQVYKWF MEMFIDSYDW VMVPNVYGMS QFSDGGIFST 
KPYISSSNYV KKMSNFKSGP WCEIWDGLFW KFIKDNESFF RKQYRLAMLT RNLDKMSEEK 
LNNHLKTADK FLRDIQ