Gene P9211_07571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_07571
Symbol
ID	5730959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	+
Start bp	662125
End bp	663174
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	41%
IMG OID	641285120
Product	hypothetical protein
Protein accession	YP_001550642
Protein GI	159903298
COG category	[S] Function unknown
COG ID	[COG2138] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.746447
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00609734
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGACTTCTA CAGATTTAAG GAGCCTTGAT TCTGATATAG GTATTTTGAT TGTTGGTCAT 
GGCAGTCGAA ATGCTTTGGC TGTTAAGGAA TTTGCGTCCT TTATAACTTC CTTAAAGCAA 
TTTTTGCCAG ATGTTCCTAT TGGATACGGT TACCTTGAAT TCGCTCGACC AATTATTTCA 
GAGGCCTTGG ATTCTCTGAG AGAACAAGGT GTCAAAAAAG TAATTGCTAT CCCTTTAATG 
TTATTTGCGG CAGGACATGC AAAAAATGAT ATTCCTGCTG TCCTTAATGC GTATTCTCTT 
GAAAGCGGGC TAGAAATTAA TTATGGACGT GAGCTTGGAA TAACTAATAA TATGGTTGGT 
GCCTCTGGCG AGAGAGTTTT AGATGCTATC AACTCTTCTA AAGCACATCC CTTGTCAGAC 
ACTCTTTTAG TTGTCGTTGG CAGAGGGTCT TCAGACCCTG ATGCAAATTC AAATGTTTCC 
AAAATCACAA GGCTTTTGCT AGAAGGTATT GGATTTGGTT GGGGAGAGAC AGTTTTCTCT 
GGAGTGTCAT TTCCTTTAGT TGAACCAGGC TTAAGGCATT TAATCAAACT TGGATTTGGT 
CGAATCGTTG TGTTTCCATA TTTCCTCTTT TCCGGGGTAC TAGTAAGTCG AATAAGAAAG 
CAGACTTCTA GAGTGGCTTT GGATCATCCT GAGATCGAGT TTTTGAATGC AAAATATTTG 
GGCAACCATA ATTTGGTTTT AGAAACCGTA ATTGAGCGGA TAAGAGAAGT GGTAGATGGA 
GATAACTCCA TGAACTGCTC ACTTTGTAAA TATAGAGCTA ATCTTTTGGG TTTCGAGCAT 
GAAGTTGGCT CCCCTCAGAA GAGTCACCAT CATCATGTAG AAGGAGTTTC GGAAGGTTGT 
ACTCTCTGTG AGGATGAATG TACAAGCGAA TGTGAGCTAA TAGACCATGA CCATGACCAT 
GACCATGACC ATGACCATGA CCATGACCAT GACCGCATCC CTTACCCACG GTCTGATCAT 
CCGCTTGGCC CTGTCACGCT TCGCTTTTAA

Protein sequence

MTSTDLRSLD SDIGILIVGH GSRNALAVKE FASFITSLKQ FLPDVPIGYG YLEFARPIIS 
EALDSLREQG VKKVIAIPLM LFAAGHAKND IPAVLNAYSL ESGLEINYGR ELGITNNMVG 
ASGERVLDAI NSSKAHPLSD TLLVVVGRGS SDPDANSNVS KITRLLLEGI GFGWGETVFS 
GVSFPLVEPG LRHLIKLGFG RIVVFPYFLF SGVLVSRIRK QTSRVALDHP EIEFLNAKYL 
GNHNLVLETV IERIREVVDG DNSMNCSLCK YRANLLGFEH EVGSPQKSHH HHVEGVSEGC 
TLCEDECTSE CELIDHDHDH DHDHDHDHDH DRIPYPRSDH PLGPVTLRF