Gene P9303_08401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_08401
Symbol
ID	4776448
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	762919
End bp	764202
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	44%
IMG OID	640086349
Product	hypothetical protein
Protein accession	YP_001016856
Protein GI	124022549
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAAACG CCTTACGGCA AAAAGGTAGA AGCAAAACCA TCATCACAAA AAGCCTCTGT 
CTATCAATAT TTCTTCTTGG CATTTCATTA GTTACTGGCT GCAAGCATCG CAGCGGTGCA 
CTCTTGATCT ACGTTGGAAT CCCTAACTAC GCCGAAAAAG ATCTCAACAA AGCTGGCTTC 
AGAAAGGCAA AAGAAGCAGA AGAATATTTA ATGGGGCACG CAAATGAAGA TCTTAAAGAT 
CAACATCCAA CTACAAGTAT AACTATTTCA TATTACCCAG ATCGCGACTT ACCAGACATG 
GTTAGCAGGA GATCTAACTA TGGCCTAGGT CCGGATTTAA TTATAGCCTC TGCAACTGTC 
ACTGAAAAGC TCTATGCGAA AGGGTATATC AAGCCCTTCA CAATCAATAA TCAGCATGAA 
AAAACAAGCC CAATGAATAA GCTTCAATCT ATCTATCTTG ATTCCAGCGG CAACAAAATA 
GGCATCCCAA TTTCAATCGA CTCGCAACTG AGTTGTGGAA ATCGCAAACT GATCAAACAG 
ATGCCTTCAA CATTTAACGA GTGGTTAAAG CTCAAGGAAA CCATTCAACT TAGCCCAATA 
GAGCGTGACC AATTCTGGGT TTACGGTGTC TTTGGTGTAG CTGAGCCGAT GATGCGAGCA 
GTAGCAGCAC ATCCTCATGC ATTTTCCAAT GAGGATGTGC ATGCACTTGA TAAATACCTA 
AATACGATCA GAGATGAATT CCCCAAGCTC CAACTGGTTC AAGATAACGA CCACGAAAAA 
AATATGACTG CCCTGGAACA AGGACACCTG GCATGGACCT CGTGTCGCAC TTCTGATATC 
TCCAGGCTTA AGAAGTTACT AGCAGAAGAC CTTCTAATCT CGCCCCTTCC AAAGGGTCAA 
CAAGGCACAC CTATTTCAAT GCCAATCATT CGCGTCGCAA CAATAGGGAC TCATTCCACT 
GACAGACAAA AATTACTGGC CAAGGCTTGG TTGCAATACT GGCTACAACC CATCACGCAG 
AGGGTCATGC GGGAAGACTT CCTAAGACCA CTTAATAATC AAGCCAGGCA AAGAGTAAAA 
GAAGCCGACC GCCAAGCCAT TAATGCAATT GTCAATGCAT TTCAAGCCAG CCCCTTACCT 
AGAGCAGTTG TCCCTGCGAT TCTTGGGCCA CGTACTAAAG GGAATGGCTT GTTACAGGAA 
ACATTCATGC CCTACTGGAA CGAAGCAATA GGAGTGCAAG AGCTAGTGGA TAACGTCATC 
GATGCTTTCG CTGTACGCCG ATGA

Protein sequence

MSNALRQKGR SKTIITKSLC LSIFLLGISL VTGCKHRSGA LLIYVGIPNY AEKDLNKAGF 
RKAKEAEEYL MGHANEDLKD QHPTTSITIS YYPDRDLPDM VSRRSNYGLG PDLIIASATV 
TEKLYAKGYI KPFTINNQHE KTSPMNKLQS IYLDSSGNKI GIPISIDSQL SCGNRKLIKQ 
MPSTFNEWLK LKETIQLSPI ERDQFWVYGV FGVAEPMMRA VAAHPHAFSN EDVHALDKYL 
NTIRDEFPKL QLVQDNDHEK NMTALEQGHL AWTSCRTSDI SRLKKLLAED LLISPLPKGQ 
QGTPISMPII RVATIGTHST DRQKLLAKAW LQYWLQPITQ RVMREDFLRP LNNQARQRVK 
EADRQAINAI VNAFQASPLP RAVVPAILGP RTKGNGLLQE TFMPYWNEAI GVQELVDNVI 
DAFAVRR