Gene P9211_01811 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_01811
Symbol	trpB
ID	5730718
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	174061
End bp	175311
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	43%
IMG OID	641284525
Product	tryptophan synthase subunit beta
Protein accession	YP_001550066
Protein GI	159902722
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0720607
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACAAGCA CGCTACCCTC GCAACCAAAG GATATGGAAC TCGCAAACAG TTCCCGACCA 
TCGGTCCATG GACGATTTGG TCGATTTGGA GGTCAATATG TGCCTGAAAC TCTTATGCCA 
GCTCTTGCTG AACTAGAGAA AAAAGCTGCC GAAGCATGGC AAGATTCTTC ATTCACAAAT 
GAACTATCTC ATTTATTAAA AACCTACGTC GGTCGAGCAA CCCCTTTATA TGAAGCAAAG 
AGATTAAGCC AGCACTACAT GAGCAGAGAA GGAGGGCCAA GAATTTGGCT AAAGCGAGAA 
GATCTCAATC ACACCGGGGC TCACAAAATC AATAATGCTC TAGGACAAGC TCTTCTAGCA 
ATAAGAATGG GCAAAAAAAG AATCATTGCA GAGACAGGTG CTGGCCAGCA TGGAGTTGCA 
ACAGCAACGG TATGTGCACG ATTTGGACTG GAATGCGTCA TATATATGGG TCAAGAAGAT 
ATGGAAAGAC AAGCTCTAAA TGTATTTAGA ATGAAACTAC TAGGAGCAAA AGTTCAATCG 
GTCACAGCTG GTACAGCCAC TTTAAAAGAT GCAACAAGTG AGGCAATTCG CGATTGGGTT 
ACTAATGTCG AATCAACTCA TTACATCCTT GGATCAGTAG CAGGCCCACA TCCTTATCCA 
ATGTTGGTTA GAGATTTTCA TTCAGTCATT GGAGAAGAGA CTAAACAACA ATGCAAAGAG 
GCTTTTGGCC GATCACCTGA TGTACTACTG GCATGCGTCG GAGGAGGTTC AAATGCGATG 
GGATTATTCC ATTCATTCAT AGAAGATCTT TCAGTAAAAA TGATTGGTGT TGAAGCTGCT 
GGAGATGGGG TAAATACCAA ACGCCATGCT GCAACAATCA CCCAAGGGAG TGTAGGAGTA 
CTTCATGGGG CTATGAGCCT TCTTCTTCAA GACAGTGATG GACAAGTTCA AGAAGCCCAT 
TCAATTAGTG CTGGGCTTGA TTACCCAGGC GTAGGACCTG AACATAGCTA TCTGAATGAA 
ATAGGTCGGG CAGAATATGT AGCTGTTACA GATAAAGAAG CTTTAAATGC CCTTGAACTA 
GTCAGCAAAT TAGAAGGAAT TATTCCTGCC TTAGAAACAG CCCATGCTTT TGCATGGCTA 
GACACACTTT GCCCTTCTCT TGCCCCAGGT ACTGAAATAG TTATTAATTG CTCTGGTCGA 
GGAGATAAAG ATGTCAATAC TGTTGCAAAA AAAATGGGCT TTGAAATTTA A

Protein sequence

MTSTLPSQPK DMELANSSRP SVHGRFGRFG GQYVPETLMP ALAELEKKAA EAWQDSSFTN 
ELSHLLKTYV GRATPLYEAK RLSQHYMSRE GGPRIWLKRE DLNHTGAHKI NNALGQALLA 
IRMGKKRIIA ETGAGQHGVA TATVCARFGL ECVIYMGQED MERQALNVFR MKLLGAKVQS 
VTAGTATLKD ATSEAIRDWV TNVESTHYIL GSVAGPHPYP MLVRDFHSVI GEETKQQCKE 
AFGRSPDVLL ACVGGGSNAM GLFHSFIEDL SVKMIGVEAA GDGVNTKRHA ATITQGSVGV 
LHGAMSLLLQ DSDGQVQEAH SISAGLDYPG VGPEHSYLNE IGRAEYVAVT DKEALNALEL 
VSKLEGIIPA LETAHAFAWL DTLCPSLAPG TEIVINCSGR GDKDVNTVAK KMGFEI