Gene NATL1_02501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_02501
Symbol	menC
ID	4779720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	230829
End bp	231800
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	36%
IMG OID	640083515
Product	putative O-succinylbenzoate synthase
Protein accession	YP_001014079
Protein GI	124024963
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID	[TIGR01927] o-succinylbenzoic acid (OSB) synthetase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTAA TAATTAATAT CAAGCCATTT TCATTTCAAC TAACAAGAAA GTTAATAACC 
TCGCAAGGAA TTATTCATAA CAAGGTAGGT TTATTGTTGC AAATAAAAGA CTCAAATGGA 
AATTACGGAT GGGGGGAAGT TTCACCTATT GAGAAAAAGG AATTAGAAAA AAGTATCGAA 
AGTCTTGATT TTATTGGGAA ACAAACTACA AAAGATTCAA TAGAAAATTA TTTATTTGAA 
TTGCCAGGCG CACTTGCTTT CGGATTAGGG TCCTGCTTAG CCGATTTAGA AAGTCTCACT 
CAAAGGAAGT TAAATCTTGA AGGTTTTGAC GTCGCAAAAT CAGCTTATCT TTTACCTACA 
GATATTGATC CATTAGAGTC AATACGTAAA TATGTAGATG AATCAAATGA GAAGAAAAGT 
TCTTGTACAA TAAAATGGAA AGTATCTCAC CTAGAAAATA ACTTTAAGGA AGAAAAAACA 
TTACAAAAAA TCTTAGACAT TTTACCAAAT AATTTTAAAC TTAGAATTGA TCCAAATGGA 
GGTTGGAGTC GCCAAAAAGC ACAAGAATGG AGTAACGAAC TCAAAAACGA ACCTCGTTTG 
GAATGGATTG AACAGCCACT CCCATCAAAA GATATTGAAG GTTTATTTTC ATTGGCCACT 
CAAATTCCAA TCGCACTAGA TGAATCTTTG GTTGAATTTC CATATTTACG AAAAACATGG 
AAAAGTTGGC AAATACGTCG CCCTGCATTA GATGGTGATC CGAGATTACT GTTAAAAGAA 
ATAGAACAAG AAGATAGTCA AACAGTCATA AGCACAGCTT TTGAAACTGG TATTGGGAGA 
AGGTGGGTTA ATCACCTCGC TGCCAGACAA GTCAAAGGGG GAAATCCTTG TTCACCTGGA 
CTTGCACCTG GATGGTGCCC AAAAGGCCCA CTCTTCAACA ACAATCCGAA ATTAGTCTGG 
GAAGCCGTAT GA

Protein sequence

MKLIINIKPF SFQLTRKLIT SQGIIHNKVG LLLQIKDSNG NYGWGEVSPI EKKELEKSIE 
SLDFIGKQTT KDSIENYLFE LPGALAFGLG SCLADLESLT QRKLNLEGFD VAKSAYLLPT 
DIDPLESIRK YVDESNEKKS SCTIKWKVSH LENNFKEEKT LQKILDILPN NFKLRIDPNG 
GWSRQKAQEW SNELKNEPRL EWIEQPLPSK DIEGLFSLAT QIPIALDESL VEFPYLRKTW 
KSWQIRRPAL DGDPRLLLKE IEQEDSQTVI STAFETGIGR RWVNHLAARQ VKGGNPCSPG 
LAPGWCPKGP LFNNNPKLVW EAV